一、前言
ChatGPT、Midjourney等生成式AI,因為貼近民眾日常生活,在跨語言的翻譯、摘要、圖像生成等領域已具有相當成熟的應用,成為當前最受矚目的人工智慧領域。但也正因為生成式AI大幅拉近人們與人工智慧的距離,除了生成式AI創作成果是否受著作權保護之外,開始有更多人在關注生成式AI預訓練的大量資料,若屬於受著作權法保護的著作,通常並未取得授權,事實上,可能也難有逐一取得授權的可能性。據報導目前美國也有許多與生成式AI訓練資料有關的著作權訴訟案件正在進行中。
然而,人工智慧的發展並非這兩年才開始。各種人工智慧的技術都需要各種資料的訓練,幾年前針對AI此類資訊科技發展對於資訊利用的需求,世界各國紛紛在立法給予某些程度的鬆綁。例如歐洲議會與理事會於2019年4月17日頒布之2019/790關於數位單一市場中的著作權和相關權利指令即針對文字與資料探勘(Text and Data Mining)的利用,擴大其例外限制至科學研究(Scientific Research)【註1】;英國於2014年即已於〈Copyright, Designs and Patents Act 1988〉第29A引入於非商業性的研究下文字與資料探勘(Text and Data Mining)的例外規定,現在更研擬要全面開放,不限於非商業目的【註2】;日本於2018年修改著作權法時,增加第30條第4項,規定除會對於著作權人之利益造成不當損害,在非為享受目的而利用的行為,得為技術的開發或是資料的分析等之利用,在必要的範圍內,以任何方式進行使用【註3】。
從以上各國的立法調整觀察,訓練AI之資料確實是棘手之問題,尤其是受著作權保護之資料。如法律未為例外規定,在未取得著作權人授權之前能否利用,只能透過個案是否符合合理使用的規定,由法院來判決,風險仍然相當高。Creative Commons(在臺灣以創用CC名義推廣),長期以開放授權的模式推動「保留部分權利」的著作流通、利用,使著作權人得以該等開放授權標示、條款,簡單、快速地分享其創作。在各種AI訓練皆需海量資料的情形,累積長達20年網路上大量採取創用CC授權的著作,能否合法使用於AI訓練,即成為社會各界亟欲了解之議題。
本文將先提出Creative Commons組織對於創用CC資源用於AI訓練之觀點,再逐一探討創用CC各項授權條件是否能適用於AI訓練,最後再以匯集臺灣文化數位著作的資料庫國家文化記憶庫(以下簡稱為「記憶庫」)為例,討論記憶庫之數位資源應如何應用於與AI的互動。記憶庫中之數位資源多以創用CC的方式公開,若能於AI領域中應用,應是相當良好之資源,值得探究。
二、Creative Commons組織之觀點
Creative Commons組織為美國著名法律學者Lawrence Lessig與其他具有相同理念之人所組成,組織的目標是追求「促進分享」,以「Some Right Reserved」之概念,提出CC授權模組,讓權利人透過簡易的授權,將作品分享給大眾。【註4】
Creative Commons組織在AI領域之觀點,也是以促進分享之概念為出發。Creative Commons組織目前非常積極參與當前各國之立法討論(例如歐盟的AI ACT),一方面肯定立法者,另一方面也監督立法,確保立法不會阻礙科技進步,例如倡議開放資料(open data)以及開源(open source),讓小的組織體也能夠發展AI,而非僅集中在大型商業經營者,Creative Commons組織認為這是能增加透明度、促進創新以及健全市場競爭之方式。【註5】【註6】
針對「能否以CC授權的著作訓練AI」議題的討論,Creative Commons組織採取較為開放的態度,認為CC授權模組在設計之時,已經有考量到因應科技發展的應用,因此只要是符合CC授權條件的利用,即使是投入於AI的訓練中,亦無不可,任何人可以在符合CC授權條件下,將CC授權的著作投入AI的訓練中。【註7】這樣的論點主要源於AI的訓練階段是屬於各該組織內部針對著作的利用,並非對外公開,故無創用CC相關條款所要求對外利用時須進行標示或非商業、改作、相同方式分享等條件限制的問題。此外,Creative Commons也對於將著作權之資料用於AI訓練是否得符合著作權之合理使用進行討論,以多方論點支持AI之發展。【註8】
然而,AI的訓練最終還是要對外利用,倘擬使用創用CC資源進行AI訓練,仍須考量後續對外利用時的風險。本文以下擬以創用CC不同的授權條件,細緻化進一步討論。
創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(1)、(2)、(3)
註1:Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC (Text with EEA relevance.), https://eur-lex.europa.eu/eli/dir/2019/790/oj。
註2:Artificial Intelligence and Intellectual Property: copyright and patents: Government response to consultation, https://www.gov.uk/government/consultations/artificial-intelligence-and-ip-copyright-and-patents/outcome/artificial-intelligence-and-intellectual-property-copyright-and-patents-government-response-to-consultation。
註3:AIと著作権,https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf。
註4:創用CC是什麼?,https://creativecommons.tw/explore。
註5:European Parliament gives green light to AI Act, moving EU towards finalizing the world’s leading regulation of AI,https://creativecommons.org/2023/06/14/european-parliament-gives-green-light-to-ai-act-moving-eu-towards-finalizing-the-worlds-leading-regulation-of-ai/。
註6:Supporting Open Source and Open Science in the EU AI Act,https://creativecommons.org/wp-content/uploads/2023/07/SupportingOpenSourceAndOpenScienceInTheEUAIAct.pdf。
註7:Frequently Asked Questions:What are the limits on how CC-licensed works can be used in the development of new technologies, such as training of artificial intelligence software?,https://creativecommons.org/faq/#what-are-the-limits-on-how-cc-licensed-works-can-be-used-in-the-development-of-new-technologies-such-as-training-of-artificial-intelligence-software。
註8:Fair Use: Training Generative AI,https://creativecommons.org/2023/02/17/fair-use-training-generative-ai/。