1.如果是指原始碼抄襲,則DeepSeek是開源,但Open AI是閉源,法學基本原則:舉證之所在敗訴之所在,Open AI必須指出DeepSeek哪段原始碼抄襲,並提出證據。
目前並未看到有任何這方面的指控和可信證據。
然而我們卻可以看到某些無知殖人已經在起鬨:DeepSeek技術是抄來的這種極為愚蠢的論調。說穿了,這些人除了少數可以靠此尋租政治利益外,更多的只是藉由反中貶中來滿足自己種族歧視的偏見和慾望,可悲的是這些人多數是歧視自己的出身。
2.如果是指「蒸餾」 — 藉由Open AI生成的數據餵給DeepSeek訓練開發,則主要法律議題會是:
a. 著作權方面
使用Open AI生成數據開發有無侵害著作權?我認為答案沒有。
因為美國著作權法要求著作權成立的前提,必須創作者是「人」。
機器的創作不存在著作權。
這點在Thaler v. Perlmutter(2023)一案中,哥倫比亞聯邦地方法院就完全由AI系統產出且無任何人類參與的作品,是否得受著作權保護之問題,延伸解讀美國著作權法有關適格標的之規定(17 U.S.C. § 102(a)),認為純粹機器作品不符合著作權法成立之前提,本身不受著作權法保護。
簡言之:AI產出的數據不是著作權法保護標的。
既然一開始就沒有權利,自然不存在「權利侵害」的可能。
另一方面,倒是過去兩三年都有OpenAI竊取私人訊息訓練模型的控訴出現,這部份倒是OpenAI更有可能成立侵害著作權行為,因為該公司從網路拿的,多數還是「人類的創作」。
b. 使用條款方面
因此,Open AI其實可以主張的只有「DeepSeek可能違反其使用條款」的違約行為。
但即便存在這樣的違約行為,Open AI最多能做的也只是不再對DeepSeek運營公司提供服務。可是如果有其他企業、團體或個人用了DeepSeek的原始碼,自己也跑一個模型並蒸餾Open AI的服務,那Open AI也只能針對這些企業團體或個人一一採取法律行為。
同樣的,OpenAI自己過去竊取大量個人資料被控訴,本身也是違反各種網路服務條款的行為。
最後或許還可以提的,反而是Open AI的主張是否違反了反壟斷法?我反而認為極有可能。
因為LLM行業幾乎所有模型都存在使用蒸餾的行為,就連OpenAI的模型自己都有,如果OpenAI自己可以拿別家模型的資料,卻不允許別人拿他的,是否構成壟斷行為中的惡性競爭?恐怕存在高度可能。
但反壟斷案件越是大頭、熱門題目,在美國越是存在政治目的和干預(或者可以說根本就是政治鬥爭之一環),因為短時間內,若OpenAI還受政客寵愛,反而不太會被起訴其惡性壟斷行為。

