国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

詹韞如:反不正當(dāng)競(jìng)爭(zhēng)法下知識(shí)蒸餾違法性的認(rèn)定 | 知識(shí)產(chǎn)權(quán)202511

0
分享至

【作者】詹韞如(上海交通大學(xué)凱原法學(xué)院博士研究生)

【來源】北大法寶法學(xué)期刊庫(kù)《知識(shí)產(chǎn)權(quán)》2025年第11期(文末附本期期刊目錄)。因篇幅較長(zhǎng),已略去原文注釋。


內(nèi)容提要:隨著知識(shí)蒸餾技術(shù)在人工智能領(lǐng)域的廣泛應(yīng)用,關(guān)于知識(shí)蒸餾合法性的探討日益增多。知識(shí)蒸餾即通過訓(xùn)練更輕量的學(xué)生模型以充分接近參數(shù)規(guī)模較大的、高性能的教師模型。“知識(shí)”雖包含部分表達(dá)屬性,但其并非具備表現(xiàn)形式的人類智力成果,系著作權(quán)法未覆蓋的商業(yè)成果,故反不正當(dāng)競(jìng)爭(zhēng)法得以有限介入。對(duì)于知識(shí)蒸餾涉嫌侵犯具備類似絕對(duì)權(quán)利的商業(yè)秘密的情形,可通過修正的“權(quán)益—損害”范式予以規(guī)制。以不正當(dāng)手段對(duì)已采取合理保密措施的模型進(jìn)行蒸餾涉嫌侵犯商業(yè)秘密,但當(dāng)行為人對(duì)“知識(shí)”的載體具備合法處分權(quán),且蒸餾屬于替代成本較低的反向工程時(shí)將阻卻違法性。對(duì)于存在搭便車嫌疑的知識(shí)蒸餾行為,依行為中心主義分析思路可知,其雖屬搭便車行為,但未扭曲優(yōu)勝劣汰的市場(chǎng)競(jìng)爭(zhēng)機(jī)制,無法證成行為違法性?;诖?,辨明知識(shí)蒸餾的不正當(dāng)競(jìng)爭(zhēng)違法性認(rèn)定邊界,以促進(jìn)實(shí)現(xiàn)技術(shù)創(chuàng)新進(jìn)步與市場(chǎng)公平競(jìng)爭(zhēng)的雙贏。

關(guān)鍵詞:知識(shí)蒸餾;商業(yè)秘密保護(hù);反向工程;搭便車;反不正當(dāng)競(jìng)爭(zhēng)法

目次 一、問題的提出 二、知識(shí)蒸餾的反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制前提 三、知識(shí)蒸餾侵犯商業(yè)秘密的違法性認(rèn)定 四、知識(shí)蒸餾構(gòu)成搭便車的違法性認(rèn)定 結(jié)語

問題的提出

2025年1月20日,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡(jiǎn)稱DeepSeek)發(fā)布開源模型DeepSeek-R1,憑借低訓(xùn)練成本、高性能的優(yōu)勢(shì)在全球范圍內(nèi)掀起了一場(chǎng)人工智能風(fēng)暴,而這一顛覆性表現(xiàn)的核心驅(qū)動(dòng)力是其對(duì)“知識(shí)蒸餾”(knowledge distillation)技術(shù)的應(yīng)用。1月29日,OpenAI公司通過《金融時(shí)報(bào)》等媒體指控DeepSeek未經(jīng)許可采取蒸餾技術(shù)從OpenAI的專有模型中提取“知識(shí)”進(jìn)行模型訓(xùn)練,違反了OpenAI服務(wù)協(xié)議中關(guān)于“禁止復(fù)制其任何服務(wù)”和“利用其模型輸出開發(fā)競(jìng)爭(zhēng)模型”的規(guī)定,并涉嫌知識(shí)產(chǎn)權(quán)侵權(quán)。OpenAI目前雖然沒有啟動(dòng)進(jìn)一步的法律訴訟程序,但表示未來會(huì)采取更加積極主動(dòng)的策略保護(hù)其技術(shù)。2025年8月,Mistral公司的Mistral-small-3.2模型被質(zhì)疑直接蒸餾自DeepSeek-v3模型,且未披露模型蒸餾的事實(shí)、刻意歪曲基準(zhǔn)測(cè)試結(jié)果。截至目前,Mistral公司還未對(duì)蒸餾一事作出回應(yīng)。

上述事件引發(fā)了國(guó)內(nèi)外學(xué)者對(duì)于知識(shí)蒸餾技術(shù)在著作權(quán)法和反不正當(dāng)競(jìng)爭(zhēng)法層面的合法性探討。在著作權(quán)法層面,持肯定論的學(xué)者從著作權(quán)法保護(hù)客體的范疇、“三步檢驗(yàn)法”和“轉(zhuǎn)換性使用”等角度論證了蒸餾技術(shù)的法律正當(dāng)性,持否定論的學(xué)者則認(rèn)為基于數(shù)據(jù)核心集的蒸餾行為侵害了單個(gè)數(shù)據(jù)所有者的著作權(quán)。在反不正當(dāng)競(jìng)爭(zhēng)法層面,有學(xué)者認(rèn)為知識(shí)蒸餾技術(shù)降低了模型的再訓(xùn)練成本,涉嫌“搭便車”(free-riding)行為,面臨構(gòu)成不正當(dāng)競(jìng)爭(zhēng)的風(fēng)險(xiǎn)。也有學(xué)者提出若知識(shí)蒸餾未侵犯知識(shí)產(chǎn)權(quán)、未導(dǎo)致消費(fèi)者混淆且未實(shí)質(zhì)性替代教師模型(teacher model),該行為則不應(yīng)被反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制。

學(xué)者對(duì)知識(shí)蒸餾技術(shù)合法性的探討,促使對(duì)爭(zhēng)議根源進(jìn)行檢視。首先,學(xué)者對(duì)知識(shí)蒸餾的技術(shù)邏輯存在認(rèn)知模糊,導(dǎo)致部分風(fēng)險(xiǎn)推斷結(jié)論出現(xiàn)偏差。例如,對(duì)于蒸餾的對(duì)象是模型參數(shù)還是“知識(shí)”、蒸餾是否必然利用教師模型、蒸餾是否需要訪問原始數(shù)據(jù)等問題,均存在不同認(rèn)識(shí)。其次,研究中存在將著作權(quán)法和反不正當(dāng)競(jìng)爭(zhēng)法割裂分析的傾向,導(dǎo)致對(duì)知識(shí)蒸餾合法性的探討呈碎片化、孤立化特征。這些爭(zhēng)議實(shí)則并非全然相互獨(dú)立——知識(shí)產(chǎn)權(quán)專門法和反不正當(dāng)競(jìng)爭(zhēng)法在維護(hù)競(jìng)爭(zhēng)秩序目標(biāo)上的互動(dòng)關(guān)系,影響對(duì)知識(shí)蒸餾合法性的認(rèn)定。針對(duì)既有研究存在的問題,本研究將充分拆解知識(shí)蒸餾的底層技術(shù)邏輯,在此基礎(chǔ)上審視技術(shù)的法律風(fēng)險(xiǎn)。從商品與銷售方式二分思路出發(fā),知識(shí)蒸餾既涉嫌侵犯商業(yè)秘密行為,也存在是否構(gòu)成阻礙教師模型提供服務(wù)的“搭便車”行為的爭(zhēng)議,可分別采取修正的“權(quán)益—損害”范式和行為中心主義分析框架,對(duì)知識(shí)蒸餾的違法性邊界予以認(rèn)定。

知識(shí)蒸餾的反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制前提

規(guī)制的選擇需要以對(duì)技術(shù)和法律關(guān)系的充分認(rèn)識(shí)為基礎(chǔ)。在對(duì)知識(shí)蒸餾的法律規(guī)制進(jìn)行探討前,須澄清知識(shí)蒸餾的技術(shù)邏輯和規(guī)制思路等基礎(chǔ)問題,知識(shí)蒸餾技術(shù)的合法性爭(zhēng)議均與對(duì)上述問題的認(rèn)識(shí)相關(guān)。

(一)知識(shí)蒸餾的技術(shù)邏輯

知識(shí)蒸餾作為一種新型模型壓縮與知識(shí)遷移技術(shù),與權(quán)重剪枝、量化、低秩分解等傳統(tǒng)壓縮技術(shù)相比,具有顯著降低計(jì)算負(fù)載且維持模型性能的優(yōu)勢(shì)。蒸餾的核心邏輯既包含對(duì)不同類型“知識(shí)”的處理和傳遞,也涉及多元的蒸餾方式。基于此,從技術(shù)本質(zhì)、“知識(shí)”分類、蒸餾方式三個(gè)層次解析知識(shí)蒸餾的技術(shù)邏輯,有助于在充分理解知識(shí)蒸餾技術(shù)的基礎(chǔ)上展開進(jìn)一步的法律分析。

1. 知識(shí)蒸餾的本質(zhì)

從卷積網(wǎng)絡(luò)到深層寬層網(wǎng)絡(luò)和大型預(yù)訓(xùn)練模型,高性能模型的發(fā)展面臨著如何在有限計(jì)算資源和儲(chǔ)存空間里解決龐大參數(shù)量和計(jì)算需求的問題,因此模型的復(fù)雜設(shè)計(jì)與輕量化模型部署之間的矛盾不斷深化。2006年,為緩解該問題,克里斯蒂安·布奇盧阿(Cristian Buciluǎ)等提出了模型壓縮技術(shù),即利用復(fù)雜模型大規(guī)模標(biāo)注偽數(shù)據(jù)(pseudo data),并在此數(shù)據(jù)集的基礎(chǔ)上訓(xùn)練輕量級(jí)替代模型,使小模型的輸出函數(shù)接近復(fù)雜模型的映射關(guān)系。2015年,杰弗里·辛頓(Geoffrey Hinton)等持續(xù)拓展模型壓縮和遷移方法,正式提出“知識(shí)蒸餾”概念。其邏輯在于,開發(fā)者向教師模型輸入數(shù)據(jù)樣本后,該模型的隱藏層生成概率分布形成軟標(biāo)簽(soft targets),并將該輸入樣本給學(xué)生模型(student model)生成軟性預(yù)測(cè)值(soft prediction),將教師模型的軟標(biāo)簽作為假定的真實(shí)值設(shè)置損失函數(shù),通過調(diào)整溫度參數(shù)、損失權(quán)重等超參數(shù)優(yōu)化學(xué)生模型,直至其預(yù)測(cè)分布與軟標(biāo)簽的差異收斂至預(yù)設(shè)閾值。概言之,知識(shí)蒸餾的本質(zhì)即通過訓(xùn)練更小、更輕量的學(xué)生模型以充分接近參數(shù)規(guī)模較大的、高性能的教師模型。

2. “知識(shí)”的分類

通過知識(shí)蒸餾技術(shù),學(xué)生模型學(xué)習(xí)的內(nèi)容是“知識(shí)”而非模型參數(shù),這意味著知識(shí)蒸餾并不會(huì)將教師模型的參數(shù)直接復(fù)制至學(xué)生模型中,而是利用教師模型在推理過程中產(chǎn)生的輸出特征、中間特征或關(guān)系來引導(dǎo)學(xué)生模型學(xué)習(xí)?!爸R(shí)”本質(zhì)上是一種函數(shù)映射關(guān)系,主要包括三種類型。第一,基于輸出特征的“知識(shí)”,即利用教師模型最后一層神經(jīng)元的輸出指導(dǎo)學(xué)生模型訓(xùn)練,經(jīng)過softmax層激活的“知識(shí)”是概率分布輸出,未經(jīng)過softmax層激活的“知識(shí)”為L(zhǎng)ogits輸出。其關(guān)注的是類別層面的預(yù)測(cè)概率分布,結(jié)構(gòu)簡(jiǎn)單,便于學(xué)生模型學(xué)習(xí),最經(jīng)典的方法便是杰弗里·辛頓在2015年提出的軟標(biāo)簽式蒸餾。第二,基于中間特征的“知識(shí)”,即利用神經(jīng)網(wǎng)絡(luò)中間層特征圖中的“知識(shí)”指導(dǎo)學(xué)生模型訓(xùn)練。該類型更為豐富,關(guān)注到模型內(nèi)部的表征能力,而不僅僅是最終預(yù)測(cè)結(jié)果,但可能存在維度和語義不匹配的問題。第三,基于關(guān)系的“知識(shí)”,其關(guān)注樣本之間或者特征之間的關(guān)聯(lián)關(guān)系,而不是單個(gè)輸出或單個(gè)特征值。這些關(guān)系內(nèi)容有助于學(xué)生模型在模仿教師模型輸出的同時(shí),理解其內(nèi)部的推理邏輯,但同時(shí)伴隨著實(shí)現(xiàn)復(fù)雜、計(jì)算量大的問題。簡(jiǎn)言之,學(xué)生模型旨在學(xué)習(xí)的并非教師模型的輸出結(jié)論,而是其生成結(jié)論所依據(jù)的“推理過程”和“思維范式”。

3. 知識(shí)蒸餾的學(xué)習(xí)方式

知識(shí)蒸餾的學(xué)習(xí)方式通??梢苑譃殡x線蒸餾(offline distillation)、在線蒸餾(online distillation)、自蒸餾(self-distillation)、無數(shù)據(jù)蒸餾(data-free distillation)、多教師蒸餾(multi-teacher distillation)和助理蒸餾(assistant distillation)。離線蒸餾是在完成對(duì)教師模型預(yù)訓(xùn)練的基礎(chǔ)上,從該模型中提取“知識(shí)”以指導(dǎo)學(xué)生模型的訓(xùn)練,近年來發(fā)展出標(biāo)準(zhǔn)蒸餾和跨任務(wù)跨模態(tài)蒸餾等方式。該訓(xùn)練流程較為簡(jiǎn)單,師生模型可分別進(jìn)行離線訓(xùn)練。在線蒸餾能夠同時(shí)訓(xùn)練師生模型,訓(xùn)練過程動(dòng)態(tài)更新,從而提升模型適配性。自蒸餾通過模型內(nèi)部不同層之間的互相蒸餾(layer-to-layer distillation),實(shí)現(xiàn)模型性能的自我提升,并降低計(jì)算和存儲(chǔ)負(fù)擔(dān),但其蒸餾效果取決于模型本身的潛力。無數(shù)據(jù)蒸餾可以在不訪問原始數(shù)據(jù)的情況下,通過生成數(shù)據(jù)或其他輔助數(shù)據(jù)進(jìn)行蒸餾,常適用于數(shù)據(jù)隱私敏感場(chǎng)景。多教師蒸餾即學(xué)生模型可以從多個(gè)教師模型中學(xué)習(xí)“知識(shí)”,提升適配和泛化能力。助理蒸餾指的是在教師與學(xué)生模型之間引入一個(gè)或多個(gè)助理模型(assistant model),由該模型逐步將“知識(shí)”從教師模型傳遞至學(xué)生模型,類似于“多級(jí)壓縮”。

由此可見,一方面,并非所有的知識(shí)蒸餾都涉及對(duì)教師模型的利用。例如,自蒸餾并不借助外部教師模型,而是通過模型自身不同層次之間的內(nèi)部遷移實(shí)現(xiàn)知識(shí)傳遞。另一方面,并非所有的知識(shí)蒸餾均須依賴原始訓(xùn)練數(shù)據(jù)。無數(shù)據(jù)蒸餾通過生成或合成數(shù)據(jù)的方式,降低了對(duì)原始數(shù)據(jù)的依賴。關(guān)于知識(shí)蒸餾的違法性爭(zhēng)議多現(xiàn)于離線蒸餾、在線蒸餾、多教師蒸餾和助理蒸餾的方式。

(二)“知識(shí)”是著作權(quán)法未覆蓋的商業(yè)成果

在探討知識(shí)蒸餾在著作權(quán)法上的合法性問題之前,應(yīng)先判斷“知識(shí)”是否落入著作權(quán)法的覆蓋范疇和保護(hù)范圍,進(jìn)而考量其是否達(dá)到保護(hù)條件。根據(jù)我國(guó)《著作權(quán)法》第3條的規(guī)定,著作權(quán)法所稱的作品是文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨(dú)創(chuàng)性并能以一定形式表現(xiàn)的智力成果。然而,“知識(shí)”中雖然包含部分表達(dá)的屬性,但其并非具備表現(xiàn)形式的人類智力成果,“知識(shí)”是著作權(quán)法未覆蓋的商業(yè)成果。

1. “知識(shí)”中思想和表達(dá)共存

著作權(quán)法的保護(hù)范圍為表達(dá)而非思想,這是現(xiàn)代著作權(quán)法的核心原則。雖然學(xué)者將想法、涵義、抽象內(nèi)容等明確劃入思想的范疇,但思想和表達(dá)本身難以被抽象概括和區(qū)分。目前,著作權(quán)法理論和實(shí)踐中常用“抽象—過濾—對(duì)比法”界分思想與表達(dá),即承認(rèn)思想和表達(dá)在作品的不同抽象層次中處于混合狀態(tài),進(jìn)而根據(jù)抽象程度的不同,逐級(jí)排除各種涵義的思想。抽象過濾步驟需要回溯知識(shí)蒸餾的整體過程,思想與表達(dá)共同存在于“知識(shí)”中不同抽象程度的層次中。

首先,作為抽象過程之終點(diǎn)的數(shù)值輸出(包括概率分布、特征表示等)可以被直接排除,這是與表達(dá)完全無涉的事物,屬于思想的范疇。利用思想而非表達(dá)的技術(shù)性使用在司法實(shí)踐中已有較為豐富的體現(xiàn)。1992年,法院在“世嘉訴雅可萊德案”(Sega v. Accolade)中首次提出非表達(dá)性使用(non-expressive use)。在該案中,被告雅可萊德公司通過反向工程手段將世嘉公司的程序代碼復(fù)制到計(jì)算機(jī)內(nèi)存里進(jìn)行反編譯,從而使其游戲能夠兼容世嘉公司的主機(jī)。法院認(rèn)為,雅可萊德實(shí)施反編譯的目的并非照搬世嘉的表達(dá)性創(chuàng)作,而是為進(jìn)行非表達(dá)性使用。非表達(dá)性使用未破壞作品的原始價(jià)值,也未以再現(xiàn)訓(xùn)練作品的獨(dú)創(chuàng)性表達(dá)為目的,因此不具備侵權(quán)可能性。學(xué)生模型對(duì)教師模型的概率分布、特征表示的蒸餾僅利用了教師模型的思想而未利用其表達(dá),同樣是一種非表達(dá)性使用,其蒸餾過程不會(huì)再現(xiàn)或復(fù)制教師模型的原創(chuàng)性表達(dá),而是傳遞模型的決策模式,以便在更輕量的模型中保留性能,因而這部分“知識(shí)”屬于思想的范疇。

其次,激活函數(shù)(如softmax輸出)將教師模型輸出向量轉(zhuǎn)換為概率分布,該生成過程依賴于教師模型的具體參數(shù)排列和輸入數(shù)據(jù),是一種具體的計(jì)算表達(dá)。換言之,給定教師模型參數(shù)與輸入樣本,softmax的輸出結(jié)果具有確定性和可再現(xiàn)性,那么學(xué)生模型在學(xué)習(xí)后可能會(huì)輸出與教師模型相似的表達(dá)結(jié)果。這部分“知識(shí)”屬于足夠具體的結(jié)構(gòu)層級(jí)而應(yīng)納入表達(dá)的范圍。

2. “知識(shí)”不是具備表現(xiàn)形式的人類智力成果

即便認(rèn)可“知識(shí)”中包含有表達(dá)的屬性,其也不屬于著作權(quán)法意義上“作品”的范疇。首先,知識(shí)蒸餾中的“知識(shí)”不是人類智力成果。創(chuàng)作作品的自然人是作者,毋庸置疑系該作品的著作權(quán)人。但是,大模型輸出內(nèi)容是否是人類智力成果頗具爭(zhēng)議。部分學(xué)者主張人工智能生成內(nèi)容是人類智力活動(dòng)的產(chǎn)物,其在外在表現(xiàn)形式上能夠達(dá)到獨(dú)創(chuàng)性要求,應(yīng)給予著作權(quán)法層面的保護(hù),以促進(jìn)人工智能產(chǎn)業(yè)發(fā)展。但有更多學(xué)者認(rèn)為人工智能生成內(nèi)容并非由人類以人工智能為工具創(chuàng)作的作品,雖然其輸出內(nèi)容在很大程度上依賴于使用者的輸入指令,但人工智能研發(fā)者和使用者都無法直接決定人工智能生成的具體內(nèi)容,輸出內(nèi)容難以具備獨(dú)創(chuàng)性,故其無法受到我國(guó)著作權(quán)法的保護(hù)。從比較法視野來看,美國(guó)版權(quán)局于2025年1月29日發(fā)布《版權(quán)與人工智能 第二部分:可版權(quán)性》報(bào)告,強(qiáng)調(diào)版權(quán)保護(hù)必須建立在人類創(chuàng)作的基礎(chǔ)上,意即只有人類創(chuàng)作的作品才能獲得版權(quán)法的保護(hù),而純粹由人工智能生成的內(nèi)容無法受到法律保護(hù)。在我國(guó)“菲林案”中,法院認(rèn)為自然人創(chuàng)作應(yīng)是著作權(quán)法上作品成立的必要條件之一,即便人工智能生成作品在內(nèi)容、形態(tài)等方面都無限接近于自然人創(chuàng)作的作品,亦不能構(gòu)成著作權(quán)法意義上的作品。知識(shí)蒸餾通過教師模型的輸出來訓(xùn)練學(xué)生模型,人類的智力活動(dòng)體現(xiàn)于設(shè)計(jì)蒸餾程序、設(shè)定超參數(shù)等技術(shù)性操作中,而蒸餾所提取的“知識(shí)”并非由人類直接創(chuàng)作產(chǎn)生,而是模型生成的結(jié)果。因此,知識(shí)蒸餾中的“知識(shí)”并非人類的智力成果。

其次,“知識(shí)”不具備著作權(quán)法意義上的表現(xiàn)形式。著作權(quán)法意義上的表現(xiàn)形式通常為文字、圖像、音樂等可被感知的形態(tài),從這一點(diǎn)出發(fā),如果人工智能生成內(nèi)容是能夠被人類客觀理解的外在表達(dá),即在表達(dá)方式、敘事框架、表述結(jié)構(gòu)等形式上高度類似人類創(chuàng)作的文本、圖像或音視頻,則構(gòu)成具備表現(xiàn)形式的智力成果。在“AI文生圖第一案”中,北京互聯(lián)網(wǎng)法院將人工智能生成圖片認(rèn)定為作品的前提條件之一即該圖片是由線條、色彩構(gòu)成的具有審美意義的視覺呈現(xiàn)。但是,知識(shí)蒸餾中的“知識(shí)”常表現(xiàn)為概率分布、軟標(biāo)簽、特征圖等,并非一般意義上可以被人類理解的表達(dá)方式,因此“知識(shí)”不具備著作權(quán)法意義上的表現(xiàn)形式。

(三)知識(shí)蒸餾的反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制思路

知識(shí)蒸餾在著作權(quán)法上的規(guī)制困境,促使學(xué)者將規(guī)制視角轉(zhuǎn)向反不正當(dāng)競(jìng)爭(zhēng)法。知識(shí)產(chǎn)權(quán)專門法與反不正當(dāng)競(jìng)爭(zhēng)法之間發(fā)展出了“冰山”與“海水”、兜底保護(hù)與有限的補(bǔ)充保護(hù)三種主流關(guān)系。“冰山”與“海水”的關(guān)系曾廣為流傳,即知識(shí)產(chǎn)權(quán)專門法被視為海面上的“冰山”,反不正當(dāng)競(jìng)爭(zhēng)法則被視為“冰山”下的“海水”以彌補(bǔ)專門法之“漏”。由“冰山”與“海水”關(guān)系延伸出了“兜底保護(hù)說”,其認(rèn)為反不正當(dāng)競(jìng)爭(zhēng)法是知識(shí)產(chǎn)權(quán)專門法的兜底法,當(dāng)出現(xiàn)知識(shí)產(chǎn)權(quán)單行法無法保護(hù)的客體時(shí),由反不正當(dāng)競(jìng)爭(zhēng)法提供兜底保護(hù)。該說在司法實(shí)踐中影響深遠(yuǎn),然而其不適當(dāng)?shù)財(cái)U(kuò)張了知識(shí)產(chǎn)權(quán)的保護(hù)范圍。

為避免對(duì)知識(shí)產(chǎn)權(quán)保護(hù)的泛化,司法政策逐漸轉(zhuǎn)向強(qiáng)調(diào)“有限補(bǔ)充保護(hù)說”,即反不正當(dāng)競(jìng)爭(zhēng)法對(duì)知識(shí)產(chǎn)權(quán)專門法僅發(fā)揮有限的補(bǔ)充作用,而非承擔(dān)寬泛的兜底功能。目前,“有限補(bǔ)充保護(hù)說”在理論和實(shí)務(wù)界占據(jù)較為主流的地位,原因在于該說認(rèn)可知識(shí)產(chǎn)權(quán)法維系權(quán)利保護(hù)和自由競(jìng)爭(zhēng)功能的獨(dú)立性,在不抵觸知識(shí)產(chǎn)權(quán)專門立法的同時(shí),避免過度侵占公有領(lǐng)域,使知識(shí)產(chǎn)權(quán)權(quán)利保護(hù)和激勵(lì)增量創(chuàng)新之間實(shí)現(xiàn)盡可能的平衡。在“有限補(bǔ)充保護(hù)說”下,反不正當(dāng)競(jìng)爭(zhēng)法保護(hù)知識(shí)產(chǎn)權(quán)的邊界為:對(duì)于落入知識(shí)產(chǎn)權(quán)專門法保護(hù)范圍且符合保護(hù)條件的對(duì)象,反不正當(dāng)競(jìng)爭(zhēng)法不再予以考慮;對(duì)于落入專門法保護(hù)范圍而不符合保護(hù)條件的,也不再以反不正當(dāng)競(jìng)爭(zhēng)法進(jìn)行補(bǔ)充保護(hù);而對(duì)于專門法未覆蓋的商業(yè)成果,則可以借助反不正當(dāng)競(jìng)爭(zhēng)法進(jìn)行保護(hù),但需要側(cè)重考察行為是否落入反不正當(dāng)競(jìng)爭(zhēng)法的規(guī)制范圍且符合其規(guī)制邏輯。近年來,在科技發(fā)展催生的新型法益領(lǐng)域,常通過全新的利益衡量,以反不正當(dāng)競(jìng)爭(zhēng)法實(shí)施過渡性保護(hù)。

根據(jù)前述,由于知識(shí)蒸餾的“知識(shí)”是著作權(quán)法未覆蓋的商業(yè)成果,這為反不正當(dāng)競(jìng)爭(zhēng)法的有限介入提供了契機(jī)。然而,目前對(duì)不正當(dāng)競(jìng)爭(zhēng)行為的認(rèn)定缺乏能夠彌合抽象與具體的共識(shí)性框架。我國(guó)反不正當(dāng)競(jìng)爭(zhēng)法采取“具體列舉+一般條款”的立法結(jié)構(gòu),立法本意在于通過列舉類型和彈性兜底的結(jié)合,在降低法條適用成本的同時(shí)也能應(yīng)對(duì)復(fù)雜多變的市場(chǎng)環(huán)境,從而構(gòu)建起對(duì)反不正當(dāng)競(jìng)爭(zhēng)行為的全面規(guī)制。但是,由于各具體條款的分析要件不通約、缺乏價(jià)值指引,一般條款的適用也未形成共性的分析框架,導(dǎo)致法官在司法實(shí)踐中要么機(jī)械套用具體條款的構(gòu)成要件、要么寬泛適用一般條款。以此為背景,學(xué)者致力于構(gòu)建反不正當(dāng)競(jìng)爭(zhēng)法的一般性分析框架。

反不正當(dāng)競(jìng)爭(zhēng)法的分析路徑從對(duì)“權(quán)益—損害”范式的廣泛批判,到近年來涌現(xiàn)出行為中心主義范式、修正的構(gòu)成要件范式、綜合評(píng)估模式等多種分析框架,但并未達(dá)成共識(shí)性結(jié)論。商品與銷售方式二分視角為反不正當(dāng)競(jìng)爭(zhēng)法的一般性分析提供了新的思路,司法實(shí)踐中廣泛適用的“法益說”能夠較好地解釋技術(shù)成果的商業(yè)秘密保護(hù)、未注冊(cè)知名商標(biāo)的反混淆保護(hù)等趨近絕對(duì)權(quán)保護(hù)的行為,故采取原則保護(hù)、公益例外不保護(hù)的態(tài)度;而對(duì)于特定的虛假宣傳、商業(yè)賄賂等銷售型行為,遵循原則允許、公益例外禁止的態(tài)度。

因此,從商品與銷售方式二分視角審視知識(shí)蒸餾行為,可以發(fā)現(xiàn)其既涉嫌侵犯類似絕對(duì)權(quán)利的商業(yè)秘密,也深陷蒸餾是否阻礙教師模型提供服務(wù)的搭便車行為爭(zhēng)議。前者是反不正當(dāng)競(jìng)爭(zhēng)法補(bǔ)充保護(hù)的趨近絕對(duì)權(quán)利的傳統(tǒng)型知識(shí)產(chǎn)權(quán)法益,強(qiáng)調(diào)對(duì)商品或服務(wù)本身價(jià)值的保護(hù)。對(duì)于這類法益,可以采取修正式的“權(quán)益—損害”范式提供較高標(biāo)準(zhǔn)的保護(hù)。后者不必然造成教師模型的產(chǎn)品價(jià)值無法實(shí)現(xiàn),須以行為中心主義思路對(duì)特定搭便車行為的違法性作進(jìn)一步認(rèn)定。

知識(shí)蒸餾侵犯商業(yè)秘密的違法性認(rèn)定

在厘清知識(shí)蒸餾的反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制前提和思路后,可進(jìn)入對(duì)知識(shí)蒸餾違法性認(rèn)定邊界的討論。目前對(duì)該問題的探討聚焦于其是否構(gòu)成侵犯商業(yè)秘密的不正當(dāng)競(jìng)爭(zhēng)行為。以不正當(dāng)手段侵犯商業(yè)秘密屬于反不正當(dāng)競(jìng)爭(zhēng)法規(guī)制的法定形態(tài),對(duì)于符合行為要件的基本可以認(rèn)定為不正當(dāng)行為。延續(xù)傳統(tǒng)“權(quán)益—損害”范式的可取之處在于其蘊(yùn)含著諸多司法經(jīng)驗(yàn),但該范式往往忽視對(duì)違法阻卻事由的考慮。因此,在知識(shí)蒸餾中,首先須分析“知識(shí)”作為商業(yè)秘密的邊界,以及學(xué)生模型在蒸餾過程中是否以不正當(dāng)手段獲取或使用了教師模型中的商業(yè)秘密;其次,探討是否存在形式上符合侵犯商業(yè)秘密行為構(gòu)成但實(shí)質(zhì)上未造成競(jìng)爭(zhēng)扭曲的違法阻卻機(jī)制,這是修正“權(quán)益—損害”范式和傳統(tǒng)范式的主要差異所在。

(一)“知識(shí)”作為商業(yè)秘密的邊界

知識(shí)蒸餾中,“知識(shí)”如果滿足商業(yè)秘密的構(gòu)成要件,即不為公眾所知、具有商業(yè)價(jià)值、采取相應(yīng)保密措施、屬于技術(shù)信息或經(jīng)營(yíng)信息等商業(yè)信息,那么“知識(shí)”屬于商業(yè)秘密。

1. “知識(shí)”的商業(yè)價(jià)值性

反不正當(dāng)競(jìng)爭(zhēng)法中的“商業(yè)價(jià)值”不僅包含具有明確市場(chǎng)交換價(jià)格的經(jīng)濟(jì)利益,還涵蓋能帶來競(jìng)爭(zhēng)優(yōu)勢(shì)、效率提升或市場(chǎng)機(jī)會(huì)的潛在價(jià)值。在知識(shí)蒸餾中,“知識(shí)”毋庸置疑具備商業(yè)價(jià)值。在“B612特效模型案”中,法院比對(duì)了原被告模型在結(jié)構(gòu)、卷積層數(shù)據(jù)、分辨率、激活函數(shù)等方面的差異,認(rèn)為模型的結(jié)構(gòu)和參數(shù)是經(jīng)大量人力、物力、財(cái)力投入所形成的成果,應(yīng)屬于反不正當(dāng)競(jìng)爭(zhēng)法所保護(hù)的競(jìng)爭(zhēng)利益。學(xué)生模型從教師模型蒸餾出的“知識(shí)”雖然不是直觀的模型參數(shù),而是人類不易理解的概率分布、向量和相似度矩陣等內(nèi)容,但能夠讓學(xué)生模型“站在教師模型的肩膀上”,極大地節(jié)約模型研發(fā)成本。同時(shí),更輕量化且高性能的學(xué)生模型可以在更多終端實(shí)現(xiàn)高效部署,拓展更多商業(yè)場(chǎng)景,為蒸餾后的模型帶來競(jìng)爭(zhēng)優(yōu)勢(shì)。

2. “知識(shí)”的秘密性

從教師模型蒸餾出的“知識(shí)”具備秘密性。秘密性所指的“信息不為公眾所知悉”,強(qiáng)調(diào)信息不為所屬領(lǐng)域的相關(guān)人員普遍知悉且難以以低成本手段獲取。換言之,秘密性要求信息不能從公開渠道直接獲取,并且所屬領(lǐng)域的相關(guān)人員要付出較高成本才能取得。一方面,蒸餾的“知識(shí)”具有非公開性。模型分為開源模型(open-source model)和閉源模型(closed-source model)兩類,開源模型即全部或部分公開模型權(quán)重、代碼、訓(xùn)練方法等內(nèi)容,常見協(xié)議如MIT、Apache 2.0、GPL等,其規(guī)定了用戶使用、修改和再分發(fā)模型的條件。閉源模型不公開前述信息,通常以API接口或商業(yè)許可的方式提供服務(wù),這意味著用戶需要通過訂閱或購(gòu)買API調(diào)用次數(shù)來使用閉源模型。然而,不論是開源還是閉源模型,知識(shí)蒸餾的方法和邏輯以及學(xué)生模型蒸餾出的概率分布、特征圖和關(guān)系結(jié)構(gòu),均為模型內(nèi)部加工的結(jié)果,不會(huì)自然進(jìn)入公共領(lǐng)域。另一方面,知識(shí)蒸餾的實(shí)現(xiàn)依賴復(fù)雜的程序設(shè)計(jì)、參數(shù)設(shè)定、高成本的算力資源與資金,即便是所屬領(lǐng)域的相關(guān)人員,也難以通過低成本手段獲取“知識(shí)”。因此,從教師模型蒸餾出的“知識(shí)”具備秘密性。

3. “知識(shí)”的保密性

商業(yè)秘密相關(guān)法律制度的規(guī)范目的在于為商業(yè)秘密提供專有保護(hù)的同時(shí),保護(hù)信息的流動(dòng)利益,鼓勵(lì)以合理的替代渠道謹(jǐn)慎分享商業(yè)秘密的行為。合理的保密措施應(yīng)與預(yù)期成本平衡,而非要求信息持有人采取超出合理限度的方式維持信息秘密性。因此,一般認(rèn)為保密措施無需實(shí)施至“萬無一失”的程度。盡管理論層面對(duì)該規(guī)范目的已達(dá)成基本共識(shí),但實(shí)踐中對(duì)合理保密措施的認(rèn)定仍有顯著分歧。法院通常從主客觀兩個(gè)維度對(duì)保密措施的合理性進(jìn)行認(rèn)定,要求信息持有人必須有將信息作為商業(yè)秘密進(jìn)行保護(hù)的主觀意圖,且實(shí)施了客觀的保密措施(如客觀上可以被識(shí)別、有具體的秘密范圍等)。然而,關(guān)于客觀的保密措施應(yīng)實(shí)施至何種程度,目前并無定論?!蹲罡呷嗣穹ㄔ宏P(guān)于審理侵犯商業(yè)秘密民事案件適用法律若干問題的規(guī)定》(法釋〔2020〕7號(hào))指出該程度應(yīng)“與商業(yè)秘密的商業(yè)價(jià)值”相符合,有法院認(rèn)為保密措施應(yīng)當(dāng)達(dá)到“嚴(yán)格且全面”的程度或足以抵抗反向工程,也有法院對(duì)保密措施的程度采取較寬松的標(biāo)準(zhǔn)。判斷教師模型是否采取了合理的保密措施應(yīng)綜合考慮保密成本和主客觀目的,并從服務(wù)協(xié)議和保密技術(shù)兩個(gè)層面進(jìn)行認(rèn)定。

其一,教師模型提供者應(yīng)在服務(wù)協(xié)議中明確禁止用戶實(shí)施反向工程等類似行為。目前,部分模型提供者已將“禁止反向工程”寫入服務(wù)協(xié)議。例如,OpenAI公司在其服務(wù)協(xié)議中規(guī)定,用戶不得試圖或協(xié)助他人對(duì)服務(wù)(包括模型、算法或系統(tǒng))進(jìn)行反向工程、反向編譯、不得使用ChatGPT的輸出內(nèi)容開發(fā)與ChatGPT存在競(jìng)爭(zhēng)關(guān)系的模型等。Kimi模型同樣禁止用戶對(duì)服務(wù)進(jìn)行反向工程。盡管有學(xué)者認(rèn)為,通過服務(wù)協(xié)議設(shè)定保密措施是在模型開放使用與防止數(shù)據(jù)泄露之間取得平衡的合理選擇,可視為已采取合理的保密措施,但本文認(rèn)為,僅依賴服務(wù)協(xié)議并不足以達(dá)到合理的保密程度。一方面,服務(wù)協(xié)議只能體現(xiàn)信息持有人保護(hù)商業(yè)秘密的主觀意圖。假設(shè)模型提供者在服務(wù)協(xié)議中規(guī)定相關(guān)限制的同時(shí),仍允許通過API大規(guī)模調(diào)用模型輸出結(jié)果,則說明對(duì)“知識(shí)”缺乏有效的保密措施。另一方面,教師模型的服務(wù)協(xié)議大多未明確商業(yè)秘密的范圍。在司法實(shí)踐中,為避免保密制度被濫用,法院傾向于將寬泛描述商業(yè)秘密范圍的競(jìng)業(yè)協(xié)議認(rèn)定為未采取合理保密措施。因此,現(xiàn)有服務(wù)協(xié)議籠統(tǒng)禁止反向工程的條款易被視為對(duì)正常使用的過度限制,進(jìn)而導(dǎo)致保密措施不符合“合理性”標(biāo)準(zhǔn)。

其二,在技術(shù)層面,通常認(rèn)為高價(jià)值數(shù)據(jù)應(yīng)當(dāng)匹配高水平的保密技術(shù),但不應(yīng)以迫使信息持有人支付高昂的保密措施成本為代價(jià)。針對(duì)知識(shí)蒸餾的保密措施,不要求信息持有方徹底杜絕蒸餾的發(fā)生。在蓋茨訴坂東案中,法院強(qiáng)調(diào)即便部分信息能夠通過反向工程獲取,也不否認(rèn)其作為商業(yè)秘密的地位。當(dāng)前,部分教師模型提供者會(huì)采取限制每個(gè)賬戶的調(diào)用頻率、加密模型的權(quán)重文件、檢測(cè)并阻止異常調(diào)用等手段,防止用戶大規(guī)模收集模型輸出用于蒸餾。例如,OpenAI公司對(duì)模型的RPM(每分鐘請(qǐng)求數(shù))和TPM(每分鐘tokens數(shù))均有所限制。因此,對(duì)于教師模型的合理保密措施的認(rèn)定,應(yīng)當(dāng)同時(shí)考慮合同和技術(shù)兩個(gè)層次,即通過服務(wù)協(xié)議明確禁止蒸餾且明確界定禁止范圍,并在技術(shù)上采取防止過度調(diào)用API等保密措施。

綜上,并非所有被蒸餾的“知識(shí)”均構(gòu)成商業(yè)秘密。理論上,“知識(shí)”具備商業(yè)價(jià)值性和秘密性,而其是否符合保密性要件須從服務(wù)協(xié)議和保密技術(shù)兩個(gè)層面進(jìn)行綜合認(rèn)定。

(二)知識(shí)蒸餾構(gòu)成侵犯商業(yè)秘密行為的邊界

知識(shí)蒸餾被認(rèn)定為構(gòu)成侵犯商業(yè)秘密行為的主要理由在于其通常采取繞開API調(diào)用限制等不正當(dāng)手段,或違反信息持有人關(guān)于保守商業(yè)秘密的要求,且蒸餾后的學(xué)生模型在性能上無限接近教師模型,從而對(duì)教師模型造成實(shí)質(zhì)替代。在阻卻違法性上,學(xué)生模型開發(fā)者將尋求合理的抗辯理由,該理由通常是現(xiàn)實(shí)中存在替代成本低的獲取訴爭(zhēng)商業(yè)秘密的路徑。因?yàn)楫?dāng)存在低成本的替代獲取手段時(shí),意味著該商業(yè)秘密處于“容易獲取的狀態(tài)”,從而不具備秘密性或采取的保密措施不合理。常見抗辯包括替代信息源、反向工程等。

知識(shí)蒸餾本質(zhì)上是一種反向工程,反向工程即公眾通過觀察和分析現(xiàn)有產(chǎn)品、技術(shù)和信息,反向推導(dǎo)出其背后的工作原理從而獲取商業(yè)秘密的行為。從全球范圍來看,反向工程常被認(rèn)定為合法獲取商業(yè)秘密的行為。歐盟《商業(yè)秘密保護(hù)指令》[Directive (EU) 2016/943]第3條第1項(xiàng)將“反向工程”視為正當(dāng)獲取和使用商業(yè)秘密的行為。美國(guó)法院也曾明確反向工程的合法性,企業(yè)不能通過協(xié)議條款禁止反向工程。我國(guó)《最高人民法院關(guān)于審理侵犯商業(yè)秘密民事案件適用法律若干問題的規(guī)定》第14條第1款規(guī)定,通過反向工程獲得被訴侵權(quán)信息不屬于侵犯商業(yè)秘密行為。從各國(guó)司法實(shí)踐來看,唯有當(dāng)行為人對(duì)承載商業(yè)秘密的載體有合法處分權(quán),且反向工程替代成本較低時(shí),反向工程才會(huì)被視作未扭曲競(jìng)爭(zhēng)的行為,從而成為合理的抗辯理由。

1. 對(duì)“知識(shí)”載體的合法處分權(quán)

行為人實(shí)施反向工程的前提是其對(duì)承載商業(yè)秘密的載體有合法處分權(quán)(包括實(shí)施觀察、測(cè)試、分析等行為),這是正當(dāng)?shù)姆聪蚬こ膛c技術(shù)盜用的重要區(qū)別。但是,對(duì)“知識(shí)”載體的判斷將會(huì)影響處分權(quán)合法性的認(rèn)定。

一方面,有學(xué)者認(rèn)為在該語境下,反向工程的載體是人工智能生成物。根據(jù)OpenAI、Google等公司的服務(wù)協(xié)議,訓(xùn)練者通常具備對(duì)生成物的處分權(quán)(如使用、轉(zhuǎn)讓、復(fù)制、再訓(xùn)練等),而教師模型在法律上對(duì)輸出內(nèi)容不享有任何權(quán)利。另一方面,如果認(rèn)定“知識(shí)”的載體是模型,而非數(shù)據(jù)集,對(duì)于開源模型而言,由于模型已開放權(quán)重和訓(xùn)練代碼,除違反開源協(xié)議外不存在處分權(quán)障礙,用戶可以合法地蒸餾、微調(diào)模型。因此,對(duì)開源模型進(jìn)行蒸餾時(shí)即便“知識(shí)”中含有商業(yè)秘密,也屬于正當(dāng)?shù)姆聪蚬こ獭O喾?,學(xué)生模型對(duì)閉源教師模型的蒸餾往往因?yàn)槿狈戏ㄌ幏謾?quán)而導(dǎo)致反向工程缺乏正當(dāng)性。通常認(rèn)為,對(duì)于非公開數(shù)據(jù),一切未經(jīng)數(shù)據(jù)保有者同意的數(shù)據(jù)獲取行為均構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。司法實(shí)踐常將破壞協(xié)議抓取數(shù)據(jù)、攻擊API接口等具有攻擊性的技術(shù)手段認(rèn)定為不正當(dāng)?shù)墨@取行為。閉源模型未公開代碼、訓(xùn)練文檔等信息,而以API接口的方式為用戶提供服務(wù)。在知識(shí)蒸餾中,學(xué)生模型往往會(huì)繞過閉源教師模型的API調(diào)用限制,大規(guī)模爬取輸出結(jié)果,這屬于未經(jīng)同意獲取“知識(shí)”,系不正當(dāng)獲取行為。因此,對(duì)閉源模型進(jìn)行反向工程的前提是應(yīng)獲得許可(包括通過談判協(xié)商、簽訂合同等方式分享商業(yè)秘密);在具備對(duì)模型的合法處分權(quán)后,“禁止反向工程”條款將不再束縛訓(xùn)練者。

2. 知識(shí)蒸餾的替代成本

不同反向工程措施之間具有較大的成本差異。僅需簡(jiǎn)單分析即可拆解的、低成本且不費(fèi)時(shí)費(fèi)力的反向工程被視為合理的侵權(quán)抗辯。我國(guó)目前對(duì)反向工程的認(rèn)定多現(xiàn)于觀察、測(cè)試等人工方式,而尚未對(duì)通過人工智能技術(shù)反向提取數(shù)據(jù)的手段進(jìn)行定性。但是,這并不意味著對(duì)該類手段的否認(rèn)。反向工程的認(rèn)定不取決于人工或自動(dòng)化手段本身的區(qū)別,而在于實(shí)質(zhì)性成本的高低。在大模型領(lǐng)域,教師模型通常包含數(shù)十億甚至上千億數(shù)據(jù),數(shù)據(jù)數(shù)量和復(fù)雜性遠(yuǎn)超傳統(tǒng)技術(shù)產(chǎn)品,人工手段難以實(shí)現(xiàn)對(duì)其決策邏輯的推導(dǎo)。如果堅(jiān)持反向工程必須采取人工手段,則近乎否認(rèn)反向工程在大模型領(lǐng)域中的可能性,這與數(shù)字經(jīng)濟(jì)時(shí)代技術(shù)創(chuàng)新和數(shù)據(jù)流通的實(shí)際需求相悖。知識(shí)蒸餾實(shí)質(zhì)上是學(xué)生模型通過學(xué)習(xí)教師模型的輸入輸出關(guān)系,模仿其決策過程,而非直接復(fù)制其參數(shù)或訓(xùn)練數(shù)據(jù),這與傳統(tǒng)反向工程邏輯一致。

然而,理論和實(shí)務(wù)界對(duì)如何判斷替代成本的實(shí)質(zhì)性高低尚未形成統(tǒng)一的標(biāo)準(zhǔn),仍存在較大爭(zhēng)議。在部分案件中,知識(shí)蒸餾等自動(dòng)化數(shù)據(jù)提取手段被認(rèn)定為成本較低的替代性手段。例如在康普萊夫軟件公司訴紐曼案中,被告指使第三方使用爬蟲機(jī)器人在網(wǎng)站上獲取數(shù)千萬條報(bào)價(jià)信息,法院認(rèn)為即便信息源自公開渠道,爬蟲抓取行為獲取數(shù)據(jù)的規(guī)模和效率遠(yuǎn)超人力。因此,不論是針對(duì)開源還是閉源的教師模型,知識(shí)蒸餾作為效率和能力遠(yuǎn)超人力的反向工程似乎并不屬于成本較高的反向工程。尤其與重新訓(xùn)練一個(gè)教師模型相比,知識(shí)蒸餾能夠以較低成本獲得性能近似教師模型的輕量模型,這亦是知識(shí)蒸餾本身最大的優(yōu)勢(shì)。

與此相反,也有學(xué)者認(rèn)為知識(shí)蒸餾屬于高成本的反向工程手段。第一,算力成本高。知識(shí)蒸餾通常需要上百萬次甚至更多次數(shù)地大規(guī)模調(diào)用教師模型,且對(duì)學(xué)生模型進(jìn)行多輪訓(xùn)練,其算力消耗遠(yuǎn)高于傳統(tǒng)的反匯編技術(shù)。第二,資金成本高。學(xué)生模型需要獲取教師模型中基于輸出特征、中間特征和關(guān)系的“知識(shí)”,如果教師模型設(shè)置了API調(diào)用限額,那么“知識(shí)”的獲取將耗費(fèi)巨額成本。第三,蒸餾的技術(shù)難度高。蒸餾的過程涉及選擇匹配的教師模型、準(zhǔn)備高質(zhì)量數(shù)據(jù)集、訓(xùn)練學(xué)生模型、評(píng)估調(diào)優(yōu)、部署等步驟,難度遠(yuǎn)高于傳統(tǒng)的反向工程。例如,DeepSeek在技術(shù)報(bào)告中指出其研究團(tuán)隊(duì)整理了80萬個(gè)樣本,并對(duì)開源模型如Qwen和Llama進(jìn)行不斷微調(diào)以提升小模型的推理能力。故知識(shí)蒸餾屬于替代成本較高的獲取信息手段。對(duì)知識(shí)蒸餾成本的判斷影響其能否構(gòu)成合理抗辯的認(rèn)定,而這需要結(jié)合個(gè)案具體情況、行業(yè)實(shí)踐等因素綜合考慮。只有當(dāng)知識(shí)蒸餾被認(rèn)定為成本較低的替代獲取手段時(shí),方能抗辯知識(shí)蒸餾構(gòu)成侵犯商業(yè)秘密行為。

因此,在修正的“權(quán)益—損害”范式下,對(duì)已采取合理保密措施的教師模型進(jìn)行蒸餾可能會(huì)構(gòu)成侵犯商業(yè)秘密的不正當(dāng)行為,但當(dāng)學(xué)生模型開發(fā)者對(duì)“知識(shí)”載體具備合法處分權(quán)且蒸餾屬于替代成本較低的反向工程時(shí),知識(shí)蒸餾將不構(gòu)成侵犯商業(yè)秘密的不正當(dāng)行為。

知識(shí)蒸餾構(gòu)成搭便車的違法性認(rèn)定

知識(shí)蒸餾也深陷對(duì)教師模型搭便車而以輕量化、高性能優(yōu)勢(shì)進(jìn)入市場(chǎng)的不正當(dāng)性爭(zhēng)議。從方法角度看,行為中心主義范式下的反不正當(dāng)競(jìng)爭(zhēng)法分析大致需要經(jīng)過以下步驟:首先須判斷知識(shí)蒸餾是否構(gòu)成搭便車行為,若構(gòu)成則進(jìn)一步探討該行為的違法性。行為中心主義范式強(qiáng)調(diào)損害并不是違法性的主要構(gòu)成要件,而須從根本上判斷知識(shí)蒸餾是否扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制。若能夠證成違法性,則進(jìn)一步從過錯(cuò)、損害和因果關(guān)系等角度判斷行為人是否應(yīng)當(dāng)承擔(dān)法律責(zé)任。

(一)知識(shí)蒸餾構(gòu)成搭便車行為

在對(duì)知識(shí)蒸餾行為進(jìn)行違法性判定前,須先澄清搭便車行為在我國(guó)反不正當(dāng)競(jìng)爭(zhēng)法中作為競(jìng)爭(zhēng)行為正當(dāng)性判斷標(biāo)準(zhǔn)的定位,進(jìn)而判斷知識(shí)蒸餾是否構(gòu)成反不正當(dāng)競(jìng)爭(zhēng)法意義上的搭便車行為。

1. 搭便車行為在我國(guó)反不正當(dāng)競(jìng)爭(zhēng)法中的定位

“搭便車”一詞源于奧爾森于1965年出版的《集體行動(dòng)的邏輯》一書。由于公共物品具有非排他性和非競(jìng)爭(zhēng)性,社會(huì)成員無論是否對(duì)獲取公共物品作出過貢獻(xiàn),都能選擇不付費(fèi)而享受公共物品帶來的好處,且成員都不愿付出代價(jià)。可見,經(jīng)濟(jì)學(xué)上的“搭便車”源自市場(chǎng)機(jī)制的自然缺陷和公共物品的屬性。搭便車行為在競(jìng)爭(zhēng)法中有獨(dú)特的內(nèi)涵,其并非嚴(yán)格意義上的法律概念;學(xué)理上對(duì)其有多種解讀,但均認(rèn)為反不正當(dāng)競(jìng)爭(zhēng)法上搭便車的本質(zhì)是行為人自身不投入或以較低成本投入資源開展經(jīng)營(yíng)活動(dòng),而依附其他經(jīng)營(yíng)者積累的技術(shù)、智力或商業(yè)成果進(jìn)而取得競(jìng)爭(zhēng)優(yōu)勢(shì)。在競(jìng)爭(zhēng)法語境下,搭便車行為不是由公共物品屬性所引發(fā)的,而是對(duì)特定市場(chǎng)主體商業(yè)成果的寄生和利用。受不同競(jìng)爭(zhēng)觀影響,搭便車包含中性和負(fù)面評(píng)價(jià)兩種含義:持效率競(jìng)爭(zhēng)觀者認(rèn)為搭便車是不含價(jià)值判斷的中性概念,搭便車符合模仿自由、競(jìng)爭(zhēng)自由原則,只在極端情況下構(gòu)成不正當(dāng)競(jìng)爭(zhēng);而負(fù)面意義上的搭便車則泛指一切不正當(dāng)利用他人商業(yè)成果的行為,因?yàn)槠涫軅惱硇愿?jìng)爭(zhēng)觀的影響,認(rèn)為該行為違背了先來后到、不勞而獲的傳統(tǒng)商業(yè)倫理。

搭便車行為在反不正當(dāng)競(jìng)爭(zhēng)法中的定位涉及兩類:其一,將搭便車行為認(rèn)定為具體的不正當(dāng)競(jìng)爭(zhēng)行為類型;其二,將其視為競(jìng)爭(zhēng)行為正當(dāng)性的判斷標(biāo)準(zhǔn)。前者的典型代表為瑞士《反不正當(dāng)競(jìng)爭(zhēng)法》第5條第(3)項(xiàng)和西班牙《反不正當(dāng)競(jìng)爭(zhēng)法》第11條第(2)項(xiàng),二者均將未經(jīng)努力而利用他人成果的行為規(guī)定為不正當(dāng)競(jìng)爭(zhēng)行為。將搭便車認(rèn)定為競(jìng)爭(zhēng)行為正當(dāng)性判斷標(biāo)準(zhǔn)的國(guó)家包括中國(guó)、德國(guó)、美國(guó)等。例如,在國(guó)際新聞社訴美聯(lián)社案中,美國(guó)法院認(rèn)為新聞事實(shí)雖不受版權(quán)保護(hù),但新聞機(jī)構(gòu)為收集新聞付出投入形成時(shí)效性成果,因此國(guó)際新聞社未經(jīng)投入、直接利用美聯(lián)社的勞動(dòng)成果謀取競(jìng)爭(zhēng)優(yōu)勢(shì)屬于不正當(dāng)?shù)男袨椤N覈?guó)未在《反不正當(dāng)競(jìng)爭(zhēng)法》中明確規(guī)定搭便車行為,但司法實(shí)踐常在適用一般條款和反假冒條款時(shí)將其作為行為不正當(dāng)性的說理標(biāo)準(zhǔn),例如認(rèn)定新產(chǎn)品實(shí)質(zhì)替代原商業(yè)成果、商標(biāo)或字號(hào)攀附商譽(yù)等,進(jìn)而結(jié)合被告動(dòng)機(jī)、客觀行為、行業(yè)實(shí)踐等因素,論證搭便車行為屬于違背誠(chéng)實(shí)信用原則的不正當(dāng)競(jìng)爭(zhēng)行為。

2. 知識(shí)蒸餾構(gòu)成反不正當(dāng)競(jìng)爭(zhēng)法上的搭便車行為

知識(shí)蒸餾符合利用他人投入的搭便車行為表現(xiàn)。搭便車?yán)碚撟畛踹m用于保護(hù)商標(biāo)、字號(hào)知名度免于被利用的情形,后延伸至避免他人經(jīng)努力而生成的成果被寄生或利用。我國(guó)法院對(duì)“他人投入”的認(rèn)定門檻較低且具有較強(qiáng)的彈性,只要他人對(duì)該成果有投入且成果本身具備一定市場(chǎng)價(jià)值,即可被認(rèn)定為被搭便車的對(duì)象。司法實(shí)踐中如文學(xué)作品中的人物名稱等元素、電子游戲玩法、商戶點(diǎn)評(píng)信息等均被認(rèn)定為被搭便車的對(duì)象。在知識(shí)蒸餾中,模型訓(xùn)練者通過學(xué)習(xí)教師模型的輸出蒸餾“知識(shí)”,不必投入同樣規(guī)模的算力和研發(fā)成本即可獲得性能接近教師模型的輕量化模型,屬于利用教師模型的成果而非從零投入的搭便車行為。知識(shí)蒸餾涉嫌搭便車行為的正當(dāng)性判斷須適用反不正當(dāng)競(jìng)爭(zhēng)法的一般條款。

(二)知識(shí)蒸餾未扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制

行為中心主義范式與“權(quán)益—損害”范式的最大區(qū)別在于對(duì)“損害”的態(tài)度不同。傳統(tǒng)上,不正當(dāng)競(jìng)爭(zhēng)行為被認(rèn)為是特殊的“背俗侵權(quán)”,故將違背商業(yè)道德和誠(chéng)實(shí)信用造成損害的行為界定為不正當(dāng)?!皺?quán)益—損害”范式延續(xù)了侵權(quán)法上“不法推定”的認(rèn)定,只要損害競(jìng)爭(zhēng)利益,即可證成行為的不正當(dāng)性。行為中心主義則區(qū)分事實(shí)上的損害與法律意義上的損害,認(rèn)為在具有強(qiáng)烈對(duì)抗性和復(fù)雜交織性的市場(chǎng)競(jìng)爭(zhēng)中,存在事實(shí)上的損害難以避免,無法僅依據(jù)事實(shí)上的損害認(rèn)定行為的不正當(dāng)性,應(yīng)被規(guī)制的是以不正當(dāng)手段扭曲市場(chǎng)競(jìng)爭(zhēng)導(dǎo)致?lián)p害的行為。因此,判斷行為違法性應(yīng)以是否扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制作為判斷不正當(dāng)?shù)臉?biāo)準(zhǔn)。

市場(chǎng)經(jīng)濟(jì)需要市場(chǎng)競(jìng)爭(zhēng)。一方面,通過價(jià)格機(jī)制調(diào)節(jié)市場(chǎng)供需引導(dǎo)資源流動(dòng),實(shí)現(xiàn)要素從低效企業(yè)向高效企業(yè)轉(zhuǎn)移,從而優(yōu)化資源配置效率;另一方面,競(jìng)爭(zhēng)壓力驅(qū)動(dòng)企業(yè)創(chuàng)新并改進(jìn)管理,提升企業(yè)的生產(chǎn)效率。我國(guó)反不正當(dāng)競(jìng)爭(zhēng)法的目標(biāo)在于保護(hù)競(jìng)爭(zhēng)機(jī)制不被扭曲,如果某行為阻礙效率信號(hào)傳遞或干擾資源要素合理流動(dòng),則意味著行為扭曲了優(yōu)勝劣汰的市場(chǎng)機(jī)制,進(jìn)而構(gòu)成不正當(dāng)競(jìng)爭(zhēng)行為。非效能競(jìng)爭(zhēng)理論中的“阻礙競(jìng)爭(zhēng)對(duì)手標(biāo)準(zhǔn)”,是判斷某行為是否扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制的重要標(biāo)準(zhǔn)。在競(jìng)爭(zhēng)者之間,這主要表現(xiàn)為通過行為干擾、排擠或操縱競(jìng)爭(zhēng)對(duì)手等方式,阻礙競(jìng)爭(zhēng)對(duì)手在公平條件下依據(jù)效能存續(xù)或退出。易言之,如果競(jìng)爭(zhēng)者的行為并非依據(jù)效能,而是通過設(shè)置障礙、排擠或惡意干擾對(duì)手參與競(jìng)爭(zhēng),則構(gòu)成對(duì)市場(chǎng)優(yōu)勝劣汰機(jī)制的扭曲。在德國(guó)法實(shí)務(wù)中,其通常需要滿足存在競(jìng)爭(zhēng)關(guān)系、屬于商業(yè)行為、對(duì)象針對(duì)性、阻礙程度達(dá)到實(shí)質(zhì)妨礙、手段相稱性以及行為和阻礙結(jié)果之間具備因果關(guān)系等條件。如果行為介于效能和非效能之間,則需借助“動(dòng)態(tài)競(jìng)爭(zhēng)分析”來判斷行為的違法性。

對(duì)搭便車行為的多種評(píng)價(jià)態(tài)度決定了其在違法性判定上無法一概而論,持模仿自由立場(chǎng)者傾向于將搭便車認(rèn)定為效能競(jìng)爭(zhēng)或具備介于效能競(jìng)爭(zhēng)與非效能競(jìng)爭(zhēng)之間的性質(zhì),而持負(fù)面評(píng)價(jià)者則將其歸為非效能競(jìng)爭(zhēng)的范疇。由實(shí)踐觀之,知識(shí)蒸餾行為屬于未扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制的效能競(jìng)爭(zhēng)。

首先,知識(shí)蒸餾不滿足“阻礙競(jìng)爭(zhēng)對(duì)手標(biāo)準(zhǔn)”。一方面,知識(shí)蒸餾本質(zhì)上是一種模仿學(xué)習(xí)行為,通過訓(xùn)練更輕量的學(xué)生模型充分接近高性能的教師模型,蒸餾過程中并不會(huì)直接阻礙或干擾教師模型獨(dú)立運(yùn)行。蒸餾得到的學(xué)生模型如果能以更低算力、更高性能滿足市場(chǎng)需求,即便其有損于教師模型的在先利益,但因其在“效能”維度上具備競(jìng)爭(zhēng)優(yōu)勢(shì),符合優(yōu)勝劣汰邏輯,故不構(gòu)成不正當(dāng)競(jìng)爭(zhēng)行為。事實(shí)上,OpenAI作為閉源模型代表者也并未完全排斥知識(shí)蒸餾技術(shù);相反,其認(rèn)為蒸餾是個(gè)多步驟、容易出錯(cuò)的過程,并主動(dòng)為用戶提供使用GPT-4o等教師模型合成的訓(xùn)練數(shù)據(jù)幫助學(xué)生模型創(chuàng)建數(shù)據(jù)集的方法,為其他訓(xùn)練者進(jìn)行知識(shí)蒸餾創(chuàng)設(shè)支持性環(huán)境。另一方面,知識(shí)蒸餾在推動(dòng)市場(chǎng)競(jìng)爭(zhēng)的同時(shí)有效降低模型訓(xùn)練成本,而由此節(jié)約的成本可以用于投入模型壓縮技術(shù)的迭代優(yōu)化。長(zhǎng)期觀之,增量的利益最終會(huì)向消費(fèi)者一端轉(zhuǎn)移?;诖?,知識(shí)蒸餾本身并不會(huì)扭曲優(yōu)勝劣汰的市場(chǎng)機(jī)制。

其次,知識(shí)蒸餾憑借相對(duì)低成本、輕量化和高性能的優(yōu)勢(shì),已逐漸成為人工智能領(lǐng)域常見的模型壓縮和知識(shí)遷移技術(shù),其正當(dāng)性也得到行業(yè)慣例的支持,產(chǎn)生創(chuàng)新激勵(lì)效果,而非單純的學(xué)術(shù)想象。目前,知識(shí)蒸餾已廣泛應(yīng)用于模型壓縮與輕量化、計(jì)算機(jī)視覺(主要為視覺檢測(cè)和視覺分類)、自然語言處理(natural language process, 簡(jiǎn)稱NLP)、推薦系統(tǒng)(recommender system, 簡(jiǎn)稱RS)等領(lǐng)域。例如,微軟旗下的Phi系列模型蒸餾自GPT-4教師模型,以更小的參數(shù)規(guī)模獲取極強(qiáng)的數(shù)學(xué)推理能力。阿里云研發(fā)的通義千問-7B(Qwen-7B)以DeepSeek-R1為教師模型,專注于中文場(chǎng)景的優(yōu)化。再如,BERT模型作為自然語言處理領(lǐng)域的熱門模型,其具備強(qiáng)大的編碼表示能力但參數(shù)量巨大,近年來蒸餾自BERT模型生成的Distilled BiLSTM、BERT-PKD等模型,在有效減少模型尺寸的同時(shí)基本保留了教師模型的語言理解能力,并顯著提升運(yùn)行速度。因此,知識(shí)蒸餾不僅有助于平衡模型性能表現(xiàn)與資源消耗之間的矛盾,還能推動(dòng)人工智能技術(shù)的普及應(yīng)用和生態(tài)構(gòu)建,具備顯著的適用性與延展?jié)摿Α?/p>

最后,知識(shí)蒸餾符合公平非歧視原則,契合消除數(shù)字鴻溝的全球時(shí)代命題。一方面,知識(shí)蒸餾幫助促進(jìn)資源公平。教師模型通常因規(guī)模大導(dǎo)致運(yùn)行成本高,僅少數(shù)具備先進(jìn)算力資源的頭部企業(yè)和技術(shù)先發(fā)國(guó)家能直接部署。知識(shí)蒸餾通過壓縮模型降低了計(jì)算資源和存儲(chǔ)需求,使更多主體能夠以較低成本使用高性能的模型,為算力資源短缺地區(qū)輸送了普惠性的技術(shù)紅利。另一方面,知識(shí)蒸餾能夠提升資源運(yùn)用效率。與從零開始的重復(fù)性模型訓(xùn)練相比,知識(shí)蒸餾高效遷移教師模型的“知識(shí)”,減少消耗重復(fù)算力,促進(jìn)實(shí)現(xiàn)公平利用有限資源的可持續(xù)發(fā)展目標(biāo)。

在激烈的市場(chǎng)競(jìng)爭(zhēng)中,競(jìng)爭(zhēng)損害極為普遍,而市場(chǎng)具備強(qiáng)大的自我修復(fù)能力,法律為化解市場(chǎng)失靈的干預(yù)應(yīng)當(dāng)保持謙抑。從行為中心主義范式出發(fā),作為搭便車行為的知識(shí)蒸餾技術(shù)未扭曲市場(chǎng)競(jìng)爭(zhēng)機(jī)制,行為違法性難以證成。唯有從商品視角考量的,對(duì)已采取合理保密措施的教師模型進(jìn)行蒸餾的行為,會(huì)涉及侵犯商業(yè)秘密,進(jìn)而應(yīng)予以規(guī)制。

結(jié)語

中國(guó)人工智能法治以“發(fā)展”和“治理”為核心支點(diǎn),旨在為我國(guó)在全球科技競(jìng)爭(zhēng)格局中贏得戰(zhàn)略主動(dòng)。知識(shí)蒸餾技術(shù)折射出人工智能時(shí)代創(chuàng)新激勵(lì)與競(jìng)爭(zhēng)秩序維護(hù)之間的張力,其作為人工智能領(lǐng)域中普遍采用的模型壓縮與知識(shí)遷移技術(shù),是影響全球數(shù)字競(jìng)爭(zhēng)格局的關(guān)鍵節(jié)點(diǎn),如何妥善認(rèn)定并處理其違法性問題關(guān)系到行業(yè)發(fā)展的重大利益。因此,在知識(shí)蒸餾違法性認(rèn)定上應(yīng)秉持包容審慎的態(tài)度,辨明其不正當(dāng)競(jìng)爭(zhēng)違法性的認(rèn)定邊界。一方面,在涉嫌侵犯商業(yè)秘密行為的認(rèn)定上,須著重辨明“知識(shí)”作為商業(yè)秘密的邊界,以及合理的反向工程這一違法阻卻因素;另一方面,在對(duì)教師模型搭便車的不正當(dāng)性爭(zhēng)議上,應(yīng)將行為是否扭曲優(yōu)勝劣汰的市場(chǎng)競(jìng)爭(zhēng)機(jī)制作為判斷違法性的標(biāo)準(zhǔn)。據(jù)此,在厘清知識(shí)蒸餾的不正當(dāng)競(jìng)爭(zhēng)違法性邊界的基礎(chǔ)上推動(dòng)實(shí)現(xiàn)創(chuàng)新激勵(lì)、技術(shù)保護(hù)和普惠應(yīng)用的多元價(jià)值目標(biāo)。

-向上滑動(dòng),查看完整目錄-

《知識(shí)產(chǎn)權(quán)》2025年第11期目錄

【專題評(píng)述】

1.試論生成式人工智能服務(wù)提供者的合理注意義務(wù)

吳漢東、樊賽爾

2.人工智能算法專利保護(hù)的制度機(jī)理與實(shí)現(xiàn)進(jìn)路

寧立志、楊瑩瑩

3.純指令類人工智能生成內(nèi)容的競(jìng)爭(zhēng)法保護(hù)

胡開忠、江璐迪

4.轉(zhuǎn)介視域下生成式人工智能服務(wù)提供者版權(quán)注意義務(wù)的教義學(xué)展開

呂炳斌、李雋姝

【實(shí)踐探討】

5.反不正當(dāng)競(jìng)爭(zhēng)法下知識(shí)蒸餾違法性的認(rèn)定

詹韞如

6.從備案回歸公開:集成電路布圖設(shè)計(jì)權(quán)登記取得制邏輯反思

潘柏華

《知識(shí)產(chǎn)權(quán)》是由國(guó)家知識(shí)產(chǎn)權(quán)局主管,中國(guó)知識(shí)產(chǎn)權(quán)研究會(huì)主辦的學(xué)術(shù)期刊,是中國(guó)中文法律類核心期刊、中文社會(huì)科學(xué)引文索引(CSSCI)擴(kuò)展版來源期刊和AMI綜合評(píng)價(jià)(A刊)擴(kuò)展期刊。

點(diǎn)擊進(jìn)入下方小程序

獲取專屬解決方案~

責(zé)任編輯 | 郭晴晴

審核人員 | 張文碩 韓爽

本文聲明 | 本文章僅限學(xué)習(xí)交流使用,如遇侵權(quán),我們會(huì)及時(shí)刪除。本文章不代表北大法律信息網(wǎng)(北大法寶)和北京北大英華科技有限公司的法律意見或?qū)ο嚓P(guān)法規(guī)/案件/事件等的解讀。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

北大法律信息網(wǎng) incentive-icons
北大法律信息網(wǎng)
法律綜合性網(wǎng)站
11073文章數(shù) 17485關(guān)注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈(zèng)里的“詩與遠(yuǎn)方

無障礙瀏覽 進(jìn)入關(guān)懷版