国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

斯坦福報(bào)告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

0
分享至

最近,美國(guó)斯坦福大學(xué)等團(tuán)隊(duì)發(fā)布了一份名為《2025 年基礎(chǔ)模型透明度指數(shù)》(FMTI,The 2025 Foundation Model Transparency Index)的報(bào)告。其中,IBM 以透明度得分最高奪冠,xAI 和 Midjourney 則墊底。

該報(bào)告揭示了一種令人擔(dān)憂(yōu)的趨勢(shì):隨著技術(shù)的發(fā)展,盡管基礎(chǔ)模型在性能等各方面持續(xù)進(jìn)步,但其在數(shù)據(jù)使用、模型訓(xùn)練和下游影響等方面的透明度卻出現(xiàn)了集體倒退。

這是該報(bào)告自 2023 年以來(lái)發(fā)布的第三個(gè)年度版本,就像通過(guò)量化透明度為各大基礎(chǔ)模型開(kāi)發(fā)者做一次“體檢”。

本次評(píng)估共包括 13 家基礎(chǔ)模型公司,其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報(bào)告的企業(yè),也有 IBM、OpenAI 等老牌科技巨頭。為使評(píng)估更全面,今年的報(bào)告中還涵蓋了數(shù)據(jù)獲取、使用數(shù)據(jù)和監(jiān)控等方面的新指標(biāo)。


(來(lái)源:The 2025 Foundation Model Transparency Index)

從報(bào)告的整體結(jié)果來(lái)看,盡管 2024 年報(bào)告顯示模型透明度有短暫的改善,但 2025 年的報(bào)告指出,透明度指數(shù)正呈現(xiàn)倒退:各基礎(chǔ)模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分,幾乎與 2023 年報(bào)告首次發(fā)布時(shí)的水平相當(dāng)(備注:100 分為滿(mǎn)分)。

報(bào)告顯示,公司在其旗艦?zāi)P偷挠?xùn)練數(shù)據(jù)、訓(xùn)練計(jì)算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評(píng)估和風(fēng)險(xiǎn)評(píng)估方面披露較多,但在方法透明度、第三方參與、可復(fù)現(xiàn)性和訓(xùn)練-測(cè)試數(shù)據(jù)重疊報(bào)告方面仍存在挑戰(zhàn)。


(來(lái)源:The 2025 Foundation Model Transparency Index)

從各公司的表現(xiàn)來(lái)看差異明顯,其中 IBM 以 95 分獲得透明度最高得分,xAI 和 Midjourney 得分最低,僅 14 分。中國(guó)的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。

可以看到的是,公司特征和透明度指數(shù)在某些程度上存在著一些有趣的關(guān)聯(lián),例如開(kāi)放模型開(kāi)發(fā)者、以企業(yè)為中心的 B2B 公司、自行準(zhǔn)備透明度報(bào)告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準(zhǔn)則的公司得分高于平均水平。


(來(lái)源:The 2025 Foundation Model Transparency Index)

那么,透明度越高就意味著模型越好嗎?

清華大學(xué)邱寒副教授告訴 DeepTech,“這里的透明度不等同于我們常識(shí)認(rèn)為的開(kāi)源,而是由一系列明確的打分表組成的量化指標(biāo)——如果不按照這個(gè)指標(biāo)披露相關(guān)的數(shù)據(jù)(而不是什么都沒(méi)披露),那么這項(xiàng)指標(biāo)得分就是 0?!?/p>


以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數(shù)據(jù)、影響、部署后監(jiān)控三項(xiàng)指標(biāo)為例:它們都各自含有更詳細(xì)的評(píng)測(cè)指標(biāo),得分為 0 并不等于什么都沒(méi)有披露,而這些計(jì)算指標(biāo)的方法與開(kāi)源、安全、性能并不能直接劃等號(hào)。

需要了解的是,透明或開(kāi)源也并不意味著模型性能更好。從這份報(bào)告來(lái)看,透明度得分最高的模型(IBM 的 Granite 3.3),在實(shí)際應(yīng)用場(chǎng)景種的性能表現(xiàn)并不是最頂尖的那批模型。

試想一下,如果有一個(gè)任務(wù)要做,你是會(huì)去選擇微調(diào) Qwen3 或 Claude 的 API,還是會(huì)因?yàn)橥该鞫鹊梅指叨x擇 Granite 3.3?

邱寒認(rèn)為,透明度是安全的前提,但必須明確不一定是報(bào)告中定義的透明:如果公司拒絕披露任何模型生產(chǎn)相關(guān)的信息,比如版權(quán)內(nèi)容、隱私數(shù)據(jù)的濫用確實(shí)難以發(fā)掘和確認(rèn);模型的偏見(jiàn)和價(jià)值觀更難評(píng)測(cè),確實(shí)會(huì)給安全和治理帶來(lái)一定的影響。更糟的是,一旦嚴(yán)重安全事故發(fā)生,還可能引發(fā)更粗暴的安全監(jiān)管策略落地,反而進(jìn)一步限制了大模型技術(shù)的進(jìn)步。

該報(bào)告提到,隨著全球政策制定者越來(lái)越多地要求某些類(lèi)型的透明度,這項(xiàng)工作揭示了基礎(chǔ)模型開(kāi)發(fā)者的當(dāng)前透明度狀態(tài),透明度可能如何變化,以及需要更積極的政策干預(yù)來(lái)解決哪些關(guān)鍵信息問(wèn)題。

正如邱寒所指出的那樣,黑盒模型的評(píng)測(cè)技術(shù)可以在一定程度上彌補(bǔ)不透明的問(wèn)題,而當(dāng)前的透明與否也只是暫時(shí)狀態(tài)。隨著模型落地的深化和監(jiān)管機(jī)制的完善,最終目標(biāo)是“公司不需完全公開(kāi),但模型行為可測(cè)、聲明可證、安全可控”。

總之,表面上看公司信息披露程度影響透明度,但本質(zhì)上這需要一種權(quán)責(zé)歸屬的清晰界定。通過(guò)這份報(bào)告對(duì)透明度倒退的警示,我們需要看到,未來(lái)需要構(gòu)建一種綜合的激勵(lì)機(jī)制,來(lái)理解、評(píng)估并最終確保模型的安全與可信。

參考資料:

https://arxiv.org/abs/2512.10169

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
Steam熱搜榜第一!含媽量最高的游戲,沒(méi)有之一!

Steam熱搜榜第一!含媽量最高的游戲,沒(méi)有之一!

17173游戲網(wǎng)
2026-01-12 11:45:05
朱棣死在榆木川,榆木川位于現(xiàn)在的哪里?說(shuō)出來(lái)你可能不信

朱棣死在榆木川,榆木川位于現(xiàn)在的哪里?說(shuō)出來(lái)你可能不信

小豫講故事
2026-01-12 06:00:05
電池巨頭再暴大雷!

電池巨頭再暴大雷!

電動(dòng)知家
2026-01-12 10:25:26
剛剛!Bondi奪槍英雄赴美,與澳媒公開(kāi)鬧翻,被控“言而無(wú)信”!赴美FBI全程陪同

剛剛!Bondi奪槍英雄赴美,與澳媒公開(kāi)鬧翻,被控“言而無(wú)信”!赴美FBI全程陪同

澳洲紅領(lǐng)巾
2026-01-12 13:42:30
俄東正教大牧首稱(chēng) 不認(rèn)同國(guó)家核心政策的俄羅斯人當(dāng)屬祖國(guó)叛徒

俄東正教大牧首稱(chēng) 不認(rèn)同國(guó)家核心政策的俄羅斯人當(dāng)屬祖國(guó)叛徒

老馬拉車(chē)莫少裝
2026-01-11 08:07:06
48小時(shí)里,一連3個(gè)壞消息,特朗普氣炸!對(duì)中俄連說(shuō)兩個(gè)“必須”

48小時(shí)里,一連3個(gè)壞消息,特朗普氣炸!對(duì)中俄連說(shuō)兩個(gè)“必須”

墨山看客
2026-01-12 14:01:37
才八天就黃了,越南670億高鐵項(xiàng)目崩盤(pán),這次中國(guó)不做“冤大頭”

才八天就黃了,越南670億高鐵項(xiàng)目崩盤(pán),這次中國(guó)不做“冤大頭”

泠泠說(shuō)史
2026-01-09 18:58:05
四川一大學(xué)迎來(lái)一位年輕副校長(zhǎng),僅39歲,履歷優(yōu)秀學(xué)歷堪稱(chēng)天花板

四川一大學(xué)迎來(lái)一位年輕副校長(zhǎng),僅39歲,履歷優(yōu)秀學(xué)歷堪稱(chēng)天花板

凱旋學(xué)長(zhǎng)
2026-01-12 12:37:15
百萬(wàn)網(wǎng)紅疑似感染臟病,被挖出吃抗艾滋的藥,醫(yī)院梅毒的就診記錄

百萬(wàn)網(wǎng)紅疑似感染臟病,被挖出吃抗艾滋的藥,醫(yī)院梅毒的就診記錄

花哥扒娛樂(lè)
2026-01-11 20:48:43
美軍或用對(duì)付伊拉克的方法,對(duì)付中國(guó)?一旦開(kāi)戰(zhàn),衛(wèi)星肯定不保

美軍或用對(duì)付伊拉克的方法,對(duì)付中國(guó)?一旦開(kāi)戰(zhàn),衛(wèi)星肯定不保

妙知
2025-12-09 00:16:52
閆學(xué)晶“哭窮”后多平臺(tái)賬號(hào)禁止關(guān)注 其代言調(diào)料品牌老總:將向她索賠 不再請(qǐng)明星代言

閆學(xué)晶“哭窮”后多平臺(tái)賬號(hào)禁止關(guān)注 其代言調(diào)料品牌老總:將向她索賠 不再請(qǐng)明星代言

紅星新聞
2026-01-10 14:19:18
勇士完?。?kù)里31+5創(chuàng)紀(jì)錄,快船舊將爆發(fā)立功,巴特勒30+7也無(wú)奈

勇士完??!庫(kù)里31+5創(chuàng)紀(jì)錄,快船舊將爆發(fā)立功,巴特勒30+7也無(wú)奈

魚(yú)崖大話(huà)籃球
2026-01-12 12:01:30
瘋傳!王石的瓜,好狗血!

瘋傳!王石的瓜,好狗血!

財(cái)經(jīng)要參
2026-01-05 22:13:08
廣東的冷要把老外逼瘋了:8℃比我老家-30℃還難熬

廣東的冷要把老外逼瘋了:8℃比我老家-30℃還難熬

大象新聞
2026-01-12 07:41:04
領(lǐng)導(dǎo)突然問(wèn)你“要不要考慮去別的崗位”,千萬(wàn)不要說(shuō)“我考慮下”,高情商這么回,反客為主!

領(lǐng)導(dǎo)突然問(wèn)你“要不要考慮去別的崗位”,千萬(wàn)不要說(shuō)“我考慮下”,高情商這么回,反客為主!

二胡的歲月如歌
2026-01-03 18:02:12
再次見(jiàn)證歷史!金價(jià),又爆了!

再次見(jiàn)證歷史!金價(jià),又爆了!

三農(nóng)老歷
2026-01-12 12:03:35
降!大降!東莞全市暴跌!

降!大降!東莞全市暴跌!

東莞好生活
2026-01-11 12:57:21
演員閆某晶之子林某霏曾就讀“新疆班”?中戲回應(yīng):2012年未招“新疆班”,其以戶(hù)籍地北京生源報(bào)考

演員閆某晶之子林某霏曾就讀“新疆班”?中戲回應(yīng):2012年未招“新疆班”,其以戶(hù)籍地北京生源報(bào)考

每日經(jīng)濟(jì)新聞
2026-01-11 21:14:06
上海一男子泡了3年的人參酒,人參突然長(zhǎng)出綠葉!當(dāng)事人:50度散白酒泡的,鹿鞭味較腥,人參味基本嘗不出來(lái)

上海一男子泡了3年的人參酒,人參突然長(zhǎng)出綠葉!當(dāng)事人:50度散白酒泡的,鹿鞭味較腥,人參味基本嘗不出來(lái)

臺(tái)州交通廣播
2026-01-12 00:34:48
變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個(gè)時(shí)候的欲言又止

變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個(gè)時(shí)候的欲言又止

夜深?lèi)?ài)雜談
2026-01-09 21:32:55
2026-01-12 14:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16112文章數(shù) 514476關(guān)注度
往期回顧 全部

科技要聞

小米二手車(chē)價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

臺(tái)媒:大陸在朱日和基地復(fù)制"總統(tǒng)府" 不可掉以輕心

頭條要聞

臺(tái)媒:大陸在朱日和基地復(fù)制"總統(tǒng)府" 不可掉以輕心

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車(chē)要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

教育
健康
本地
旅游
公開(kāi)課

教育要聞

學(xué)霸思維訓(xùn)練:巧求陰影部分的面積

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

旅游要聞

哈爾濱“鉆石?!崩寺p落日

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版