国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Transformer作者:DeepSeek才有搞頭,OpenAI指望不上了

0
分享至

Jay 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

“閉源人工智能在阻礙我們探索真正的科學(xué)?!?/strong>

說這句話的不是別人,是大名鼎鼎的Transformer發(fā)明者——Ashish Vaswani



大佬之所以這么說,是因為他覺得OpenAI等閉源廠商被商業(yè)化沖昏了頭腦,沒心思做基礎(chǔ)研究。

在Scaling Law碰壁后,獨角獸們越來越搞不清技術(shù)方向。

迫于投資者壓力,不得不親自下場探索落地場景,更沒精力去搞科研了。

為了填補這塊空白,一路從Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎來巨大轉(zhuǎn)折點——

All in基礎(chǔ)研究,并且堅持要走開源路線。



萬萬沒想到,大佬三遷,只為打造西方世界的DeepSeek。

“我們很樂意成為西方世界的DeepSeek”

2017年,還在Google Brain工作的Vaswani與團隊共同寫出了《Attention Is All You Need》,這篇論文在5年后開啟了如今的GenAI大航海時代。



可惜的是,老東家不太給力,各種條條框框把人束縛得動彈不得,這讓Vaswani心灰意冷。

2022年,他離家出走,與Niki Parmar(Transformer八子之一)和David Luan(當時的Adept CEO)創(chuàng)辦了Adept AI

可惜好景不長,據(jù)BloomBerg報道,Vaswani在Adept與某位聯(lián)合創(chuàng)始人爆發(fā)了一次嚴重沖突。

這次爭執(zhí)讓他意識到:

  • 只有創(chuàng)立一個完全屬于自己的公司,才能有絕對的自由。

于是2022年底,他再次揮手告別,拉起新團隊創(chuàng)立了Essential AI。



最開始,Essential AI還走的是務(wù)實派路線——主要業(yè)務(wù)就是幫企業(yè)做財務(wù)分析自動化。

結(jié)果,就在今年年初,Vaswani突然對董事會宣布:

放棄公司現(xiàn)有業(yè)務(wù),并將精力全部投入基礎(chǔ)研究。

What???

這不是把商業(yè)模式直接推翻重來嗎?



要知道,對于一家原本服務(wù)于企業(yè)客戶的初創(chuàng)公司來說,這可是一個風(fēng)險性極高的Bet。

出乎意料的是,董事會和資方居然都在一定程度上對Vaswani表示了支持。

參與Essential AI上一輪融資的AMD在采訪中表示:

這個路線確實有點不太尋常,但人工智能領(lǐng)域需要更開放的替代方案。

看來,三次遷居的努力沒有白費,Vaswani終于如愿以償,集結(jié)了一幫理念同頻的大佬。



為商業(yè)化四處奔波的這么多年,與資本和客戶打了無數(shù)次交道,Vaswani真的累了。

驀然回首,在他的精神世界中,其實一直有一塊能承載他一切美好期許的土地,這片伊甸園的名字叫做——開源。

他在Essential官網(wǎng)上寫道:

在教育和醫(yī)療等領(lǐng)域,有真正的科學(xué)需要追求,我們不能讓封閉的人工智能阻礙人類探索這些新方向。

是不是聽著很耳熟,沒錯,Vaswani在與Economics Time的采訪中直接承認了:

“短期內(nèi),我們想要成為西方世界的DeepSeek?!?/strong>



Vaswani認為,要想推動AI的邊界絕不能靠OpenAI、Anthropic等依靠閉源模式盈利的獨角獸。

在他的設(shè)想里,AI不該只服務(wù)于商業(yè),而是要真正進入教育、醫(yī)療等關(guān)乎大眾的場景,讓普通人也能享受到技術(shù)紅利。

比如,一個偏遠地區(qū)的孩子也能用開源AI上到最好的課;一個小診所也能借助開源工具做出最準確的診斷。

更重要的是,Vaswani可不光是喊口號,Essential在轉(zhuǎn)型后的確下了不少真功夫。

提出轉(zhuǎn)型后的不久,2025年4月,Essential AI團隊發(fā)表了一篇題為《Rethinking Reflection in Pre-Training》的論文。

這篇論文提出了一個顛覆性觀點:

大型語言模型的反思能力其實在預(yù)訓(xùn)練階段就開始萌芽。

簡單來說,相較于用RL在后訓(xùn)練打補丁,他們在預(yù)訓(xùn)練中取得了突破,并且這個技術(shù)可能大幅降低訓(xùn)練成本。

要真能成,那對整個開源社區(qū)絕對是大利好。

Vaswani看到了什么?

為什么Vaswani說不能把希望寄托在獨角獸公司身上?

Vaswani擔心,這些模型性能最優(yōu)異的獨角獸正在阻礙人工智能進步。



有幾家公司關(guān)閉了長期的研發(fā)工作,以便將所有資源用于商業(yè)化,這種現(xiàn)象在市場環(huán)境惡化時更加明顯。

自Scaling Law迎來邊際收益遞減的拐點后,AI獨角獸的產(chǎn)品化傾向已是眾人皆知。

Anthropic做瀏覽器,OpenAI派出著名產(chǎn)品經(jīng)理Kevin Weil…….各大模型廠商紛紛下場,親自探索商業(yè)模式。

這折射出來的一個問題是創(chuàng)新者窘境。

Scaling Law興起后,暴力美學(xué)的砝碼使得AI研究的天平從學(xué)術(shù)機構(gòu)幾乎完全向企業(yè)實驗室傾斜。

不過,產(chǎn)業(yè)界雖壟斷了最稀缺的生產(chǎn)要素,他們真的可以All in創(chuàng)新嗎?

絕大多數(shù)時候不能。因為那可能燒掉幾個億,而且不一定能看到回報。

關(guān)鍵在于,無論公司成立的初衷是什么,創(chuàng)始人最終都得優(yōu)先對投資人負責(zé)。

因此,探索商業(yè)模式和利益最大化是閉源模型的最終歸宿,這從一開始就注定了。

如今,這把熱烈的商業(yè)化之火同樣燒到了硅谷這批天之驕子身上。

今天等著小扎買買買,明天聽說OpenAI搞收購,下個月又去創(chuàng)業(yè)。



△由AI生成

這種節(jié)奏很適合追熱點,但科研不一樣——要搞出突破性的成果,你得花幾年甚至十幾年死磕一個方向。

而頻繁的流動,讓團隊很難靜下心來。

Vaswani嘆息道,這不是科學(xué)應(yīng)有的進步方式。

那Vaswani想要怎么做?開源陣營能夠拯救AI嗎?

老生常談的話題——人多力量大,知識共享才是推動AI技術(shù)發(fā)展的關(guān)鍵動力。

閉源公司雖手握頂級資源和技術(shù)成果,但為了維護投資人的利益,不得不把這些秘密藏起來,以阻礙競爭對手。

但如果有成千上萬的研究者和開發(fā)者一起貢獻代碼,整個生態(tài)齊心協(xié)力,并行推進,也許能克服開源陣營資源匱乏的問題。

當然,開源最重要的問題在于資金來源,畢竟咱不能總靠“用愛發(fā)電”。

對此,Vaswani參考了互聯(lián)網(wǎng)產(chǎn)品的解法

交叉補貼大法好

什么是交叉補貼呢?

這是互聯(lián)網(wǎng)時代很常見的一種商業(yè)模式,典型案例就是瀏覽器:Google搜索對用戶完全免費,取得市場份額后依靠廣告回血。

簡單來說,就是一部分業(yè)務(wù)賺錢,用來補貼另一部分業(yè)務(wù)。



Vaswani對于Essential AI的計劃是這樣的:

先構(gòu)建一個開源的垂直領(lǐng)域模型,這個基座本身不收錢。

但如果有客戶想用這個基座搭建自己的AI,可以向Essential AI購買訓(xùn)練數(shù)據(jù)和相關(guān)產(chǎn)品。

通過這個途徑賺來的錢,正好能用來反哺開源社區(qū)。

這樣,既能保證技術(shù)開放,又能讓公司活下去。



此外,Vaswani還指出閉源不一定代表更高的投資回報率。

雖然閉源模型看起來更容易變現(xiàn),但實際上也面臨巨大的成本壓力。

實際上,如果按照之前科技互聯(lián)網(wǎng)的發(fā)展來看,開源通常是更賺錢的一方,畢竟構(gòu)建起了一整個生態(tài)。

One More Thing

最后,關(guān)于Ashish Vaswani,或許還有一點點可以多說的。



作為《Attention Is All You Need》論文的“一作”,他博士師承的兩位導(dǎo)師,都是華人。

在2011年的南加州大學(xué),有兩名活躍在自然語言處理(NLP)前沿的教授——蔣偉(David Chiang)與黃亮(Liang Huang)。

他倆都是Ashish Vaswani的導(dǎo)師。



△圖左為蔣偉教授,圖右為黃亮教授

蔣偉教授的學(xué)士和碩士均就讀于哈佛大學(xué),后到賓夕法尼亞大學(xué)攻讀博士,他提出的分層短語翻譯模型曾被Google Translate采用。

黃亮教授本科畢業(yè)于上海交通大學(xué)計算機系,同樣是在賓夕法尼亞大學(xué)進修的PhD,主要研究方向是開發(fā)高效算法來加速NLP任務(wù),Vaswani是他指導(dǎo)的第一名博士生。

怎么說呢,雖然Transformer八子里沒有華人作者,但“功勞簿”里,也并非全然沒有華人貢獻。

這實際也是另一個維度的開源之力。AI也好、深度學(xué)習(xí)也好,之所以可以站上浪潮之巔,根本上就在于始終有一個持續(xù)交流、開放互助的生態(tài)環(huán)境。

開源是一種選擇,更是一種精神和信仰。

參考鏈接
[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[6]https://www.essential.ai/
[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

朗威談星座
2026-03-02 16:54:30
美軍公布傷亡情況

美軍公布傷亡情況

環(huán)球時報國際
2026-03-02 00:10:13
埃及被打醒了,蘇35和殲10都不買:就要一種4000萬美元中國新軍機

埃及被打醒了,蘇35和殲10都不買:就要一種4000萬美元中國新軍機

近史談
2026-01-17 21:44:06
超2萬名旅客滯留迪拜!外交部提醒

超2萬名旅客滯留迪拜!外交部提醒

看看新聞Knews
2026-03-02 14:27:08
比賽還沒開打,巴薩先迎一個致命壞消息,國王杯晉級決賽基本沒戲

比賽還沒開打,巴薩先迎一個致命壞消息,國王杯晉級決賽基本沒戲

零度眼看球
2026-03-02 13:58:36
當世界各國被美國大棒打怕了,投降了,都成為美國的附庸,會怎樣

當世界各國被美國大棒打怕了,投降了,都成為美國的附庸,會怎樣

小陸搞笑日常
2026-03-02 11:19:22
“母子落魄吃蛋糕”視頻火了,獲贊過百萬:誰不羨慕這樣的父母?

“母子落魄吃蛋糕”視頻火了,獲贊過百萬:誰不羨慕這樣的父母?

妍妍教育日記
2026-02-25 20:58:43
突發(fā)要聞!中國通告全球:王毅同伊朗外長阿拉格齊通電話

突發(fā)要聞!中國通告全球:王毅同伊朗外長阿拉格齊通電話

科技處長
2026-03-02 22:17:02
外媒:美國駐巴基斯坦使館所在區(qū)域發(fā)生槍擊事件

外媒:美國駐巴基斯坦使館所在區(qū)域發(fā)生槍擊事件

參考消息
2026-03-01 20:58:54
網(wǎng)傳新能源汽車開征“里程稅” 收費0.12元/公里 多地回應(yīng)

網(wǎng)傳新能源汽車開征“里程稅” 收費0.12元/公里 多地回應(yīng)

快科技
2026-02-27 21:58:15
溫州發(fā)生墜樓!已確認死亡

溫州發(fā)生墜樓!已確認死亡

溫百君
2026-03-01 19:07:44
楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

手工制作阿殲
2026-02-22 13:25:34
中國職業(yè)足球紀錄,蓉城小將帥惟浩榮膺中國金童獎!姐姐透露:為領(lǐng)獎專門購置西裝

中國職業(yè)足球紀錄,蓉城小將帥惟浩榮膺中國金童獎!姐姐透露:為領(lǐng)獎專門購置西裝

紅星新聞
2026-03-02 18:39:13
美以聯(lián)合空襲伊朗進入第三天,多國被卷入全面沖突

美以聯(lián)合空襲伊朗進入第三天,多國被卷入全面沖突

土澳的故事
2026-03-02 22:19:10
戲子誤國!2026年剛開年,就有3位明星相繼塌房,個個荒唐

戲子誤國!2026年剛開年,就有3位明星相繼塌房,個個荒唐

不似少年游
2026-02-24 19:24:23
特朗普苦等4天中方終于回信,對美開出兩大條件,做不到訪華免談

特朗普苦等4天中方終于回信,對美開出兩大條件,做不到訪華免談

古事尋蹤記
2026-03-02 09:24:58
外媒:美軍出動B-1戰(zhàn)略轟炸機攻擊伊朗

外媒:美軍出動B-1戰(zhàn)略轟炸機攻擊伊朗

參考消息
2026-03-02 21:46:39
舞廳驚見一米七幾碎花裙女子,苦等三小時終究無緣2026年3月2日

舞廳驚見一米七幾碎花裙女子,苦等三小時終究無緣2026年3月2日

成都人的故事
2026-03-02 14:24:30
美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

悅心知足
2026-02-21 23:03:46
定了!3月起天津?qū)⑷姹l(fā)!迪士尼、漲錢、拆遷、山姆開業(yè)、地鐵延伸線···全是好事!

定了!3月起天津?qū)⑷姹l(fā)!迪士尼、漲錢、拆遷、山姆開業(yè)、地鐵延伸線···全是好事!

天津人
2026-03-02 20:06:48
2026-03-02 23:11:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12213文章數(shù) 176399關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

美記者詢問就伊朗局勢中方會采取什么行動 外交部回應(yīng)

頭條要聞

美記者詢問就伊朗局勢中方會采取什么行動 外交部回應(yīng)

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

手機
家居
游戲
親子
軍事航空

手機要聞

首款機器人手機!榮耀Robot Phone上手:攝像頭竟會跳舞

家居要聞

萬物互聯(lián) 享科技福祉

《寶可夢Pokopia》GS 9分!動森+創(chuàng)世小玩家

親子要聞

12歲前給娃用手機,竟是在親手“毀掉”他?看完這份萬名兒童追蹤研究,脊背發(fā)涼

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進入關(guān)懷版