国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Transformer作者:DeepSeek才有搞頭,OpenAI指望不上了

0
分享至

Jay 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

“閉源人工智能在阻礙我們探索真正的科學(xué)?!?/strong>

說這句話的不是別人,是大名鼎鼎的Transformer發(fā)明者——Ashish Vaswani。



大佬之所以這么說,是因為他覺得OpenAI等閉源廠商被商業(yè)化沖昏了頭腦,沒心思做基礎(chǔ)研究。

在Scaling Law碰壁后,獨角獸們越來越搞不清技術(shù)方向。

迫于投資者壓力,不得不親自下場探索落地場景,更沒精力去搞科研了。

為了填補這塊空白,一路從Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎來巨大轉(zhuǎn)折點——

All in基礎(chǔ)研究,并且堅持要走開源路線。



萬萬沒想到,大佬三遷,只為打造西方世界的DeepSeek。

“我們很樂意成為西方世界的DeepSeek”

2017年,還在Google Brain工作的Vaswani與團隊共同寫出了《Attention Is All You Need》,這篇論文在5年后開啟了如今的GenAI大航海時代。



可惜的是,老東家不太給力,各種條條框框把人束縛得動彈不得,這讓Vaswani心灰意冷。

2022年,他離家出走,與Niki Parmar(Transformer八子之一)和David Luan(當時的Adept CEO)創(chuàng)辦了Adept AI。

可惜好景不長,據(jù)BloomBerg報道,Vaswani在Adept與某位聯(lián)合創(chuàng)始人爆發(fā)了一次嚴重沖突。

這次爭執(zhí)讓他意識到:

  • 只有創(chuàng)立一個完全屬于自己的公司,才能有絕對的自由。

于是2022年底,他再次揮手告別,拉起新團隊創(chuàng)立了Essential AI。



最開始,Essential AI還走的是務(wù)實派路線——主要業(yè)務(wù)就是幫企業(yè)做財務(wù)分析自動化。

結(jié)果,就在今年年初,Vaswani突然對董事會宣布:

放棄公司現(xiàn)有業(yè)務(wù),并將精力全部投入基礎(chǔ)研究。

What???

這不是把商業(yè)模式直接推翻重來嗎?



要知道,對于一家原本服務(wù)于企業(yè)客戶的初創(chuàng)公司來說,這可是一個風(fēng)險性極高的Bet。

出乎意料的是,董事會和資方居然都在一定程度上對Vaswani表示了支持。

參與Essential AI上一輪融資的AMD在采訪中表示:

這個路線確實有點不太尋常,但人工智能領(lǐng)域需要更開放的替代方案。

看來,三次遷居的努力沒有白費,Vaswani終于如愿以償,集結(jié)了一幫理念同頻的大佬。



為商業(yè)化四處奔波的這么多年,與資本和客戶打了無數(shù)次交道,Vaswani真的累了。

驀然回首,在他的精神世界中,其實一直有一塊能承載他一切美好期許的土地,這片伊甸園的名字叫做——開源。

他在Essential官網(wǎng)上寫道:

在教育和醫(yī)療等領(lǐng)域,有真正的科學(xué)需要追求,我們不能讓封閉的人工智能阻礙人類探索這些新方向。

是不是聽著很耳熟,沒錯,Vaswani在與Economics Time的采訪中直接承認了:

“短期內(nèi),我們想要成為西方世界的DeepSeek。”



Vaswani認為,要想推動AI的邊界絕不能靠OpenAI、Anthropic等依靠閉源模式盈利的獨角獸。

在他的設(shè)想里,AI不該只服務(wù)于商業(yè),而是要真正進入教育、醫(yī)療等關(guān)乎大眾的場景,讓普通人也能享受到技術(shù)紅利。

比如,一個偏遠地區(qū)的孩子也能用開源AI上到最好的課;一個小診所也能借助開源工具做出最準確的診斷。

更重要的是,Vaswani可不光是喊口號,Essential在轉(zhuǎn)型后的確下了不少真功夫

提出轉(zhuǎn)型后的不久,2025年4月,Essential AI團隊發(fā)表了一篇題為《Rethinking Reflection in Pre-Training》的論文。

這篇論文提出了一個顛覆性觀點:

大型語言模型的反思能力其實在預(yù)訓(xùn)練階段就開始萌芽。

簡單來說,相較于用RL在后訓(xùn)練打補丁,他們在預(yù)訓(xùn)練中取得了突破,并且這個技術(shù)可能大幅降低訓(xùn)練成本。

要真能成,那對整個開源社區(qū)絕對是大利好。

Vaswani看到了什么?

為什么Vaswani說不能把希望寄托在獨角獸公司身上?

Vaswani擔(dān)心,這些模型性能最優(yōu)異的獨角獸正在阻礙人工智能進步。



有幾家公司關(guān)閉了長期的研發(fā)工作,以便將所有資源用于商業(yè)化,這種現(xiàn)象在市場環(huán)境惡化時更加明顯。

自Scaling Law迎來邊際收益遞減的拐點后,AI獨角獸的產(chǎn)品化傾向已是眾人皆知。

Anthropic做瀏覽器,OpenAI派出著名產(chǎn)品經(jīng)理Kevin Weil…….各大模型廠商紛紛下場,親自探索商業(yè)模式。

這折射出來的一個問題是創(chuàng)新者窘境。

Scaling Law興起后,暴力美學(xué)的砝碼使得AI研究的天平從學(xué)術(shù)機構(gòu)幾乎完全向企業(yè)實驗室傾斜。

不過,產(chǎn)業(yè)界雖壟斷了最稀缺的生產(chǎn)要素,他們真的可以All in創(chuàng)新嗎?

絕大多數(shù)時候不能。因為那可能燒掉幾個億,而且不一定能看到回報。

關(guān)鍵在于,無論公司成立的初衷是什么,創(chuàng)始人最終都得優(yōu)先對投資人負責(zé)。

因此,探索商業(yè)模式和利益最大化是閉源模型的最終歸宿,這從一開始就注定了。

如今,這把熱烈的商業(yè)化之火同樣燒到了硅谷這批天之驕子身上。

今天等著小扎買買買,明天聽說OpenAI搞收購,下個月又去創(chuàng)業(yè)。



△由AI生成

這種節(jié)奏很適合追熱點,但科研不一樣——要搞出突破性的成果,你得花幾年甚至十幾年死磕一個方向。

而頻繁的流動,讓團隊很難靜下心來。

Vaswani嘆息道,這不是科學(xué)應(yīng)有的進步方式。

那Vaswani想要怎么做?開源陣營能夠拯救AI嗎?

老生常談的話題——人多力量大,知識共享才是推動AI技術(shù)發(fā)展的關(guān)鍵動力。

閉源公司雖手握頂級資源和技術(shù)成果,但為了維護投資人的利益,不得不把這些秘密藏起來,以阻礙競爭對手。

但如果有成千上萬的研究者和開發(fā)者一起貢獻代碼,整個生態(tài)齊心協(xié)力,并行推進,也許能克服開源陣營資源匱乏的問題。

當然,開源最重要的問題在于資金來源,畢竟咱不能總靠“用愛發(fā)電”。

對此,Vaswani參考了互聯(lián)網(wǎng)產(chǎn)品的解法

交叉補貼大法好

什么是交叉補貼呢?

這是互聯(lián)網(wǎng)時代很常見的一種商業(yè)模式,典型案例就是瀏覽器:Google搜索對用戶完全免費,取得市場份額后依靠廣告回血。

簡單來說,就是一部分業(yè)務(wù)賺錢,用來補貼另一部分業(yè)務(wù)。



Vaswani對于Essential AI的計劃是這樣的:

先構(gòu)建一個開源的垂直領(lǐng)域模型,這個基座本身不收錢。

但如果有客戶想用這個基座搭建自己的AI,可以向Essential AI購買訓(xùn)練數(shù)據(jù)和相關(guān)產(chǎn)品。

通過這個途徑賺來的錢,正好能用來反哺開源社區(qū)。

這樣,既能保證技術(shù)開放,又能讓公司活下去。



此外,Vaswani還指出閉源不一定代表更高的投資回報率。

雖然閉源模型看起來更容易變現(xiàn),但實際上也面臨巨大的成本壓力。

實際上,如果按照之前科技互聯(lián)網(wǎng)的發(fā)展來看,開源通常是更賺錢的一方,畢竟構(gòu)建起了一整個生態(tài)。

One More Thing

最后,關(guān)于Ashish Vaswani,或許還有一點點可以多說的。



作為《Attention Is All You Need》論文的“一作”,他博士師承的兩位導(dǎo)師,都是華人。

在2011年的南加州大學(xué),有兩名活躍在自然語言處理(NLP)前沿的教授——蔣偉(David Chiang)與黃亮(Liang Huang)。

他倆都是Ashish Vaswani的導(dǎo)師。



△圖左為蔣偉教授,圖右為黃亮教授

蔣偉教授的學(xué)士和碩士均就讀于哈佛大學(xué),后到賓夕法尼亞大學(xué)攻讀博士,他提出的分層短語翻譯模型曾被Google Translate采用。

黃亮教授本科畢業(yè)于上海交通大學(xué)計算機系,同樣是在賓夕法尼亞大學(xué)進修的PhD,主要研究方向是開發(fā)高效算法來加速NLP任務(wù),Vaswani是他指導(dǎo)的第一名博士生。

怎么說呢,雖然Transformer八子里沒有華人作者,但“功勞簿”里,也并非全然沒有華人貢獻。

這實際也是另一個維度的開源之力。AI也好、深度學(xué)習(xí)也好,之所以可以站上浪潮之巔,根本上就在于始終有一個持續(xù)交流、開放互助的生態(tài)環(huán)境。

開源是一種選擇,更是一種精神和信仰。

參考鏈接
[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[6]https://www.essential.ai/
[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
掌權(quán)40年,洪森家族到底賺了多少?他小女兒的奢靡曝光,可見一斑

掌權(quán)40年,洪森家族到底賺了多少?他小女兒的奢靡曝光,可見一斑

明月光
2025-12-17 19:06:45
全部賣完了!中山老板接班22年,親手敗光了幾十億家族資產(chǎn)

全部賣完了!中山老板接班22年,親手敗光了幾十億家族資產(chǎn)

壹只灰鴿子
2025-12-18 21:03:00
1年變6個月?火箭主控恢復(fù)神速!復(fù)出時間出爐:或趕上常規(guī)賽收官

1年變6個月?火箭主控恢復(fù)神速!復(fù)出時間出爐:或趕上常規(guī)賽收官

熊哥愛籃球
2025-12-19 21:11:10
為什么建議買“貴”的衣服?和收入無關(guān),看完穿搭對比,你就明白

為什么建議買“貴”的衣服?和收入無關(guān),看完穿搭對比,你就明白

八分搭配
2025-12-19 22:30:17
實錘了!龐萊臣捐贈藏品果然被拍賣了,一幅畫2014年被拍賣230萬

實錘了!龐萊臣捐贈藏品果然被拍賣了,一幅畫2014年被拍賣230萬

火山詩話
2025-12-19 14:26:47
翁帆新消息傳來,太令人驚喜了

翁帆新消息傳來,太令人驚喜了

深度報
2025-12-18 22:35:44
北京最大奧萊“灣里”今天試營業(yè)!地鐵直達,最全交通攻略請查收→

北京最大奧萊“灣里”今天試營業(yè)!地鐵直達,最全交通攻略請查收→

環(huán)京零距離
2025-12-19 21:26:22
“親爹咋能這么糟蹋閨女?”父親拍下女兒視頻,網(wǎng)友都看不下去了

“親爹咋能這么糟蹋閨女?”父親拍下女兒視頻,網(wǎng)友都看不下去了

妍妍教育日記
2025-12-12 23:15:07
確認了:7級!還有雨夾雪、雪!明天抵達浙江

確認了:7級!還有雨夾雪、雪!明天抵達浙江

環(huán)球網(wǎng)資訊
2025-12-19 17:14:12
中方發(fā)話后,泰國開出停火條件,洪森父子倒向美國,最大輸家已定

中方發(fā)話后,泰國開出?;饤l件,洪森父子倒向美國,最大輸家已定

介知
2025-12-18 14:57:27
勝廣州發(fā)布會!杜鋒不滿領(lǐng)先后松懈,徐杰同理并直指防反擊差!

勝廣州發(fā)布會!杜鋒不滿領(lǐng)先后松懈,徐杰同理并直指防反擊差!

籃球資訊達人
2025-12-19 22:50:28
TA:告別或許臨近,瓜迪奧拉為英超留下了獨一無二的時代

TA:告別或許臨近,瓜迪奧拉為英超留下了獨一無二的時代

懂球帝
2025-12-19 14:05:11
最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

最新!愛潑斯坦案檔案公布前夕,民主黨人再披露68張新照片

環(huán)球網(wǎng)資訊
2025-12-19 09:39:20
冬天這菜使勁吃!一助睡眠,二降肝火,三可排毒,鮮嫩爽口別錯過

冬天這菜使勁吃!一助睡眠,二降肝火,三可排毒,鮮嫩爽口別錯過

秀廚娘
2025-12-17 19:43:07
【史話】真假:毛澤東時代,“南京大屠殺”沒像今天這樣成為熱點

【史話】真假:毛澤東時代,“南京大屠殺”沒像今天這樣成為熱點

年之父
2025-12-16 09:27:37
打擊網(wǎng)絡(luò)詐騙國際會議在曼谷召開

打擊網(wǎng)絡(luò)詐騙國際會議在曼谷召開

財聯(lián)社
2025-12-18 17:05:04
海南剛封關(guān),越南就坐不住了?面對無解“陽謀”,連夜抄作業(yè)!

海南剛封關(guān),越南就坐不住了?面對無解“陽謀”,連夜抄作業(yè)!

貍花小咪
2025-12-19 02:34:06
U18國青邊后衛(wèi)、鄧捷夫、加盟北京國安,博主質(zhì)疑引援策略

U18國青邊后衛(wèi)、鄧捷夫、加盟北京國安,博主質(zhì)疑引援策略

兩兄弟養(yǎng)牛
2025-12-19 22:45:05
2019年,被“港獨”暴徒圍攻,被迫舉槍的光頭警長,后來怎樣了?

2019年,被“港獨”暴徒圍攻,被迫舉槍的光頭警長,后來怎樣了?

知鑒明史
2025-12-18 18:21:51
1980年光緒墓開棺老照片:尸體臉朝下左腿斷裂,毛發(fā)檢測竟藏砒霜

1980年光緒墓開棺老照片:尸體臉朝下左腿斷裂,毛發(fā)檢測竟藏砒霜

抽象派大師
2025-11-26 06:22:16
2025-12-19 23:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11884文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

教育
手機
時尚
家居
數(shù)碼

教育要聞

近期湖北教育重磅利好,對家長們的意義!

手機要聞

曝一加Turbo首發(fā)9000mAh級電池,雙杯齊發(fā)

59天后的春晚,她必是焦點

家居要聞

高端私宅 理想隱居圣地

數(shù)碼要聞

機械大師E06臥式ITX機箱上市:支持200mm長半高顯卡,298元

無障礙瀏覽 進入關(guān)懷版