国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek都把硅谷給整懵了

0
分享至

作者| 高凌朗

編輯| 侯旭

短短一個月內(nèi),中國人工智能初創(chuàng)公司“DeepSeek(深度求索)“連續(xù)發(fā)布兩款重量級模型——DeepSeek-V3、DeepSeek-R1,在全球AI領(lǐng)域掀起軒然大波。

據(jù)AI評估網(wǎng)站Chatbot Arena最新數(shù)據(jù),1月20日開源的DeepSeek-R1在綜合榜單上排名第三,與頂尖推理模型GPT-4o并列。更令人關(guān)注的是,在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)領(lǐng)域,DeepSeek-R1更是力壓群雄,登頂榜首。

AI分析平臺Artificial-Analysis的基準(zhǔn)測試結(jié)果也顯示,DeepSeek-R1的AI分析質(zhì)量指數(shù)居全球第二,而API定價僅為GPT-4o的三十分之一。

一系列數(shù)據(jù)立即引發(fā)硅谷震動,Scale AI創(chuàng)始人Alexander Wang在1月24日接受采訪時坦言,DeepSeek的表現(xiàn)與美國最頂尖模型不相上下。

在此背景下,剛剛宣布將投資650億美元擴建數(shù)據(jù)中心的Meta也被卷入輿論中心。匿名職場社區(qū)teamblind傳出消息:Meta內(nèi)部工程師正在緊急分析DeepSeek的技術(shù)方案。

整個硅谷之所以變得如此緊張,正是因為DeepSeek重新定義了大模型領(lǐng)域的一條規(guī)則:打造一流AI模型,未必需要天價投入。

DeepSeek成立于2023年7月17日,其根源可追溯至成立于2012年的對沖基金公司—幻方量化。該公司團隊成員80%以上畢業(yè)于國內(nèi)外頂尖高校,專注于量化投資領(lǐng)域,通過機器學(xué)習(xí)和高頻交易策略管理約80億美元資產(chǎn)。

幻方量化及其重視技術(shù)研發(fā),先后投資12億元打造"螢火一號"和"螢火二號"深度學(xué)習(xí)平臺,擁有超過1萬張英偉達A100芯片的強大算力儲備。這一雄厚的硬件基礎(chǔ)為DeepSeek的研發(fā)提供了強有力支撐。

幻方量化創(chuàng)始人梁文鋒畢業(yè)于浙江大學(xué)信息與電子工程專業(yè),在量化金融與機器學(xué)習(xí)領(lǐng)域深耕多年。他于2020年帶領(lǐng)核心技術(shù)團隊獨立創(chuàng)辦DeepSeek,專注AI大模型研發(fā),并于2023年11月推出首款產(chǎn)品DeepSeekCoder,為后續(xù)技術(shù)創(chuàng)新奠定基礎(chǔ)。

與行業(yè)普遍"砸算力"的做法不同,DeepSeek沒有盲目追求參數(shù)規(guī)模,而是專注于提升訓(xùn)練效率。

DeepSeek團隊采用稀疏的Mixture of Experts(MoE)架構(gòu),僅激活5%~10%的專家網(wǎng)絡(luò)單元,顯著降低了計算資源消耗。

同時,團隊大膽采用FP8混合精度訓(xùn)練,進一步優(yōu)化了顯存占用和計算效率。這些技術(shù)創(chuàng)新讓DeepSeek實現(xiàn)了低成本高性能的突破。

說人話就是:DeepSeek的思路更加精打細(xì)算,就像把普通家用車改裝成賽車,用更少的錢實現(xiàn)更好的表現(xiàn)。

2024年12月26日,DeepSeek推出了擁有6710億參數(shù)、14.8萬億高質(zhì)量token的V3模型。相比之下,業(yè)內(nèi)流傳GPT-4o的模型參數(shù)約為2000億(未經(jīng)Open AI證實)。

最關(guān)鍵的是,DeepSeek-V3僅以557.6萬美元的訓(xùn)練成本和280萬個GPU小時的計算需求,就達到了與頂尖模型媲美的性能。

另外,DeepSeek-V3的API服務(wù)價格為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。這一價格遠(yuǎn)低于GPT-4o等頭部模型。

據(jù)統(tǒng)計,僅在2024年12月的最后6天,DeepSeek的訪問量就暴增164%,達到1180萬次。

2025年1月20日,DeepSeek再次發(fā)布DeepSeek-R1模型引爆科技圈,該模型的核心突破在于其獨特的技術(shù)路徑。

根據(jù)DeepSeek最新發(fā)布的技術(shù)白皮書,R1-Zero采用了一種前所未有的"純"強化學(xué)習(xí)方法,完全拋開了預(yù)設(shè)的思維鏈模板和監(jiān)督式微調(diào),僅依靠簡單的獎懲信號來優(yōu)化模型行為。

在AIME數(shù)學(xué)競賽中,R1-Zero從最初的15.6%正確率一路攀升至71.0%。更令人驚訝的是,當(dāng)模型對同一問題進行多次嘗試時,準(zhǔn)確率更是達到了86.7%。在編程領(lǐng)域,模型在Codeforces評測中達到2441分的水平,超過了96.3%的人類參與者。

除了上文所述通過MoE以及FP8混合進度訓(xùn)練外。DeepSeek-R1還遵循MIT License,允許用戶通過蒸餾技術(shù)借助R1訓(xùn)練其他模型。如此一來,R1模型將大幅減少對人類反饋強化學(xué)習(xí)的依賴,進一步降低了成本。

要知道,現(xiàn)有的人工智能公司在訓(xùn)練過程中,必須掌握大量算力儲備,而算力的背后自然是資金支持。因此,行業(yè)投資者們紛紛驚醒,開始質(zhì)疑傳統(tǒng)AI公司高額投入的必要性。

據(jù)Noah's Arc資本管理公司分析,DeepSeek的模型可能徹底改變AI訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。特別是在OpenAI的"星際之門"計劃公布5000億美元投資預(yù)算的背景下,DeepSeek的低成本高效能更顯示出其戰(zhàn)略價值。

DeepSeek的成功正在催生AI產(chǎn)業(yè)發(fā)展模式的變化。根據(jù)中國信息通信研究院的白皮書,全球AI大語言模型數(shù)量已達1328個,其中36%來自中國,使中國成為僅次于美國的第二大AI技術(shù)貢獻國。

諾貝爾獎得主、"AI教父"杰弗里·辛頓在2025年1月接受采訪時指出,中國在STEM教育方面的優(yōu)勢將為AI發(fā)展提供堅實基礎(chǔ)。

根據(jù)之前的行業(yè)預(yù)測顯示,到2027年,最大型模型的訓(xùn)練成本將超過10億美元。Gartner預(yù)計,到2028年主要科技巨頭在AI服務(wù)器上的支出將達到5000億美元。

在這一背景下,DeepSeek的低成本方案引發(fā)了對傳統(tǒng)發(fā)展路徑的反思。同時,來自地緣、監(jiān)管、資本等多方面的因素也正在給硅谷施加壓力。

加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta認(rèn)為,DeepSeek的成功表明"AI能力沒有護城河",中國龐大的系統(tǒng)工程師人才庫正在幫助企業(yè)更高效地利用計算資源。

事實上,這種發(fā)展趨勢已經(jīng)開始影響資本市場。

在DeepSeek-R1引發(fā)熱議后,作為“AI石油”的英偉達股價于今年1月24日下跌3.12%。

我們認(rèn)為,如果低成本、高性能的開源模型成為主流,可能會扭轉(zhuǎn)美國公司在AI領(lǐng)域的技術(shù)優(yōu)勢和估值體系。

需要注意的是,在大模型領(lǐng)域逐漸封閉的背景下,DeepSeek選擇了開源模型并公開技術(shù)報告的差異化路線。

這一決策雖然贏得了開發(fā)者們的廣泛贊譽,但是開源策略也意味著技術(shù)優(yōu)勢難以形成壁壘,競爭對手可以輕易復(fù)制其模式,這可能會削弱DeepSeek在未來商業(yè)競爭中的優(yōu)勢地位。

另外,由于DeepSeek團隊更偏重技術(shù)路線,其模型在數(shù)學(xué)、代碼等特定領(lǐng)域表現(xiàn)突出,但在知識問答及長文本處理等多樣化場景方面可能存在不足。

不管怎樣,DeepSeek讓AI大模型產(chǎn)業(yè)看到了一個新的方向,這也是這兩天AI行業(yè)的興奮所在。

歡迎關(guān)注我們的其他賬號

關(guān)注下方備用號,防止失聯(lián)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
尾盤操作思路:A股大跳水!是走是留一句話告訴你!

尾盤操作思路:A股大跳水!是走是留一句話告訴你!

龍行天下虎
2026-01-14 14:42:14
造成毛岸英犧牲的罪魁禍?zhǔn)祝屆飨春薜米锶?,他們下場如何?>
    </a>
        <h3>
      <a href=風(fēng)笛悠揚聲
2025-12-04 10:08:06
日本米價再創(chuàng)新高,每公斤38.8元,民眾不得已把主食改為面條

日本米價再創(chuàng)新高,每公斤38.8元,民眾不得已把主食改為面條

極目新聞
2026-01-13 10:19:55
通報!胡娟被查

通報!胡娟被查

萊蕪福禧今日信息
2026-01-14 06:31:54
看了這張和劉亦菲、李沁的合影,李念是不是隱退的太早了?

看了這張和劉亦菲、李沁的合影,李念是不是隱退的太早了?

木子愛娛樂大號
2026-01-14 13:57:20
趙露思透明襯衫惹火!吊帶下的雪肌蜂腰,這身材太頂了?

趙露思透明襯衫惹火!吊帶下的雪肌蜂腰,這身材太頂了?

娛樂領(lǐng)航家
2026-01-12 22:00:03
迷你攻導(dǎo)演被男網(wǎng)紅害了!歪嘴小花隨時催吐!

迷你攻導(dǎo)演被男網(wǎng)紅害了!歪嘴小花隨時催吐!

八卦瘋叔
2026-01-14 12:09:09
幻方量化去年收益率56.6%,為DeepSeek提供超級彈藥

幻方量化去年收益率56.6%,為DeepSeek提供超級彈藥

21世紀(jì)經(jīng)濟報道
2026-01-14 10:09:29
A股:大家做好心理準(zhǔn)備,明天(1月15日),股市很可能大幅高開?

A股:大家做好心理準(zhǔn)備,明天(1月15日),股市很可能大幅高開?

財經(jīng)大拿
2026-01-14 11:15:55
表現(xiàn)越來越掙扎了!火箭探花郎的特點似乎完全沒辦法發(fā)揮出來?

表現(xiàn)越來越掙扎了!火箭探花郎的特點似乎完全沒辦法發(fā)揮出來?

稻谷與小麥
2026-01-14 14:37:54
還未登上訪華專機,卡尼先對特朗普交底:不許奪島,中國搬出憲章

還未登上訪華專機,卡尼先對特朗普交底:不許奪島,中國搬出憲章

墨印齋
2026-01-14 13:17:48
牡丹花下死!46歲"縱欲過度"的蕭亞軒,終是為自己行為買了單

牡丹花下死!46歲"縱欲過度"的蕭亞軒,終是為自己行為買了單

小樾說歷史
2026-01-13 14:19:49
汪峰女兒10歲變身小作家,驚艷外貌令人震驚!

汪峰女兒10歲變身小作家,驚艷外貌令人震驚!

舞指飛揚
2026-01-14 09:40:34
特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執(zhí)行死刑的

特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執(zhí)行死刑的

博覽歷史
2025-07-21 17:59:30
柬埔寨街頭“狗籠運活人”視頻瘋傳,警方:與人口販運無關(guān)

柬埔寨街頭“狗籠運活人”視頻瘋傳,警方:與人口販運無關(guān)

紅星新聞
2026-01-13 13:34:29
人真的好脆弱,網(wǎng)友:我最好的朋友去長白山滑雪腦出血去世了!

人真的好脆弱,網(wǎng)友:我最好的朋友去長白山滑雪腦出血去世了!

夜深愛雜談
2026-01-13 21:36:54
1972年,毛主席當(dāng)眾指著她鼻子罵:你男人跟別人好了,你怎么不離婚?

1972年,毛主席當(dāng)眾指著她鼻子罵:你男人跟別人好了,你怎么不離婚?

寄史言志
2026-01-07 21:08:15
跨年夜西安莎莎舞奇遇:簡愛擠成肉夾饃紅河谷難尋落腳地

跨年夜西安莎莎舞奇遇:簡愛擠成肉夾饃紅河谷難尋落腳地

成都人的故事
2026-01-14 12:05:02
吉達聯(lián)合主席:我們曾為梅西提供年薪14億歐合同,但他拒絕了

吉達聯(lián)合主席:我們曾為梅西提供年薪14億歐合同,但他拒絕了

懂球帝
2026-01-14 06:04:47
沉寂24小時后,特朗普主動放人,中國軍艦出動,釋放的信號不簡單

沉寂24小時后,特朗普主動放人,中國軍艦出動,釋放的信號不簡單

安珈使者啊
2026-01-14 14:20:34
2026-01-14 15:00:49
傳播體操 incentive-icons
傳播體操
每個互聯(lián)網(wǎng)人都該看看。
91文章數(shù) 19關(guān)注度
往期回顧 全部

科技要聞

美國批準(zhǔn)英偉達H200賣給中國,但有條件

頭條要聞

牛彈琴:全世界都在靜靜等待 一場戰(zhàn)爭可能很快到來

頭條要聞

牛彈琴:全世界都在靜靜等待 一場戰(zhàn)爭可能很快到來

體育要聞

牛津?qū)W霸買下兒時主隊,讓它成為英超黑馬

娛樂要聞

何晴去世30天,許亞軍終于發(fā)聲

財經(jīng)要聞

姚振華舉報:觀致汽車資產(chǎn)被低價拍賣

汽車要聞

曝Model Y或降到20萬以內(nèi)!

態(tài)度原創(chuàng)

藝術(shù)
親子
數(shù)碼
本地
公開課

藝術(shù)要聞

八大山人『山水花鳥冊』

親子要聞

“為什么媽媽明明很愛我 卻一到輔導(dǎo)作業(yè)的時候就很兇”媽媽也在學(xué)著怎么去當(dāng)媽媽

數(shù)碼要聞

AMD銳龍AI 400上市時間定了!1月22日開售:比Intel早幾天搶市場

本地新聞

云游內(nèi)蒙|到巴彥淖爾去,赴一場塞上江南的邀約

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版