国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

別急著All-in DeepSeek V4,先看看這10位從業(yè)者的真心話

0
分享至

文|周鑫雨 王毓嬋

編輯|楊軒

解讀DeepSeek V4的技術(shù)報(bào)告,是這幾天AI行業(yè)最狂熱的集體活動(dòng)。

V4很強(qiáng)嗎?在工程優(yōu)化的維度中,答案是毋庸置疑的。過去,大家信奉“Scaling Law的暴力美學(xué)”——也就是靠堆更多優(yōu)質(zhì)算力、更大參數(shù)規(guī)模來提升模型性能。而V4走的是一條完全不同的路,它定義了一種“模型訓(xùn)練的克制美學(xué)”:

它不靠瘋狂堆算力和參數(shù),而是通過一系列組合優(yōu)化和重構(gòu):

注意力機(jī)制(讓模型學(xué)會(huì)“抓重點(diǎn)”,像人讀長文章時(shí)會(huì)自動(dòng)關(guān)注關(guān)鍵句子一樣)

MoE架構(gòu)(混合專家模型,可以理解為“讓不同的專家負(fù)責(zé)不同類型的問題,每次只激活少數(shù)專家,省時(shí)又省力”)

后訓(xùn)練(模型初步練成后再針對(duì)性地補(bǔ)課強(qiáng)化)

推理系統(tǒng)工程(優(yōu)化實(shí)際運(yùn)行時(shí)各個(gè)環(huán)節(jié)的效率)

這樣做的成果是把V4-Pro在處理百萬Token(大約幾十萬字)長上下文時(shí)需要的算力,壓低到了上一代V3.2的27%,同時(shí)用來臨時(shí)存儲(chǔ)對(duì)話上下文的KV緩存(可以理解為模型在跟你聊天時(shí)“記筆記”的草稿紙)被壓縮到了原來的10%。

不過,工程只是工程,榜單只是榜單。

評(píng)價(jià)一個(gè)模型,我們不希望只停留在紙面參數(shù)上,而是放到部署、開發(fā)、投資的真實(shí)場(chǎng)景中去討論V4的價(jià)值。為此,我們邀請(qǐng)了近10名開發(fā)者、應(yīng)用創(chuàng)業(yè)者和投資人,進(jìn)行了三天左右的體驗(yàn)和測(cè)試。

先說一個(gè)反直覺的結(jié)論:DeepSeek對(duì)應(yīng)用層帶來的影響,或許比模型層更大。

在驚嘆極致的工程優(yōu)化之余,正如DeepSeek自己在V4技術(shù)報(bào)告中坦言的那樣:發(fā)展軌跡大約滯后前沿閉源模型3至6個(gè)月——V4如今的成果,就好比與魔鬼做交易:拉長了推理和Agent(智能體)能力的長板,代價(jià)是犧牲了部分準(zhǔn)確性。

閉源模型廠商們,暫時(shí)可以松一口氣。對(duì)于注重穩(wěn)定、精確的商業(yè)世界而言,V4顯然不是一款能夠直接落地的模型。

Pine AI首席科學(xué)家李博杰,以及某頭部Coding Agent創(chuàng)業(yè)者Chillin都對(duì)我們直言,工具調(diào)用穩(wěn)定性+幻覺率,這兩點(diǎn)必須在harness(給智能體套上的“韁繩”和“安全帶”,用來規(guī)范它的行為、降低出錯(cuò)風(fēng)險(xiǎn))層面補(bǔ)足,V4落地離不開“腳手架”。

但智力大腦的迭代方向,往往牽動(dòng)著下游應(yīng)用的生態(tài)。AI應(yīng)用創(chuàng)業(yè),將會(huì)面對(duì)技術(shù)和資本更嚴(yán)厲的雙重考驗(yàn)。

“基模的性能還在快速迭代”——這句業(yè)內(nèi)的共識(shí),也意味著應(yīng)用隨時(shí)可能成為被模型顛覆的沙礫。一名雙幣基金的投資人舉了不少“昨日黃花”的案例:“Workflow、Coding……”

AI應(yīng)用公司“涌躍智能”創(chuàng)始人兼CEO陳煒鵬總結(jié):未來,AI應(yīng)用的壁壘,是把模型、Agent、產(chǎn)品場(chǎng)景和數(shù)據(jù)反饋組織成一個(gè)可靠、低成本、可規(guī)?;纳a(chǎn)系統(tǒng)。

亮點(diǎn):不只有長文本和編程能力,而是高能力還成本低寫在前面:核心優(yōu)勢(shì)——代碼與智能體能力

在幾個(gè)關(guān)鍵的代碼和軟件工程評(píng)測(cè)中,V4-Pro展現(xiàn)出了當(dāng)前開源模型的最高水平,與頂尖閉源模型幾乎不相上下。我們把核心數(shù)據(jù)整理如下:


AI制圖

?PingCAP聯(lián)合創(chuàng)始人兼CTO 黃東旭

我正在把自己的Hermes工作流遷移到DeepSeek V4上。原來我用得比較浪費(fèi),是用Claude Opus和GPT5.4來做Agent,但后來我發(fā)現(xiàn),大多數(shù)日常工作其實(shí)并不需要特別高的coding能力。

日常辦公任務(wù),主要包括:(a)日常郵件整理;(b)文章撰寫;(c)日歷管理;(d)內(nèi)容總結(jié);(e)網(wǎng)絡(luò)瀏覽。

現(xiàn)在我已經(jīng)完全切換到DeepSeek V4了。它的效果比我想象中要好,可能是針對(duì)中文做了一些優(yōu)化,整體語言能力比Opus和GPT更符合中文母語者的使用習(xí)慣。

所以我第一個(gè)結(jié)論是:如果你現(xiàn)在正在用一些更貴的模型來作為日常工作助理的Agent,其實(shí)可以比較放心地切換到DeepSeek V4 Pro上。

它的能力大概在Claude Sonnet 4.5到4.6的水平,但價(jià)格只有頭部模型的四分之一還不到?,F(xiàn)在我基本上已經(jīng)不用再關(guān)注Agent的成本開銷了。

DeepSeek V4的論文里一直在強(qiáng)調(diào)1M的上下文,但這點(diǎn)我其實(shí)感覺不是太強(qiáng),因?yàn)楝F(xiàn)在主流的SOTA模型基本上至少也都是1M的上下文了,這只是追趕上了。

它真正的點(diǎn)在于:

1.成本真的非常低;

2.它是一個(gè)開放開源的模型。

我不用太擔(dān)心Anthropic或者OpenAI如果斷供,我之前的一些工作流就不能用了,這種事情之前其實(shí)發(fā)生過。在這一點(diǎn)上,切到DeepSeek V4,安全感是更高的。

其次,看編程能力。因?yàn)闇y(cè)試時(shí)間還比較短,我還沒有用它來開發(fā)非常復(fù)雜的大型系統(tǒng)應(yīng)用。

但在大概幾千行代碼的規(guī)模,或者做一些小型應(yīng)用,以及處理充滿各種外部第三方系統(tǒng)調(diào)用的場(chǎng)景(比如去Supabase或者TiDB Cloud上,通過閱讀文檔去接入一個(gè)它不太熟悉的工具),目前我的體感是基本上沒有出現(xiàn)太大的問題。

在幾千到一萬行的規(guī)模里,V4 one-shot(一次性給足例子和指令,不額外調(diào)試)的成功率還是比較高的。

所以如果你只是做一些簡(jiǎn)單的小網(wǎng)站或者小型應(yīng)用,我覺得DeepSeek的編程能力肯定比前一代要強(qiáng)非常多。

因?yàn)楝F(xiàn)在我的Harness框架其實(shí)并沒有太復(fù)雜的人為編排,更多是依靠模型自身的協(xié)同能力(使用Slock.ai)。

簡(jiǎn)單來說,有以下兩點(diǎn):

1.它能夠跟使用其他模型的Agent進(jìn)行協(xié)同;

2.它完成一些簡(jiǎn)單的/具體的任務(wù)。

所以,如果前面有一些比較強(qiáng)的模型(例如像GPT5.5這種級(jí)別的)去給DeepSeek V4 Pro指方向,然后讓它負(fù)責(zé)執(zhí)行,這種模式我覺得能讓整個(gè)Harness Engineering的成本大幅下降。

?零一萬物技術(shù)與產(chǎn)品中心副總裁 趙斌強(qiáng)

DeepSeek V4不是“最全能的”,但它是“最值得信賴的”——堅(jiān)定的開源承諾、完整的技術(shù)報(bào)告、極低的推理成本、全技術(shù)棧國產(chǎn)化,讓它成為ToB(面向企業(yè))場(chǎng)景下性價(jià)比最優(yōu)的基礎(chǔ)模型選擇。

DeepSeek V4最讓我驚艷的是兩件事。

第一,模型架構(gòu)的底層創(chuàng)新。在100萬Token上下文窗口下依然保持高質(zhì)量推理能力,背后是混合注意力機(jī)制的底層創(chuàng)新。這種機(jī)制可以通俗地理解成:“粗讀”著眼大局整體含義,“精讀”精確理解細(xì)節(jié)。

尤其是在Context壓縮方面的探索非常先進(jìn),而且DeepSeek在技術(shù)報(bào)告中毫無保留地公開了細(xì)節(jié)。這種坦誠和開源精神,在競(jìng)爭(zhēng)激烈的大模型行業(yè)中極為寶貴。

第二,國產(chǎn)算力全棧適配。DeepSeek完成了華為昇騰910B/950的適配,在量化、稀疏化機(jī)制、領(lǐng)域expert優(yōu)化等方面的工作做得非常細(xì)致。

這意味著從芯片到底層軟件到模型訓(xùn)練、推理,國產(chǎn)全棧解決方案已在正確的方向上邁出了實(shí)質(zhì)性一步。雖不能說完全擺脫對(duì)英偉達(dá)生態(tài)的依賴,但已經(jīng)找到了正確的發(fā)展方向。這件事的難度和意義,怎么強(qiáng)調(diào)都不為過。

Pine AI首席科學(xué)家 李博杰

最驚艷的是DeepSeek把MoE、CSA+HCA混合注意力、mHC、Muon、FP4QAT這一長串架構(gòu)創(chuàng)新真正在1.6T(1.6萬億參數(shù))這個(gè)目前最大開源規(guī)模上跑通了。

這就像把一堆理論上很先進(jìn)、但在小規(guī)模實(shí)驗(yàn)里經(jīng)常失效的技術(shù),成功組合到一臺(tái)巨型引擎上并穩(wěn)定運(yùn)轉(zhuǎn)起來。我們自己試過20多種架構(gòu)創(chuàng)新,結(jié)論幾乎都是“在70億參數(shù)規(guī)模上可行,一上規(guī)模就掉鏈子甚至反作用”。

其他家的模型架構(gòu)創(chuàng)新大多也卡在這一步。能在最大規(guī)模上讓多項(xiàng)創(chuàng)新協(xié)同工作,說明DeepSeek底層訓(xùn)練的技術(shù)積累極深,僅其中一項(xiàng)“mHC”技術(shù),就把原來在27B實(shí)驗(yàn)里近3000倍的信號(hào)放大,壓到了約1.6倍,讓訓(xùn)練變得穩(wěn)定可控。

?聯(lián)想集團(tuán)副總裁,聯(lián)想創(chuàng)投首席投資官、高級(jí)合伙人 宋春雨

DeepSeek證明了“AI性價(jià)比”可以成為一種主動(dòng)設(shè)計(jì)出的結(jié)構(gòu)性優(yōu)勢(shì)。

27%、顯存占用僅10%。同時(shí),其1.6T總參數(shù)量大,但每次僅激活49B參數(shù),效率極高。

這種結(jié)構(gòu)性降本,再加上V4-Flash版本API 1元/百萬Token的低價(jià)策略,使得“平民化超長上下文”成為了AI應(yīng)用的新基準(zhǔn)。

涌躍智能創(chuàng)始人兼CEO 陳煒鵬

DeepSeek V4最讓我振奮的,不只是某個(gè)單點(diǎn)能力的提升,而是它說明國內(nèi)大模型已經(jīng)從“追趕基座能力”,進(jìn)入到“參與Agent時(shí)代系統(tǒng)競(jìng)爭(zhēng)”的階段。

過去大家更關(guān)心模型會(huì)不會(huì)回答、推理、寫代碼;但到了今天,真正重要的是模型能不能在復(fù)雜任務(wù)中穩(wěn)定完成目標(biāo),能不能以足夠低的成本、足夠高的效率接入真實(shí)產(chǎn)品系統(tǒng)。

遺憾:真正落地,V4還缺一些“腳手架”寫在前面:相對(duì)劣勢(shì)——事實(shí)性知識(shí)與極端復(fù)雜推理

DeepSeek官方和各評(píng)估平臺(tái)指出了V4-Pro的幾個(gè)明顯弱點(diǎn)。為了更直觀,我們將關(guān)鍵弱項(xiàng)數(shù)據(jù)整理成下表:


AI制圖。

?Pine AI首席科學(xué)家 李博杰

我主要使用的是代碼類和Agentic任務(wù)。這一類工作里:

V4-Pro的工具調(diào)用能力和通用世界知識(shí),基本追平了前沿模型的次一檔版本(大致相當(dāng)于Claude 4.6 Sonnet水平);

但工具調(diào)用穩(wěn)定性+幻覺率仍然是硬傷——這兩點(diǎn)必須在Agent Harness層面補(bǔ)足(比如加強(qiáng)校驗(yàn)、失敗后自動(dòng)重試、用外部知識(shí)庫讓模型“接地氣”、把工具使用規(guī)范定得嚴(yán)格清晰),否則在長鏈條任務(wù)里,任務(wù)鏈路一拉長,錯(cuò)誤就會(huì)被不斷放大;

一旦Harness層補(bǔ)好了這兩個(gè)缺陷,整體推理成本能比前沿模型低好幾倍。這才是真正的杠桿。

另一條線是:V4-Flash作為垂直微調(diào)的“甜點(diǎn)”是非常好的。什么叫垂直微調(diào)?就是在通用模型基礎(chǔ)上,用特定領(lǐng)域的專業(yè)數(shù)據(jù)再“補(bǔ)課”,讓它成為某個(gè)行業(yè)的專家。

1.6萬億參數(shù)的超大模型做后訓(xùn)練(SFT/RL)成本太高,一般公司根本負(fù)擔(dān)不起,而2000億到3000億參數(shù)的模型才是市場(chǎng)做后訓(xùn)練的主力尺寸。我們之前在千問235B(2350億參數(shù))上做后訓(xùn)練,效果明顯弱于同尺寸的V4-Flash。

Flash的性能已經(jīng)追上前一代萬億級(jí)開源模型,超過600B多的DeepSeek V3.2和老版Kimi。Flash會(huì)成為做業(yè)務(wù)微調(diào)的首選基座。

?Coding Agent創(chuàng)業(yè)者 Chillin

我們內(nèi)部測(cè)評(píng)后得出的結(jié)論是:在Coding Agent場(chǎng)景下,DeepSeek V4是Claude一年多前的水平。

問題可能出現(xiàn)在兩方面,一是參數(shù)規(guī)模,二是數(shù)據(jù)。DeepSeek和Anthropic還有比較顯著的差距。

如果要真正落地,DeepSeek V4還需要一些特殊的腳手架,比如SWE-Agent(軟件工程智能體)、OpenHands(一個(gè)開源Coding智能體)、Claude Code、OpenClaw。這都需要開發(fā)者額外配置。

?涌躍智能創(chuàng)始人兼CEO 陳煒鵬

以Loopit(涌躍智能旗下的AI互動(dòng)內(nèi)容產(chǎn)品)的實(shí)際使用(主要是Coding場(chǎng)景)來看,要客觀看到,DeepSeek V4在執(zhí)行復(fù)雜長程任務(wù)的穩(wěn)定性和任務(wù)完成率上,距離海外最強(qiáng)閉源模型仍有差距。

國內(nèi)頭部模型之間的能力差異在變小。這說明模型競(jìng)爭(zhēng)正在進(jìn)入一個(gè)新階段:在Agent時(shí)代,模型能否理解長上下文、適應(yīng)復(fù)雜框架、穩(wěn)定完成長程任務(wù),并以可接受的成本和速度運(yùn)行,會(huì)變得同樣重要。

真正拉開差距的,不只是模型本身,而是模型、后訓(xùn)練、Agent框架、評(píng)估體系和工程效率形成的整體系統(tǒng)。

?聯(lián)想集團(tuán)副總裁,聯(lián)想創(chuàng)投首席投資官、高級(jí)合伙人 宋春雨

V4的發(fā)布沒有包含原生多模態(tài)版本(即同時(shí)能處理文字、圖像、聲音等的模型),這在當(dāng)前市場(chǎng)環(huán)境下稍顯遺憾。

但結(jié)合其全面擁抱國產(chǎn)算力的戰(zhàn)略,這很可能是為了集中資源攻克最核心的算力底座問題而做出的階段性取舍。

?零一萬物技術(shù)與產(chǎn)品中心副總裁 趙斌強(qiáng)

說“不及預(yù)期”有點(diǎn)雞蛋里挑骨頭。

但如果從ToC(面向個(gè)人用戶)角度來看,產(chǎn)品化打磨還不夠——Flash版本涉及創(chuàng)作、編程等復(fù)雜任務(wù),能力略顯不足;Pro版本雖然接近頂級(jí)閉源模型水準(zhǔn),但起步算力要求較高,存在入門門檻。

影響:AI并不是簡(jiǎn)單地越來越便宜?涌躍智能創(chuàng)始人兼CEO 陳煒鵬

一個(gè)重要趨勢(shì)是,AI并不是簡(jiǎn)單地越來越便宜。

全球最旗艦?zāi)P偷恼{(diào)用成本其實(shí)在上升,因?yàn)樗鼈兂休d的是更高復(fù)雜度、更長上下文、更高價(jià)值的任務(wù)。真正快速變便宜的,是中層模型、開源模型和可自部署模型。

所以未來應(yīng)用公司不會(huì)只問“哪個(gè)模型最強(qiáng)”,而是要建立一套模型調(diào)度系統(tǒng):哪些任務(wù)必須用最強(qiáng)模型,哪些任務(wù)可以用高性價(jià)比模型,哪些能力可以通過Agent框架和工程系統(tǒng)補(bǔ)足。

DeepSeek V4的意義在于,它進(jìn)一步豐富了模型供給層。

對(duì)企業(yè)來說,它不是簡(jiǎn)單替代某一個(gè)海外模型,而是讓應(yīng)用可以更靈活地做多模型編排、自部署和成本優(yōu)化。

未來AI應(yīng)用的壁壘,也不會(huì)是簡(jiǎn)單調(diào)用一個(gè)模型,而是把模型、Agent、產(chǎn)品場(chǎng)景和數(shù)據(jù)反饋組織成一個(gè)可靠、低成本、可規(guī)?;纳a(chǎn)系統(tǒng)。

對(duì)Loopit來說,這個(gè)趨勢(shì)非常關(guān)鍵。我們做的是AI互動(dòng)內(nèi)容,模型能力決定創(chuàng)作上限,成本和速度決定創(chuàng)作能否規(guī)?;?。

只有當(dāng)不同層級(jí)的模型都足夠可用,并且能夠被有效編排,普通用戶的大量創(chuàng)意才有可能被實(shí)時(shí)生成、互動(dòng)和傳播。DeepSeek V4的進(jìn)展,會(huì)加速這個(gè)過程。

?Pine AI首席科學(xué)家 李博杰

在垂直微調(diào)市場(chǎng),千問、Llama等200-300B檔基座被V4-Flash系統(tǒng)性替換。

所有做該尺寸后訓(xùn)練的團(tuán)隊(duì)都會(huì)重新評(píng)測(cè);Flash同尺寸效果反超、推理框架Day-0適配齊全(SGLang/vLLM/TileLang),6個(gè)月內(nèi)會(huì)成為國內(nèi)開源垂直模型的默認(rèn)起點(diǎn)。

華為昇騰950 SuperNode推理生態(tài)正式起步,并沖擊英偉達(dá)芯片溢價(jià)。

這是第一個(gè)完整跑通的“國產(chǎn)芯+國產(chǎn)頂級(jí)開源模型”方案(NVIDIA/AMD都沒拿到V4的早期適配),下半年950大規(guī)模出貨后,Agent長上下文場(chǎng)景里會(huì)出現(xiàn)一波純本土推理替換;

這間接影響是英偉達(dá)在中國市場(chǎng)的估值與溢價(jià)被重新定價(jià)——不是銷量崩,是議價(jià)能力被壓。

能完成復(fù)雜長程任務(wù)的Agent整體使用成本大幅下降。

V4-Pro輸入(緩存未命中)1.74美元/輸出3.48美元+1M上下文高效KV+MegaMoE已經(jīng)把單Token成本壓到前沿模型的1/6-1/7;

只要業(yè)界在Agent Harness層把V4的工具調(diào)用穩(wěn)定性和幻覺率補(bǔ)齊(驗(yàn)證器、外部接地、嚴(yán)格Schema、自一致性投票),那些過去因?yàn)槌杀緹o法實(shí)用化的多步研究、長程代碼Agent、深度搜索類應(yīng)用會(huì)在今年下半年走出demo進(jìn)入真實(shí)業(yè)務(wù),Agent經(jīng)濟(jì)性的拐點(diǎn)就在這一波。

以及,閉源前沿廠商不會(huì)因此降價(jià)——它們的產(chǎn)品仍然顯著領(lǐng)先,V4不構(gòu)成定價(jià)壓力。

?零一萬物技術(shù)與產(chǎn)品中心副總裁 趙斌強(qiáng)

ToB AI應(yīng)用的核心命題是:在保證效果的前提下實(shí)現(xiàn)全周期的成本控制。DeepSeek V4的出現(xiàn)為這一命題提供了極具競(jìng)爭(zhēng)力的解法。

Flash覆蓋簡(jiǎn)單任務(wù),Pro覆蓋高復(fù)雜度場(chǎng)景,整體成本相比主流閉源方案會(huì)大幅降低,讓零一萬物在交付時(shí)能夠顯著提升方案性價(jià)比。

更重要的是,DeepSeek的開源是堅(jiān)定的、不搖擺的,不會(huì)突然宣布閉源讓應(yīng)用的投入打水漂。這種堅(jiān)定的開源姿態(tài)為企業(yè)級(jí)技術(shù)選型提供了寶貴的確定性。

零一萬物內(nèi)部已經(jīng)全面啟動(dòng)基于DeepSeek V4的產(chǎn)品評(píng)測(cè)與能力驗(yàn)證,重點(diǎn)評(píng)估其在生產(chǎn)調(diào)度、智能辦公、投資管理等企業(yè)核心場(chǎng)景中的表現(xiàn),驗(yàn)證達(dá)標(biāo)后會(huì)考慮替換原有模型,讓更多行業(yè)客戶用上頂級(jí)國產(chǎn)大模型。

V4發(fā)布后,我認(rèn)為行業(yè)會(huì)主要產(chǎn)生三個(gè)變化:

1.國產(chǎn)全技術(shù)棧解決方案進(jìn)入發(fā)展軌道,國產(chǎn)化替代從“夢(mèng)想”變“現(xiàn)實(shí)”

DeepSeek成功適配華為昇騰,意味著國內(nèi)AI產(chǎn)業(yè)在“芯片+框架+模型+應(yīng)用”全技術(shù)棧國產(chǎn)化的方向上邁出了實(shí)質(zhì)性一步。

對(duì)于有合規(guī)要求的政企客戶,這是剛需。ToB市場(chǎng)的國產(chǎn)化替代進(jìn)程將明顯加速。

2.開源大模型倒逼閉源降價(jià),AI應(yīng)用業(yè)務(wù)減少被閉源模型吸血

DeepSeek用遠(yuǎn)遠(yuǎn)低于頂級(jí)閉源模型的價(jià)格實(shí)現(xiàn)了接近頂級(jí)閉源模型的效果,它的示范效應(yīng)會(huì)進(jìn)一步拉高開源模型的整體性能。

這也會(huì)迫使Anthropic、OpenAI等閉源模型廠商的高價(jià)策略面對(duì)壓力。行業(yè)利潤中心將從基座模型向深度行業(yè)應(yīng)用遷移,對(duì)AI長期的發(fā)展極有益處。

3.開源模型≠企業(yè)應(yīng)用,Harness能力成為新分水嶺

開源降低了基座門檻,Harness決定了落地高度。從優(yōu)質(zhì)開源模型到穩(wěn)定可靠的企業(yè)級(jí)產(chǎn)品,中間還隔著Harness這一層,包括幻覺消除、指令遵循、錯(cuò)誤校驗(yàn)、專業(yè)性注入等工程能力。

每個(gè)行業(yè)的需求不同,沒有一套Harness是通用的。這恰恰是零一萬物的核心優(yōu)勢(shì)所在:基于自動(dòng)評(píng)測(cè)、自動(dòng)反饋、自動(dòng)改進(jìn)、專業(yè)性注入,為不同行業(yè)快速構(gòu)建專屬的Harness體系,讓大模型真正在業(yè)務(wù)中用起來。

?聯(lián)想集團(tuán)副總裁,聯(lián)想創(chuàng)投首席投資官、高級(jí)合伙人 宋春雨

第一,百萬級(jí)上下文成為應(yīng)用層的“標(biāo)配”,催生Agent爆發(fā):V4將超長上下文能力下沉為普惠基礎(chǔ)設(shè)施。

第二,行業(yè)競(jìng)爭(zhēng)從“卷模型”轉(zhuǎn)向“卷應(yīng)用與數(shù)據(jù)”:當(dāng)頂級(jí)開源模型性能逼近閉源、成本大幅下降后,模型本身將不再是稀缺壁壘。未來的投資與競(jìng)爭(zhēng)焦點(diǎn),將更明確地轉(zhuǎn)向誰能利用這些基礎(chǔ)模型,在醫(yī)療、金融、法律等高價(jià)值垂直場(chǎng)景中建立數(shù)據(jù)與應(yīng)用閉環(huán),形成商業(yè)護(hù)城河。

第三,國產(chǎn)算力產(chǎn)業(yè)鏈迎來巨大投資機(jī)遇:V4的成功,向業(yè)界證明了大模型在國產(chǎn)算力上也能摘取“皇冠上的明珠”。這必然催生對(duì)國產(chǎn)算力的確定性需求,帶動(dòng)從芯片設(shè)計(jì)、服務(wù)器到云服務(wù)的全產(chǎn)業(yè)鏈投資熱潮。

我們判斷,“今年的國產(chǎn)算力,就是去年的海外算力”,其產(chǎn)業(yè)趨勢(shì)和資本市場(chǎng)的映射效應(yīng)將尤為強(qiáng)勁。

我們會(huì)把資源向“能快速商業(yè)化、能落地行業(yè)、能形成產(chǎn)品壁壘”的項(xiàng)目集中,同時(shí)保持對(duì)底層架構(gòu)與算力基礎(chǔ)設(shè)施的長期投資。

?某雙幣基金投資人

我今年的愿望是:基模Portfio(被投資方)順利上市。

DeepSeek啟動(dòng)融資后,一定會(huì)吸收一級(jí)市場(chǎng)(尤其是國資)的大量資金。對(duì)剩下幾家還沒IPO的基模公司來說,繼續(xù)滾動(dòng)融資是不可持續(xù)的。

我還有個(gè)比較悲觀的觀點(diǎn):今年應(yīng)用層融資會(huì)比較困難。

基模能力還在快速迭代,意味著一大批應(yīng)用會(huì)被顛覆。就像去年非?;馃岬腃oding、Workflow,今年一級(jí)市場(chǎng)已經(jīng)沒什么人提了。

?Coding Agent創(chuàng)業(yè)者 Chillin

開源是一個(gè)好事,DeepSeek V4能進(jìn)一步推動(dòng)交流和優(yōu)化。但是這個(gè)時(shí)間距離拉的很大,讓人感覺比較難受;

DeepSeek V4會(huì)迫使模型廠更加正面地面對(duì)規(guī)模和數(shù)據(jù)的問題,然而這兩個(gè)問題極難解決,這是資本量的問題;

它也進(jìn)一步地證明了Scaling Law的極限。工程化帶來的性能躍升是有限的,這迫使所有人去找更底層的解。路漫漫其修遠(yuǎn)兮。

Bonus:一份DeepSeek V4實(shí)用指南適合干什么?

編程與代碼學(xué)習(xí):如果你是編程初學(xué)者或需要編寫個(gè)人腳本,DeepSeek V4是目前最頂級(jí)的選擇之一。它能非??煽康乩斫馍舷挛摹⑸筛哔|(zhì)量代碼,并且極擅長代碼調(diào)試。

中文及中日韓(CJK)內(nèi)容創(chuàng)作:無論是寫文章、潤色文案還是進(jìn)行翻譯,V4在中文、日文和韓文環(huán)境下的表現(xiàn)極其優(yōu)異。

超長文本閱讀與分析:V4原生支持高達(dá)100萬Token的上下文窗口。你可以一次性將整本書、數(shù)萬字的長篇報(bào)告或完整的代碼庫直接喂給它,讓它幫你總結(jié)或提取關(guān)鍵信息。

不適合干什么?

搜索與查證客觀事實(shí):V4是一款“推理模型”而非“百科全書”,它在事實(shí)性知識(shí)(如歷史細(xì)節(jié)、特定實(shí)體信息)的回憶測(cè)試中表現(xiàn)較弱,且極容易產(chǎn)生幻覺。特別是V4-Flash版本,在事實(shí)問答測(cè)試中得分僅有34.1%。建議:不要用它來當(dāng)搜索引擎,查證事實(shí)請(qǐng)使用帶搜索功能的其他AI或自己核實(shí)。

處理圖片或文檔排版:DeepSeek V4是一個(gè)純文本模型,不支持任何圖像輸入或輸出(No Vision)。如果你需要分析圖表或圖片,請(qǐng)使用其他多模態(tài)模型(如GPT-5.4 Mini)。

純英文的高級(jí)創(chuàng)意寫作:雖然它能寫英文,但它的英文輸出有時(shí)會(huì)顯得行文生硬(stilted phrasing),如果你需要?jiǎng)?chuàng)作高度自然、地道或富有創(chuàng)意的純英文內(nèi)容,建議使用其他西方主流模型。

其他須知:

給予充分的思考空間:如果你使用的是具備顯式思維鏈(CoT,即模型在給出答案前會(huì)先一步步推理,類似于“先打草稿再謄寫”)的Pro版本,遇到難題時(shí),不妨在提示詞中鼓勵(lì)它“多想幾步”或開啟“Think Max”模式,它推導(dǎo)得越深入,給出的答案往往越準(zhǔn)確。

容忍偶爾的啰嗦:評(píng)估顯示V4是一款相對(duì)“啰嗦”的模型,輸出速度也偏慢。如果你只想要簡(jiǎn)短的答案,可以在提示詞中明確要求“請(qǐng)用一句話回答”或“請(qǐng)盡量簡(jiǎn)短”。

歡迎交流!

歡迎交流!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
香奈兒發(fā)布無底綁帶鞋,網(wǎng)友:太抽象了!

香奈兒發(fā)布無底綁帶鞋,網(wǎng)友:太抽象了!

都市快報(bào)橙柿互動(dòng)
2026-04-29 15:43:37
陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

許三歲
2026-03-16 10:18:04
你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

創(chuàng)始人筆記
2026-04-23 21:44:50
姜?jiǎng)湃迦挝靼彩腥嗣裾笔虚L,西安市公安局局長

姜?jiǎng)湃迦挝靼彩腥嗣裾笔虚L,西安市公安局局長

極目新聞
2026-04-29 21:40:22
記者:阿什拉夫腿筋受傷將缺席歐冠半決賽次回合

記者:阿什拉夫腿筋受傷將缺席歐冠半決賽次回合

懂球帝
2026-04-30 01:07:14
官宣!英超賽程確定,曼城周末后少賽兩場(chǎng),曼聯(lián)利物浦可能改期

官宣!英超賽程確定,曼城周末后少賽兩場(chǎng),曼聯(lián)利物浦可能改期

嗨皮看球
2026-04-29 19:48:03
騎乘電動(dòng)車忘戴頭盔怎么辦?北京試點(diǎn)“共享頭盔” 免費(fèi)借用

騎乘電動(dòng)車忘戴頭盔怎么辦?北京試點(diǎn)“共享頭盔” 免費(fèi)借用

極目新聞
2026-04-29 20:26:49
從20萬到16億,一個(gè)普通散戶的“笨辦法”投資傳奇

從20萬到16億,一個(gè)普通散戶的“笨辦法”投資傳奇

流蘇晚晴
2026-04-20 20:13:29
“張雪的機(jī)車”,賬號(hào)被封禁!

“張雪的機(jī)車”,賬號(hào)被封禁!

營銷報(bào)
2026-04-07 13:54:34
巴黎5-4拜仁世紀(jì)名局!背后藏著孔帕尼不為人知的442天!

巴黎5-4拜仁世紀(jì)名局!背后藏著孔帕尼不為人知的442天!

落夜足球
2026-04-29 16:18:27
太炸裂!鋰電龍頭業(yè)績(jī)暴增超1000%!一季報(bào)點(diǎn)火,板塊滿屏漲停!“二師兄”也集體反攻,豬周期到底了嗎?

太炸裂!鋰電龍頭業(yè)績(jī)暴增超1000%!一季報(bào)點(diǎn)火,板塊滿屏漲停!“二師兄”也集體反攻,豬周期到底了嗎?

雪球
2026-04-29 16:19:35
沒想到,68歲李幼斌因志愿軍安葬儀式當(dāng)天的一舉動(dòng),實(shí)現(xiàn)口碑暴增

沒想到,68歲李幼斌因志愿軍安葬儀式當(dāng)天的一舉動(dòng),實(shí)現(xiàn)口碑暴增

阿廢冷眼觀察所
2026-04-30 00:32:14
38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

38歲老板娘淪為陪睡工具:揭秘黑茶高端騙局,入局者10有9個(gè)離婚

云景侃記
2026-02-12 22:21:30
成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

成都“牽手門”事件女主現(xiàn)今狀況曝光,太慘了......

許三歲
2026-03-17 07:34:05
利雅得勝利vs吉達(dá)國民:C羅、菲利克斯、馬內(nèi)首發(fā),馬赫雷斯出戰(zhàn)

利雅得勝利vs吉達(dá)國民:C羅、菲利克斯、馬內(nèi)首發(fā),馬赫雷斯出戰(zhàn)

懂球帝
2026-04-30 01:07:13
什么暴雨不花妝,純屬營銷噱頭,看看玲花就知道多假!

什么暴雨不花妝,純屬營銷噱頭,看看玲花就知道多假!

小光侃娛樂
2026-04-04 11:50:07
跑馬人最慘遭遇:酒店不隔音,隔壁情侶的“聲音”讓我徹底崩潰

跑馬人最慘遭遇:酒店不隔音,隔壁情侶的“聲音”讓我徹底崩潰

馬拉松跑步健身
2026-04-26 21:41:40
利物浦重磅引援藍(lán)圖曝光!鎖定德甲第一人,追獵那不勒斯中衛(wèi)

利物浦重磅引援藍(lán)圖曝光!鎖定德甲第一人,追獵那不勒斯中衛(wèi)

夜白侃球
2026-04-29 09:05:36
明起,東莞全渠道暫停辦理!

明起,東莞全渠道暫停辦理!

東莞紀(jì)實(shí)
2026-04-29 18:57:25
沒想到4月還沒結(jié)束,任嘉倫就以這種方式徹底翻車

沒想到4月還沒結(jié)束,任嘉倫就以這種方式徹底翻車

東方不敗然多多
2026-04-30 02:01:00
2026-04-30 03:11:00
36氪 incentive-icons
36氪
讓一部分人先看到未來
151271文章數(shù) 2848751關(guān)注度
往期回顧 全部

科技要聞

今晨庭審紀(jì)實(shí)|馬斯克當(dāng)庭講述OpenAI被偷走

頭條要聞

伊朗提出先解除封鎖 特朗普回應(yīng)

頭條要聞

伊朗提出先解除封鎖 特朗普回應(yīng)

體育要聞

一場(chǎng)九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節(jié)目組2小時(shí)

財(cái)經(jīng)要聞

蘇州,率先進(jìn)入牛市

汽車要聞

技術(shù)天花板再摸高 全能型的奕境X9首秀

態(tài)度原創(chuàng)

家居
教育
親子
游戲
旅游

家居要聞

寂然無界 簡(jiǎn)潔風(fēng)格

教育要聞

高考地理中的藝術(shù)治療

親子要聞

近年來屢上“黑榜”,十月結(jié)晶再因嬰幼兒背帶pH值不合格被通報(bào)

平等曹飛所有老玩家的危機(jī)合約,為何是二游高難玩法最高的山?

旅游要聞

48家公園推出110項(xiàng)假日特色活動(dòng)

無障礙瀏覽 進(jìn)入關(guān)懷版