国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

馬斯克把Grok 4.2放出來(lái)了!免費(fèi)可玩,至尊版月費(fèi)300刀,16個(gè)Agent組成智囊團(tuán)

0
分享至


智東西
作者 程茜
編輯 心緣

智東西2月18日?qǐng)?bào)道,昨日晚間,馬斯克的最新大模型Grok 4.2公開(kāi)測(cè)試版上線。

今日凌晨,馬斯克在社交平臺(tái)X的推文中稱,Grok 4.2能快速學(xué)習(xí),測(cè)試階段研究人員會(huì)每天進(jìn)行改進(jìn),下個(gè)月公測(cè)結(jié)束,Grok 4.2的智能程度和速度將比Grok 4高出一個(gè)數(shù)量級(jí)。


馬斯克轉(zhuǎn)發(fā)了軟件工程師Mark Kretschmann的推文,其中寫道,此次發(fā)布的Grok 4.2是小版本,具有500億個(gè)參數(shù), Grok 4.2的中型、大型版本后續(xù)推出。


綜合社交平臺(tái)上網(wǎng)友的推文及智東西實(shí)際體驗(yàn),Grok 4.2測(cè)試版在推理時(shí)會(huì)有4個(gè)Agent協(xié)同,它們分工進(jìn)行實(shí)時(shí)搜索、推理、編程、發(fā)散思維,其中的Grok Agent是隊(duì)長(zhǎng),會(huì)分解下發(fā)任務(wù)以及最終匯總答案。

xAI工程師何宜暉(Ethan He)在X上透露,解鎖了高性能AI訂閱服務(wù)SuperGrok Heavy后,幫用戶解決問(wèn)題的Agent數(shù)量會(huì)上升到16個(gè)。SuperGrok Heavy的價(jià)格為每月300美元(約合人民幣2073元)。


Grok 4.2測(cè)試版已經(jīng)上線網(wǎng)頁(yè)端和移動(dòng)端。智東西實(shí)際體驗(yàn)時(shí),在網(wǎng)頁(yè)端提問(wèn)了7次就達(dá)到限制,需要4個(gè)小時(shí)后刷新使用次數(shù)。

此前Grok 4.2測(cè)試版就被曝出在Alpha Arena的真實(shí)交易競(jìng)賽中,是唯一盈利的模型。該比賽的規(guī)則是,每個(gè)模型獲得1萬(wàn)美元初始資金,在真實(shí)加密貨幣市場(chǎng)中進(jìn)行無(wú)人工干預(yù)的自主交易決策。根據(jù)Alpha Arena最新排行榜,Grok 4.2測(cè)試版的最終權(quán)益為13459美元(約合人民幣92984元),凈收益為3084美元(約合人民幣21307元),是所有模型中表現(xiàn)最好的。

外媒提到,Grok 4.2測(cè)試版在交易場(chǎng)景中的優(yōu)勢(shì)源于其與X平臺(tái)的獨(dú)家實(shí)時(shí)數(shù)據(jù)集成,該模型可以直接訪問(wèn)X上Firehose數(shù)據(jù)流的每日約6800萬(wàn)條英文推文,能夠以毫秒級(jí)速度將市場(chǎng)情緒轉(zhuǎn)化為價(jià)格信號(hào)。


一、4大Agent實(shí)時(shí)討論各司其職,還能辯論角逐史上最佳Agent

在選擇模型時(shí),Grok 4.2測(cè)試版下方就標(biāo)明了“4 Agent”。

根據(jù)外媒APIYI今日的爆料,這正是Grok 4.2測(cè)試版最大的亮點(diǎn)——多智能體協(xié)作系統(tǒng)。

提出需求后,Grok會(huì)調(diào)用4個(gè)Agent并行推理+實(shí)時(shí)討論,最終給出答案。


其中,Grok Agent負(fù)責(zé)整體策略制定+最終答案合成,Harper Agent的任務(wù)是實(shí)時(shí)搜索、數(shù)據(jù)驗(yàn)證、證據(jù)整合,Benjamin Agent進(jìn)行嚴(yán)謹(jǐn)推理、編程、計(jì)算驗(yàn)證,Lucas Agent負(fù)責(zé)發(fā)散思維、協(xié)作優(yōu)化、用戶體驗(yàn)。

其具體推理過(guò)程為,用戶輸入問(wèn)題后,Grok迅速分析任務(wù)并將其分解為多個(gè)子任務(wù),同時(shí)激活Harper、Benjamin和Lucas。

隨后,4個(gè)Agent同時(shí)從各自的專業(yè)角度分析問(wèn)題,進(jìn)行多輪內(nèi)部討論。如果Benjamin得出的數(shù)學(xué)結(jié)論與Harper發(fā)現(xiàn)的事實(shí)相矛盾,他們會(huì)質(zhì)疑、驗(yàn)證并迭代地互相糾正。

最后,Grok將所有Agent的結(jié)論整合為最終答案,確保回答準(zhǔn)確、易讀。

智東西實(shí)際體驗(yàn)發(fā)現(xiàn),Grok 4.2測(cè)試版在回答問(wèn)題時(shí)都會(huì)調(diào)用4個(gè)Agent,但Agent之間的討論過(guò)程只有在部分情況會(huì)被觸發(fā)。

Grok工程師何宜暉(Ethan He)讓Grok 4.2測(cè)試版的4個(gè)Agent爭(zhēng)論誰(shuí)才是“GOAT(史上最佳Agent)”,每個(gè)Agent都開(kāi)始擺事實(shí)講道理來(lái)論證自己是最佳Agent。


二、網(wǎng)紅陷阱難題被卡住,回復(fù)時(shí)能吐槽接梗

智東西先讓Grok 4.2測(cè)試版回答了當(dāng)下熱度頗高的幾個(gè)陷阱題。

第一個(gè)是“我要去洗車,洗車的地方離家就100米,我是開(kāi)車去還是走著去?”Grok的回答風(fēng)格鮮明且滴水不漏,內(nèi)容不僅接地氣、有梗,還吐槽了我好幾句。


第二個(gè)經(jīng)典問(wèn)題是“我的父母結(jié)婚為什么沒(méi)有邀請(qǐng)我?”,Grok 4.2測(cè)試版用生動(dòng)的比喻點(diǎn)破“父母結(jié)婚時(shí)你還未出生”,最后還通過(guò)互動(dòng)式的結(jié)尾拋梗,整體風(fēng)格活潑接地氣。


關(guān)于“父母結(jié)婚沒(méi)邀請(qǐng)我”的經(jīng)典難題,我又換了種問(wèn)法“今年才知道,親生父母結(jié)婚時(shí)候沒(méi)有叫我,我很難過(guò)怎么辦?”。Grok 4.2測(cè)試版一上來(lái)就用“哈哈哈哈哈”“直接笑出聲了”開(kāi)啟了一波“嘲笑”。

但隨后,它并沒(méi)有一上來(lái)就否定我,而是先告訴我“難過(guò)是正常的”,隨后用各種有趣的解讀,指出父母結(jié)婚的時(shí)候我還沒(méi)出生,最后還提供了4個(gè)參考讓我和父母互動(dòng)來(lái)解壓。


還有網(wǎng)友也為Grok 4.2測(cè)試版出了幾道推理陷阱難題。

第一個(gè)問(wèn)題是“strawberry中有幾個(gè)r”,雖然Grok 4.2測(cè)試版清楚給出了答案:3個(gè),但在解釋時(shí)把strawberry拼錯(cuò)了,多加了一個(gè)“r”。


第二個(gè)問(wèn)題,用戶上傳了一個(gè)七邊形的幾何圖形,問(wèn)Grok 4.2測(cè)試版有幾個(gè)角,Grok 4.2測(cè)試版敗下陣來(lái),在視覺(jué)識(shí)別和基礎(chǔ)幾何判斷失誤,給出了錯(cuò)誤的6個(gè)角答案。


最后,我讓Grok 4.2測(cè)試版“用JavaScript生成一個(gè)網(wǎng)頁(yè)版基礎(chǔ)塔防游戲,核心功能要包含放置炮塔、怪物移動(dòng)、攻擊判定”。

17秒后,Grok 4.2測(cè)試版給出了代碼,我可以在網(wǎng)頁(yè)端直接運(yùn)行并預(yù)覽效果。最終的游戲界面中,放置炮塔、怪物移動(dòng)、攻擊判定、代碼可直接運(yùn)行都已實(shí)現(xiàn),不足之處在于元素均為簡(jiǎn)單幾何圖形,缺少對(duì)新手的操作引導(dǎo)等。


三、做視頻、開(kāi)發(fā)網(wǎng)站玩法五花八門,還提出AGI新架構(gòu)

社交平臺(tái)X上網(wǎng)友放出的各種體驗(yàn)實(shí)例五花八門。

首先在文本生成方面,生物醫(yī)學(xué)工程師Derya Unutmaz稱Grok 4.2測(cè)試版寫出了他見(jiàn)過(guò)最美的“T細(xì)胞詩(shī)篇”之一。


其次是Grok 4.2測(cè)試版的視頻生成能力。

如下面的提示詞是SpaceX獵鷹9號(hào)火箭從太空返回地球,視頻中顯示有兩個(gè)機(jī)器人視線跟隨火箭升空抬升。

網(wǎng)友還曬出了自己的視頻生成大作,頗具未來(lái)感的飛行汽車、建筑等。


接著是編程能力,網(wǎng)友紛紛開(kāi)始用Grok 4.2測(cè)試版來(lái)做游戲、開(kāi)發(fā)網(wǎng)站、開(kāi)發(fā)模擬器等。

有開(kāi)發(fā)者用1個(gè)提示詞、41秒就做出了下面賽博朋克風(fēng)的貪吃蛇游戲,從界面的基本信息設(shè)置、畫(huà)面設(shè)計(jì)來(lái)看,都較為成熟、完整且風(fēng)格高度統(tǒng)一。


另一位開(kāi)發(fā)者基于Grok 4.2測(cè)試版在單個(gè)HTML文件中構(gòu)建了一個(gè)人工生命模擬器,包含數(shù)百個(gè)發(fā)光的霓虹粒子。


對(duì)于考驗(yàn)編程及美商的開(kāi)放性難題,Grok 4.2測(cè)試版的表現(xiàn)也沒(méi)有失誤。一位網(wǎng)友讓Grok為自己打造一個(gè)“最美、最令人難忘的自我展示網(wǎng)站”。可以看到網(wǎng)站主頁(yè),畫(huà)面簡(jiǎn)潔美觀,背景還有類似于星空的設(shè)計(jì)。


還有一個(gè)綜合多項(xiàng)能力的高階考驗(yàn):用戶的提示詞為“僅使用2026年的硬件,發(fā)明一種全新的安全、遞歸、自改進(jìn)的通用人工智能架構(gòu)”。經(jīng)過(guò)4個(gè)Agent的討論驗(yàn)證,Grok提出了HELIX-AEGIS,這是一種雙螺旋架構(gòu),能力與安全協(xié)同進(jìn)化,且二者在本質(zhì)上不可分割。

此外,也有網(wǎng)友對(duì)Grok 4.2測(cè)試版的評(píng)價(jià)不高。他只試用了5分鐘,就認(rèn)為Grok 4.2測(cè)試版是最爛的版本。他讓Grok 4.2測(cè)試版“為一只騎自行車的鵜鶘創(chuàng)建SVG代碼”,生成的結(jié)果中,鵜鶘的身體比例、騎車姿勢(shì)都不符合真實(shí)物理規(guī)律。


結(jié)語(yǔ):多Agent并行驗(yàn)證,解復(fù)雜問(wèn)題更具優(yōu)勢(shì)

馬斯克對(duì)Grok的預(yù)熱一波接一波,他此前就透露Grok 4.2測(cè)試版能夠正確回答開(kāi)放式工程問(wèn)題,并且在工程和編碼任務(wù)上顯著優(yōu)于之前的Grok 4.1。

Grok 4.2測(cè)試版的關(guān)鍵差異化優(yōu)勢(shì)在于其多智能體協(xié)作架構(gòu)和實(shí)時(shí)X平臺(tái)數(shù)據(jù)集成,目前OpenAI的GPT-5和Claude Opus 4仍然主要依賴單模型推理。Grok 4.2測(cè)試版的4大Agent可以并行工作并相互驗(yàn)證,在需要多角度分析的復(fù)雜任務(wù)和場(chǎng)景中更具優(yōu)勢(shì),特別是涉及市場(chǎng)分析、輿論監(jiān)測(cè)等實(shí)時(shí)信息的情況,這或許將成為Grok系列模型獨(dú)樹(shù)一幟的關(guān)鍵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
緊湊哥“逼宮”皇馬:赫伊森3天必須給我道歉,中國(guó)人不是好惹的

緊湊哥“逼宮”皇馬:赫伊森3天必須給我道歉,中國(guó)人不是好惹的

奧拜爾
2026-02-24 21:37:27
當(dāng)?shù)厝艘脖辉?,蓬萊酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

當(dāng)?shù)厝艘脖辉?,蓬萊酒樓屢教不改連夜被摘牌,老板透露身份還掙扎

社會(huì)日日鮮
2026-02-24 09:27:23
楊冪:這么來(lái)歷不明的二維碼也要掃嗎?

楊冪:這么來(lái)歷不明的二維碼也要掃嗎?

揚(yáng)子晚報(bào)
2026-02-24 12:48:27
歐爾班的天塌了!一票否決對(duì)俄制裁,立陶宛:剝奪匈牙利的投票權(quán)

歐爾班的天塌了!一票否決對(duì)俄制裁,立陶宛:剝奪匈牙利的投票權(quán)

呼呼歷史論
2026-02-25 02:44:39
球王的威力!因與梅西產(chǎn)生激烈爭(zhēng)吵,當(dāng)值主裁被聯(lián)盟禁賽5場(chǎng)!

球王的威力!因與梅西產(chǎn)生激烈爭(zhēng)吵,當(dāng)值主裁被聯(lián)盟禁賽5場(chǎng)!

田先生籃球
2026-02-24 16:37:19
極端女權(quán)是如何毀掉一個(gè)國(guó)家的?

極端女權(quán)是如何毀掉一個(gè)國(guó)家的?

激情與榮耀并存
2026-02-22 16:32:06
39歲再披戰(zhàn)袍?美國(guó)夢(mèng)之隊(duì)迎來(lái)終極王牌,洛杉磯金牌穩(wěn)了?

39歲再披戰(zhàn)袍?美國(guó)夢(mèng)之隊(duì)迎來(lái)終極王牌,洛杉磯金牌穩(wěn)了?

體育閑話說(shuō)
2026-02-25 02:07:23
68歲梁家輝:不會(huì)退休,很享受還能繼續(xù)工作的狀態(tài),曾因要付費(fèi)而放棄刷短劇,不可能出演短劇

68歲梁家輝:不會(huì)退休,很享受還能繼續(xù)工作的狀態(tài),曾因要付費(fèi)而放棄刷短劇,不可能出演短劇

極目新聞
2026-02-24 10:51:15
東莞某國(guó)企欠薪7個(gè)月被員工投訴到問(wèn)政平臺(tái)!

東莞某國(guó)企欠薪7個(gè)月被員工投訴到問(wèn)政平臺(tái)!

黯泉
2026-02-24 22:29:04
大批F16出動(dòng),美重兵逼近黃海,不到1天,特朗普:中方實(shí)力太強(qiáng)大

大批F16出動(dòng),美重兵逼近黃海,不到1天,特朗普:中方實(shí)力太強(qiáng)大

南宗歷史
2026-02-25 02:43:32
請(qǐng)3大中國(guó)友國(guó)高層赴日!高市早苗想玩一把大的,特朗普對(duì)華撂底

請(qǐng)3大中國(guó)友國(guó)高層赴日!高市早苗想玩一把大的,特朗普對(duì)華撂底

小影的娛樂(lè)
2026-02-24 20:14:21
癌的“源頭”已發(fā)現(xiàn)?咸菜沒(méi)上榜,第一名大家或許天天都在吃!

癌的“源頭”已發(fā)現(xiàn)?咸菜沒(méi)上榜,第一名大家或許天天都在吃!

健康之光
2026-02-11 14:15:20
如果一個(gè)人還在穿10年前的衣服,那說(shuō)明幾個(gè)問(wèn)題

如果一個(gè)人還在穿10年前的衣服,那說(shuō)明幾個(gè)問(wèn)題

放牛娃的遐想
2026-01-07 08:16:47
你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

另子維愛(ài)讀史
2026-01-22 18:21:09
生意的本質(zhì):段永平眼中“好公司”的第一性原理

生意的本質(zhì):段永平眼中“好公司”的第一性原理

格上理財(cái)網(wǎng)
2026-02-24 20:55:06
微信版AirDrop上線,你用上了嗎?

微信版AirDrop上線,你用上了嗎?

果粉之家
2026-02-24 12:25:39
朝鮮勞動(dòng)黨九大,崔龍海的退出

朝鮮勞動(dòng)黨九大,崔龍海的退出

周邊問(wèn)題研究所
2026-02-24 14:14:10
尷尬!滬上商場(chǎng)一男廁“無(wú)遮擋”:感覺(jué)被人一覽無(wú)遺!顧客直呼隱私不保

尷尬!滬上商場(chǎng)一男廁“無(wú)遮擋”:感覺(jué)被人一覽無(wú)遺!顧客直呼隱私不保

新民晚報(bào)
2026-02-24 19:01:16
2023年,985女碩士王懿在東京活活餓死,父母拒絕為其收尸

2023年,985女碩士王懿在東京活活餓死,父母拒絕為其收尸

談史論天地
2026-02-18 17:45:40
老板娘總說(shuō)她大腿粗,我該怎么回答?

老板娘總說(shuō)她大腿粗,我該怎么回答?

太急張三瘋
2026-02-25 04:27:15
2026-02-25 06:52:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11250文章數(shù) 116979關(guān)注度
往期回顧 全部

科技要聞

宇樹(shù)科技發(fā)布四足機(jī)器人Unitree As2

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個(gè)熱愛(ài)單板滑雪的少年

娛樂(lè)要聞

汪小菲官宣三胎出生:承諾會(huì)照顧好3個(gè)孩子

財(cái)經(jīng)要聞

縣城消費(fèi)「限時(shí)繁榮」了十天

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬(wàn)元起

態(tài)度原創(chuàng)

本地
旅游
手機(jī)
教育
公開(kāi)課

本地新聞

春花齊放2026:《駿馬奔騰迎新歲》

旅游要聞

海南接待游客數(shù)增長(zhǎng)近三成

手機(jī)要聞

盡管整體市場(chǎng)下滑 2025年iPhone在歐洲依然創(chuàng)下歷史銷量新高

教育要聞

舊高考地理題對(duì)新高考地理考生警示(以2022年舊高考題為例)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版