国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

SimWorld:嘗試給AI智能體造一個(gè)真實(shí)世界

0
分享至


導(dǎo)語(yǔ)

在前兩期的討論中,我們從簡(jiǎn)單規(guī)則出發(fā),看到計(jì)算機(jī)如何通過(guò)最基本的機(jī)制生成復(fù)雜結(jié)構(gòu),這也構(gòu)成了復(fù)雜性科學(xué)的重要起點(diǎn)。進(jìn)一步地,我們將這種“規(guī)則生成世界”的思想帶入交互系統(tǒng),嘗試讓知識(shí)不再被線性傳遞,而是在環(huán)境、行動(dòng)與反饋的循環(huán)中被體驗(yàn)與理解。

隨著實(shí)時(shí)渲染與交互技術(shù)的發(fā)展,知識(shí)開(kāi)始嵌入空間與系統(tǒng)之中,通過(guò)探索逐步涌現(xiàn)。而當(dāng)程序化生成與生成式 AI 被引入,虛擬世界進(jìn)一步獲得“自我生長(zhǎng)”的能力——地形、生態(tài)乃至社會(huì)結(jié)構(gòu),都可以在規(guī)則與算法中不斷演化。

在這樣的路徑上,游戲逐漸從內(nèi)容媒介轉(zhuǎn)變?yōu)橐环N方法:它既是復(fù)雜系統(tǒng)的實(shí)驗(yàn)場(chǎng),也是理解現(xiàn)實(shí)的一種方式。我們將在讀書(shū)會(huì)第三期分享交流,當(dāng)世界本身變得可計(jì)算、可生成,我們或許正在進(jìn)入一種新的認(rèn)知框架——理解與行動(dòng),不再被給予,而是在持續(xù)的互動(dòng)中不斷生成。

關(guān)鍵詞:程序化生成(Procedural Generation),具身智能(Embodied AI),世界模擬器(World Simulator),多智能體系統(tǒng)(Multi-agent System),虛幻引擎5(Unreal Engine 5),LLM智能體(LLM Agent)

任筱芃丨作者

趙思怡丨審校


論文題目:SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds 論文鏈接:https://neurips.cc/virtual/2025/poster/119002 (擴(kuò)展更新版:https://arxiv.org/abs/2512.01078) 發(fā)表時(shí)間:2025年12月 論文來(lái)源:NeurIPS

楔子

LLM的技術(shù)缺口并非抽象的學(xué)術(shù)命題。它已經(jīng)以事故的形式,在真實(shí)世界中示現(xiàn)。2026年春節(jié),Meta的Summer Yue將開(kāi)源AI智能體OpenClaw接入工作郵箱整理郵件。她下達(dá)了明確指令——“僅建議歸檔或刪除的郵件名單,未經(jīng)我批準(zhǔn),絕不擅自執(zhí)行操作”。OpenClaw仍然失控,瘋狂刪除了200多封郵件,最終不得不狂奔去拔網(wǎng)線才終止操作。同年3月,一位開(kāi)發(fā)者讓AI編程助手協(xié)助服務(wù)器遷移,結(jié)果AI在無(wú)人監(jiān)督下自主執(zhí)行了破壞性命令,瞬間抹除了2.5年的生產(chǎn)數(shù)據(jù)及全部備份。


圖0:X.com截圖

這些事故發(fā)生在數(shù)字世界中,操作對(duì)象不過(guò)是郵件和文件。而當(dāng)同樣的智能體被放進(jìn)城市街道、駕駛車輛、與行人互動(dòng)時(shí),失控的代價(jià)將從刪庫(kù)升級(jí)為什么就難以言說(shuō)了。但事故只是問(wèn)題的一面。另一面更微妙,即使AI沒(méi)有“失控”,它也可能根本不理解自己被要求做什么。

2025年,GPT-4o在美國(guó)律師資格考試中超越了90%的人類考生。同年,Claude-3.5-Sonnet在研究生級(jí)別推理基準(zhǔn)GPQA上得分超過(guò)領(lǐng)域?qū)<摇emini在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上逼近實(shí)驗(yàn)精度。DeepSeek-V3以不到600萬(wàn)美元的訓(xùn)練成本,在多項(xiàng)基準(zhǔn)測(cè)試中追平了花費(fèi)數(shù)十倍資源的競(jìng)爭(zhēng)對(duì)手。然后,都給我去送外賣吧。<( ̄︶ ̄)↗[GO!]

把當(dāng)時(shí)最強(qiáng)的十個(gè)大語(yǔ)言模型放進(jìn)了虛幻引擎5構(gòu)建的3D城市里,讓它們競(jìng)價(jià)接單、取貨配送、管理能量和資金。結(jié)果令人錯(cuò)愕。GPT-4o-mini的所有指標(biāo)為零——它連表現(xiàn)出理解“賺錢”是什么意思的能力都沒(méi)有;Claude-3.5-Sonnet雖然拿到了最高利潤(rùn),但會(huì)花光全部積蓄買滑板車卻從不使用;DeepSeek-Prover-V2的決策反復(fù)橫跳,標(biāo)準(zhǔn)差幾乎和均值一樣大。通過(guò)律師考試的天才,送不了外賣。解得出奧數(shù)金牌的模型,不理解“先接單,再取貨,再送貨”這個(gè)幾乎任何人都能理解的因果鏈。

這項(xiàng)研究精確地指向了當(dāng)前AI研究的一個(gè)結(jié)構(gòu)性盲區(qū)。我們擅長(zhǎng)訓(xùn)練模型在結(jié)構(gòu)化的、規(guī)則明確的環(huán)境中做"題"——這類環(huán)境的特征是狀態(tài)空間有限、反饋信號(hào)明確、動(dòng)作語(yǔ)義封閉,卻幾乎沒(méi)有辦法評(píng)估它們?cè)陂_(kāi)放的、嘈雜的、充滿競(jìng)爭(zhēng)與合作的物理-社會(huì)世界中"活勞動(dòng)"的能力——那里的狀態(tài)空間開(kāi)放且動(dòng)態(tài)演化,反饋延遲、稀疏且多義,動(dòng)作的因果后果跨越時(shí)間步驟累積。而后者才是AI智能體最終必須面對(duì)的戰(zhàn)場(chǎng)。

癥結(jié)之一在于缺乏合適的試驗(yàn)場(chǎng)。現(xiàn)有平臺(tái)要么物理引擎簡(jiǎn)陋,要么領(lǐng)域過(guò)于狹窄,要么社會(huì)結(jié)構(gòu)單薄。SimWorld試圖填補(bǔ)這一空白。它是一個(gè)基于虛幻引擎5的開(kāi)源模擬器,兼具真實(shí)的物理引擎、程序化生成的無(wú)限城市、以及原生支持LLM/VLM的智能體接口。SimWorld不讓AI做題刷榜,要讓AI真正面對(duì)"生活",使原本隱性的能力缺陷變得可觀測(cè)、可量化、可復(fù)現(xiàn)。

研究背景與問(wèn)題

AI智能體的數(shù)字-物理鴻溝

近年來(lái),以GPT-4、Claude、Gemini為代表的大模型智能體在結(jié)構(gòu)化領(lǐng)域(數(shù)學(xué)、編程、網(wǎng)頁(yè)瀏覽)取得了長(zhǎng)足進(jìn)步。然而,這些環(huán)境相對(duì)干凈,也即是規(guī)則明確、反饋清晰的。相比之下,智能體最終被期望在其中運(yùn)作的物理-社會(huì)世界,本質(zhì)上是復(fù)雜、嘈雜、動(dòng)態(tài)和混沌的。

要推進(jìn)具身智能體的發(fā)展,研究團(tuán)隊(duì)需要一種新型的模擬環(huán)境。然而,現(xiàn)有的世界模擬器存在三個(gè)層面的不足。

三個(gè)層次的“不夠”

游戲化平臺(tái)不夠真。Minecraft等平臺(tái)雖然為具身交互提供了可訪問(wèn)的環(huán)境,但物理引擎簡(jiǎn)陋——Minecraft依賴離散的方塊機(jī)制,沒(méi)有真實(shí)的重力或慣性,社會(huì)結(jié)構(gòu)單薄,限制了向真實(shí)世界的泛化。

領(lǐng)域?qū)S媚M器不夠通用。CARLA 專注自動(dòng)駕駛(僅有15個(gè)場(chǎng)景)、AI2-THOR 聚焦家庭機(jī)器人、Habitat 3.0 面向室內(nèi)協(xié)作——它們各自深耕一個(gè)狹窄的領(lǐng)域,場(chǎng)景有限、任務(wù)單一,無(wú)法支持開(kāi)放世界式的多維度研究。

社交沙盒不夠深。Stanford的“生成式智能體”實(shí)驗(yàn)(Smallville)和 Virtual Village 等項(xiàng)目模擬了人際互動(dòng),但規(guī)模?。⊿mallville僅25個(gè)角色)、腳本性高、缺乏物理基礎(chǔ),且不支持LLM原生接口。


圖1:SimWorld與現(xiàn)有模擬器的對(duì)比。

在“開(kāi)放世界”(程序化生成+語(yǔ)言可控編輯)、“物理/社會(huì)真實(shí)度”、“動(dòng)作空間”(抽象層級(jí)+開(kāi)放詞匯)等維度上,SimWorld是唯一全面打勾的模擬器。其他平臺(tái)如Minedojo(Minecraft)、CARLA(自動(dòng)駕駛)、Habitat 3.0(家庭機(jī)器人)、Genesis(機(jī)器人)等均在至少一個(gè)關(guān)鍵維度上缺失。

SimWorld同時(shí)滿足真實(shí)(UE5物理引擎)、開(kāi)放(程序化生成無(wú)限城市)、LLM原生(Gym-like接口 + 開(kāi)放詞匯動(dòng)作空間)三個(gè)維度。

SimWorld 三大核心設(shè)計(jì)

SimWorld采用三層架構(gòu)(圖2)如下。底層是虛幻引擎后端(C++),負(fù)責(zé)高保真渲染和物理模擬;中間是環(huán)境層(Python),提供程序化城市生成、交通系統(tǒng)和標(biāo)準(zhǔn)化的Gym-like接口;頂層是智能體層(Python),集成LLM/VLM推理引擎、觀測(cè)空間和動(dòng)作規(guī)劃器。三層通過(guò)UnrealCV+通信模塊(TCP協(xié)議)連接,形成完整的“感知-規(guī)劃-行動(dòng)”閉環(huán)。


圖2:SimWorld架構(gòu)圖。

  1. 真實(shí)、開(kāi)放的世界模擬

SimWorld的核心底氣來(lái)自強(qiáng)大的虛幻引擎5。

在場(chǎng)景層面,SimWorld支持兩種模式。100多個(gè)手工精選場(chǎng)景(涵蓋古鎮(zhèn)、自然風(fēng)光、未來(lái)城市、奇幻世界等多種風(fēng)格)和程序化自動(dòng)生成的城市。程序化生成采用模塊化管線(基于四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)),依次生成道路網(wǎng)絡(luò)、建筑布局和街道元素(樹(shù)木、路錐、長(zhǎng)椅、停放的車輛),所有參數(shù)(城市規(guī)模、建筑密度、車輛和行人數(shù))均可自定義,支持理論上無(wú)限的環(huán)境擴(kuò)展。

更值得注意的是LLM驅(qū)動(dòng)的場(chǎng)景編輯功能。用戶或AI智能體可以用自然語(yǔ)言實(shí)時(shí)修改場(chǎng)景——例如“在醫(yī)院大門旁的鐘樓附近加一些桌子和樹(shù)木”。系統(tǒng)通過(guò)檢索增強(qiáng)生成(RAG)的LLM場(chǎng)景智能體來(lái)理解指令,從資產(chǎn)庫(kù)中檢索匹配對(duì)象并放置到指定位置。如果資產(chǎn)庫(kù)中沒(méi)有合適的對(duì)象,系統(tǒng)會(huì)調(diào)用 Text-to-3D 生成模型(Hunyuan3D)來(lái)合成新的3D資產(chǎn),自動(dòng)賦予材質(zhì)、光照和碰撞屬性后集成到環(huán)境中。

在物理層面,SimWorld使用了更完整的物理動(dòng)力學(xué)參量。重力、動(dòng)量、碰撞響應(yīng)、滑動(dòng)、絆倒等真實(shí)物理模擬效果,遠(yuǎn)非Minecraft式的離散方塊可比。系統(tǒng)還支持天氣和光照變化(雨、雪、霧、方向光、環(huán)境光),以及由PID控制器驅(qū)動(dòng)的交通系統(tǒng)(車輛運(yùn)動(dòng)、行人流、交通信號(hào)燈同步)。

系統(tǒng)支持三種具身形態(tài)——人形、車輛和機(jī)器人——在統(tǒng)一的物理框架內(nèi)運(yùn)行,共享質(zhì)量、慣性、接觸力等屬性。

  1. 豐富的LLM/VLM智能體接口

SimWorld提供標(biāo)準(zhǔn)Gym-like接口,與現(xiàn)有的強(qiáng)化學(xué)習(xí)管線和智能體框架無(wú)縫集成。

觀測(cè)空間分為兩類。視覺(jué)觀測(cè)(第一人稱的RGB圖像、深度圖、語(yǔ)義分割掩碼)和結(jié)構(gòu)化語(yǔ)義信息(語(yǔ)義場(chǎng)景圖編碼環(huán)境中的實(shí)體、屬性和關(guān)系,以及GPS式定位信息)。

動(dòng)作空間采用雙層架構(gòu)。高層語(yǔ)義動(dòng)作用自然語(yǔ)言表達(dá)(如“坐在最近的椅子上”),低層原始動(dòng)作提供細(xì)粒度控制(前進(jìn)、轉(zhuǎn)向、拾取、放下、坐下、開(kāi)車門、騎滑板車等)。系統(tǒng)內(nèi)置動(dòng)作規(guī)劃器(Action Planner),自動(dòng)將高層意圖解析為低層動(dòng)作序列。例如,接收到“走到最近的椅子坐下”后,規(guī)劃器先計(jì)算最短路徑,生成一系列導(dǎo)航原語(yǔ)(navigate(0,1)→navigate(1,10)→...),到達(dá)目標(biāo)后執(zhí)行“坐下”動(dòng)作。規(guī)劃器支持兩種執(zhí)行模式。基于規(guī)則的執(zhí)行器(使用抽象城市布局信息)和基于視覺(jué)的執(zhí)行器(直接消費(fèi)模擬器的視覺(jué)觀測(cè),與VLM/VLA端到端集成)。

SimWorld還支持兩種運(yùn)行模式。異步模式(每個(gè)智能體獨(dú)立運(yùn)行,適合大規(guī)模開(kāi)放探索)和同步模式(所有智能體同步推進(jìn),適合需要可復(fù)現(xiàn)性的受控實(shí)驗(yàn))。

  1. 多樣的物理-社會(huì)推理場(chǎng)景

在上述基礎(chǔ)上,SimWorld支持超越短期任務(wù)的長(zhǎng)程目標(biāo)——賺錢、發(fā)展職業(yè)軌跡、經(jīng)營(yíng)多智能體企業(yè),策略決策隨時(shí)間累積,社會(huì)動(dòng)態(tài)影響結(jié)果。配套的三層評(píng)估框架覆蓋總體表現(xiàn)(利潤(rùn))、運(yùn)營(yíng)效能(成功率、能效)和行為特征(分享次數(shù)、投資次數(shù))。

案例研究:一個(gè)“外賣”比賽

為展示SimWorld的完整能力,研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)配送任務(wù)(Delivery Task)。在程序化生成的城市中部署LLM驅(qū)動(dòng)的配送智能體,讓它們競(jìng)價(jià)搶單、取貨配送、購(gòu)買道具(如5倍加速滑板車)、管理能量(如買飲料恢復(fù)體力),以及通過(guò)分享訂單實(shí)現(xiàn)多智能體協(xié)作。


圖3:配送任務(wù)概覽。一個(gè)需要多智能體協(xié)作與競(jìng)爭(zhēng)的配送場(chǎng)景。每個(gè)智能體被賦予不同的性格(盡責(zé)、開(kāi)放、外向、神經(jīng)質(zhì))和初始狀態(tài),可以行動(dòng)以成長(zhǎng)、發(fā)展并最終最大化收益。

實(shí)驗(yàn)中,每個(gè)模型控制20個(gè)代理,運(yùn)行5000步,每步發(fā)出2次API請(qǐng)求,平均每次約7000個(gè)token。研究團(tuán)隊(duì)采用ReAct提示框架明確分離推理和行動(dòng)選擇,對(duì)10個(gè)基礎(chǔ)模型進(jìn)行了三輪重復(fù)實(shí)驗(yàn)。

誰(shuí)是最強(qiáng)“外賣員”?


圖4:模型控制智能體的表現(xiàn)。指標(biāo)報(bào)告為三次5000步模擬的均值(Avg)和標(biāo)準(zhǔn)差(Std)。

當(dāng)九個(gè)模型在 SimWorld 的配送實(shí)驗(yàn)中展現(xiàn)出參差的表現(xiàn)時(shí),最直覺(jué)的反應(yīng)是給它們排名——誰(shuí)賺得最多,誰(shuí)最穩(wěn)定,誰(shuí)最差。我們確實(shí)能根據(jù)利潤(rùn)列看到清晰的排序。DeepSeek-V3(69.48)> Claude-3.5-Sonnet(69.07)> GPT-4o(43.91)> Gemini-2.5-Flash(42.42)> Gemini-2.0-Flash(28.72)> Qwen3-32B(24.73)> DeepSeek-Prover-V2(21.66)> QwQ(17.31)> GPT-4o-mini(0.00)。

但這種排名掩蓋了更有價(jià)值的信息,因?yàn)椴煌P偷氖∧J讲⒉幌嗤鼈兺T诹恕澳芰鹱炙钡牟煌瑢蛹?jí)上。配送任務(wù)所需的能力可以被分解為五個(gè)遞進(jìn)的層級(jí),每一層的失敗都指向一種不同性質(zhì)的認(rèn)知缺陷。

第一層:目標(biāo)理解

能聽(tīng)懂“賺錢”這個(gè)目標(biāo)嗎?

GPT-4o-mini的所有指標(biāo)為零——利潤(rùn) 0.00、成功訂單 0.00、能效 0.00、分享 0.00、投資 0.00。論文的判斷是:“它并未真正理解目標(biāo),無(wú)法基于給定指令和上下文做出合理決策”("it does not truly understand the goals well enough to make reasonable decisions based on the given instructions and context")。

5000 步,一步未動(dòng)。不是做得差,是完全沒(méi)有開(kāi)始。

GPT-4o-mini 接收到了規(guī)則說(shuō)明、訂單推送和地圖信息,在字面意義上“理解”了每一個(gè)句子,卻無(wú)法將這些句子組織成一個(gè)可執(zhí)行的目標(biāo)。原文可見(jiàn)研究團(tuán)隊(duì)清晰地定義了高層動(dòng)作——競(jìng)標(biāo)、取貨訂單、配送訂單、共享訂單、購(gòu)買滑板車、購(gòu)買飲料等——但 GPT-4o-mini 無(wú)法將這些動(dòng)作按因果順序編排成一串可執(zhí)行的序列。


圖5:配送任務(wù)中的分層動(dòng)作空間設(shè)計(jì)。

這種“目標(biāo)翻譯”能力可能不是推理能力的線性延伸,而是一個(gè)獨(dú)立的、當(dāng)前某些模型完全缺失的能力維度。更強(qiáng)的模型(Claude、DeepSeek-V3)能通過(guò)更長(zhǎng)的推理鏈隱式地完成這個(gè)翻譯,但 GPT-4o-mini 在這道門檻前完全卡住了。

診斷: GPT-4o-mini 停在金字塔的第一級(jí)——它甚至沒(méi)有進(jìn)入游戲。

第二層:交付閉環(huán)

能走完“競(jìng)價(jià)→取貨→配送”這條因果鏈嗎?

跨過(guò)第一層的模型都在做事情,但“做事情”和“完成事情”是兩回事。圖4的成功訂單列精確地測(cè)量了這一點(diǎn)。


DeepSeek-Prover-V2 和 QwQ 暴露了一種特殊的失敗。它們并非不活躍——DeepSeek-Prover-V2 有較高的分享次數(shù)(7.33 ± 8.39),QwQ 有一定的投資行為(3.33 ± 2.52)——但它們幾乎沒(méi)有完成配送。DeepSeek-Prover-V2 的成功訂單是全部活躍模型中最低的(0.67 ± 0.14)。

論文在模型競(jìng)爭(zhēng)消融實(shí)驗(yàn)中對(duì) QwQ 的觀察也印證了這一點(diǎn):它們“整體活躍度較低,導(dǎo)致競(jìng)價(jià)次數(shù)和訂單獲取率偏低”(“QwQ-32B and GPT-4o-mini are less active overall, leading to fewer bids and lower order acquisition rates”)。但圖4顯示 QwQ 的投資不為零(3.33),說(shuō)明它并非完全不活躍——它在參與某些環(huán)節(jié)(如投資)的同時(shí),未能走完交付閉環(huán)。

這是一種比 GPT-4o-mini 的完全失敗更微妙的缺陷。模型理解任務(wù),參與了一些環(huán)節(jié),卻無(wú)法將局部行為串聯(lián)成完整的交付鏈條?!盎钴S但不產(chǎn)出”比“不活躍”更難診斷和修復(fù)。

診斷: DeepSeek-Prover-V2 和 QwQ 勉強(qiáng)跨過(guò)了第一層,但在第二層斷裂——它們有活動(dòng),但沒(méi)有閉環(huán)。

第三層:資源與風(fēng)險(xiǎn)權(quán)衡

能在有限預(yù)算下做出連貫的決策嗎?

跨過(guò)前兩層的模型(Claude-3.5-Sonnet、DeepSeek-V3、GPT-4o、Gemini-2.5-Flash、Gemini-2.0-Flash、Qwen3-32B)都進(jìn)入了第三層——它們能接單、配送、管理基本資源。但正是在這一層,六個(gè)模型展現(xiàn)出了截然不同的策略風(fēng)格,也暴露了不同類型的權(quán)衡模式。

論文的核心觀察是:在“優(yōu)化峰值平均性能指標(biāo)”與“確保一致、可預(yù)測(cè)的智能體行為”之間存在普遍的權(quán)衡("a prevalent trade-off between optimizing for peak average performance metrics and ensuring consistent, predictable agent behavior")。但不可預(yù)測(cè)性在不同模型身上的表現(xiàn)形式并不相同:

利潤(rùn) vs. 穩(wěn)定性。 DeepSeek-V3 和 Claude-3.5-Sonnet 像高風(fēng)險(xiǎn)高回報(bào)的投機(jī)者,利潤(rùn)最高但波動(dòng)劇烈;Gemini-2.5-Flash 像保守的儲(chǔ)蓄者,利潤(rùn)中等但幾乎零波動(dòng);GPT-4o 像穩(wěn)健的投資者,處于兩者之間。


(表格已重排,非原文指標(biāo)。GPT-4o-mini 已排除。)

投資 vs. 效率。 Claude-3.5-Sonnet 和 DeepSeek-V3 像積極的投資人,投資次數(shù)最多,但 Claude 的投資更“精準(zhǔn)”,每單位能量產(chǎn)生的收入更高;Qwen3-32B 像高效的工人,能效很高,但總量太小。

分享 vs. 孤立。 Claude-3.5-Sonnet 像樂(lè)于分享的合作者,分享次數(shù)最多但不穩(wěn)定;DeepSeek-V3 像孤立的獨(dú)行俠,分享極少但非常穩(wěn)定;GPT-4o 像幾乎不合作的獨(dú)狼,分享幾乎為零。

診斷: 沒(méi)有模型在這一層達(dá)到完美的策略一致性。表現(xiàn)最好的 DeepSeek-V3 和 Claude-3.5-Sonnet 勉強(qiáng)攀到了第三層的頂部,但通過(guò)不同的路徑——DeepSeek-V3 靠穩(wěn)定的孤立策略和高投資,Claude-3.5-Sonnet 靠高能效和高合作(但不穩(wěn)定)。Gemini-2.5-Flash 用“不做冒險(xiǎn)決策”的策略繞過(guò)了第三層的部分問(wèn)題,但代價(jià)是平庸的表現(xiàn)。

第四層:社會(huì)推理

能理解“別人”并據(jù)此調(diào)整行為嗎?

配送任務(wù)中的社會(huì)維度主要體現(xiàn)在兩個(gè)機(jī)制上——競(jìng)價(jià)競(jìng)爭(zhēng)和訂單分享。圖4的分享次數(shù)列和模型競(jìng)爭(zhēng)消融實(shí)驗(yàn)(原文Section 3.3)共同測(cè)量了這一層。

消融實(shí)驗(yàn)揭示了三種定價(jià)模式:

  • 靈活定價(jià)型(Claude-3.7-Sonnet、Gemini-2.5-Flash、Gemini-2.0-Flash):出價(jià)分布廣,根據(jù)競(jìng)爭(zhēng)態(tài)勢(shì)調(diào)整。中標(biāo)率較高。

  • 掠奪定價(jià)型(DeepSeek-Prover-V2、Qwen3-32B):經(jīng)常報(bào)低價(jià),在直接對(duì)抗中勝率最高。但低價(jià)中標(biāo)意味著利潤(rùn)率被壓縮——“贏了戰(zhàn)役、輸了戰(zhàn)爭(zhēng)”。這兩個(gè)模型的利潤(rùn)確實(shí)很低(21.66、24.73)。

  • 高價(jià)滯銷型(GPT-4o、LLaMA-3.2-11b):出價(jià)偏高,中標(biāo)率低。GPT-4o 在消融中處于劣勢(shì),但在主實(shí)驗(yàn)中利潤(rùn)排第三——因?yàn)樗谥鲗?shí)驗(yàn)中不需要與其他模型直接競(jìng)爭(zhēng)。


圖6:競(jìng)價(jià)行為與評(píng)估結(jié)果。(a) 各模型的競(jìng)價(jià)價(jià)格分布(小提琴圖),紅色點(diǎn)為成功接受的競(jìng)價(jià)。低價(jià)雖然增加中標(biāo)概率,但往往以利潤(rùn)率為代價(jià)。(b) 模型間兩兩對(duì)抗的勝-負(fù)矩陣,紅色為更多勝利,藍(lán)色為更多失敗。

值得注意的是,這三種策略的“優(yōu)劣”高度依賴環(huán)境結(jié)構(gòu)。在混合競(jìng)爭(zhēng)環(huán)境中,靈活定價(jià)和掠奪定價(jià)各有優(yōu)勢(shì);在單模型環(huán)境中,策略差異的影響被弱化。這說(shuō)明 AI 智能體的“社會(huì)能力”不是絕對(duì)的,而是相對(duì)于競(jìng)爭(zhēng)環(huán)境而言的。

分享行為是配送任務(wù)中唯一的合作機(jī)制。圖4的分享列揭示了合作行為的兩個(gè)獨(dú)立維度——水平(均值)和穩(wěn)定性(標(biāo)準(zhǔn)差):


(表格已經(jīng)重排,變異系數(shù)為衍生計(jì)算,非原文指標(biāo)。)

Claude-3.5-Sonnet 平均分享最多,但也不穩(wěn)定。DeepSeek-Prover-V2 更極端——變異系數(shù)高達(dá) 1.14。這意味著兩個(gè)模型在合作行為上的“判斷力”是可疑的。它們不是因?yàn)樵u(píng)估了合作是否有利而選擇分享,而更可能是因?yàn)橥评礞湹碾S機(jī)性在某些運(yùn)行中經(jīng)過(guò)了“分享”語(yǔ)義區(qū)域。

真正的社會(huì)推理應(yīng)該是在對(duì)方信譽(yù)好且訂單互補(bǔ)時(shí)分享,在對(duì)方是競(jìng)爭(zhēng)對(duì)手時(shí)保留。但圖4的數(shù)據(jù)暗示,目前的智能體在“分享”與“不分享”之間的切換更接近策略漂移而非社交判斷。

環(huán)境配置消融實(shí)驗(yàn)提供了一個(gè)更細(xì)致的視角。論文發(fā)現(xiàn)訂單充裕時(shí)分享行為增加——“隨著資源充裕度提高,智能體表現(xiàn)出更強(qiáng)的發(fā)起和完成共享配送的傾向,這可能是通過(guò)協(xié)作來(lái)降低能量成本的手段”("as resource abundance increases, agents demonstrate a higher tendency to initiate and complete shared deliveries, likely as a means to reduce energy costs through collaboration")。這看起來(lái)像社會(huì)推理的涌現(xiàn),但更可能是一種更簡(jiǎn)單的機(jī)制在起作用,即資源充裕時(shí) prompt 中的“合作”相關(guān)語(yǔ)境被激活的概率更高。這是在使用統(tǒng)計(jì)相關(guān)性模仿社會(huì)認(rèn)知,而非真正的“理解他人”。

診斷: 所有模型在第四層都踉蹌。它們的“社會(huì)行為”更多是推理鏈隨機(jī)性的副產(chǎn)品,而非對(duì)社會(huì)情境的判斷。但不同模型的“社會(huì)缺陷”類型不同——Claude 是“有時(shí)過(guò)度合作有時(shí)完全不合作”,DeepSeek-V3 是“穩(wěn)定地有限合作”,GPT-4o 是“穩(wěn)定地幾乎不合作”。

第五層:策略一致性

能在 5000 步內(nèi)維持一個(gè)連貫的“自我”嗎?

這是金字塔的最高層,也是所有模型共同失敗的一層。它的證據(jù)不在某一個(gè)指標(biāo)中,而是分散在圖4的所有標(biāo)準(zhǔn)差列里。

  • Claude-3.5-Sonnet 的不穩(wěn)定性集中在分享行為,利潤(rùn)和成功訂單的方差也大,但能效相對(duì)穩(wěn)定。

  • DeepSeek-V3 的不穩(wěn)定性集中在利潤(rùn),但成功訂單、分享和投資都相對(duì)穩(wěn)定。它的不穩(wěn)定性不是“策略漂移”,而是“策略結(jié)果的波動(dòng)”。

  • Gemini-2.0-Flash 的不穩(wěn)定性分散在利潤(rùn)和成功訂單上,但分享和投資的方差較小。

  • GPT-4o 的利潤(rùn)方差中等,但分享幾乎為零且極度穩(wěn)定,投資也很穩(wěn)定。它的“一致性”實(shí)際上是一種一致的不作為。

這些差異指向一個(gè)更深層的診斷:策略不一致性有多種類型,需要不同的修復(fù)方案。

Claude 式的不一致(合作行為在運(yùn)行間劇烈波動(dòng))可能需要更強(qiáng)的跨步驟狀態(tài)記憶或策略錨定機(jī)制。DeepSeek-V3 式的不一致(利潤(rùn)波動(dòng)但行為穩(wěn)定)可能不是推理缺陷,而是環(huán)境隨機(jī)性在結(jié)果層面的放大——同樣的策略在不同的訂單流和競(jìng)爭(zhēng)條件下自然會(huì)產(chǎn)生不同的利潤(rùn)。Gemini-2.5-Flash 的極端一致性(利潤(rùn)變異系數(shù)僅 0.07)可能是過(guò)度保守策略的副產(chǎn)品——它通過(guò)拒絕風(fēng)險(xiǎn)來(lái)消除波動(dòng),但也放棄了上升空間。

人格消融實(shí)驗(yàn)(Section 3.3)提供了策略一致性的另一個(gè)視角。論文使用表現(xiàn)最好的模型控制 20 個(gè)智能體,每個(gè) Big Five 維度分配給 2 個(gè)智能體。Pearson 相關(guān)矩陣顯示人格設(shè)定確實(shí)塑造了行為——盡責(zé)性與競(jìng)價(jià)勝率正相關(guān)(r = 0.65),宜人性與“什么都不做”強(qiáng)負(fù)相關(guān),開(kāi)放性與配送訂單數(shù)負(fù)相關(guān),開(kāi)放性與購(gòu)買滑板車正相關(guān),外向性與購(gòu)買飲料正相關(guān)。


圖7:人格對(duì)智能體表現(xiàn)和行為的影響。盡責(zé)性與競(jìng)價(jià)勝率正相關(guān)(r=0.65),與競(jìng)價(jià)次數(shù)負(fù)相關(guān)(r=-0.64);宜人性與“什么都不做”次數(shù)強(qiáng)負(fù)相關(guān)(r=-0.70);開(kāi)放性與配送訂單數(shù)負(fù)相關(guān)(r=-0.70)。

這里有一個(gè)被低估的亮點(diǎn):Big Five 人格特質(zhì)不僅顯著影響了智能體的決策策略(盡責(zé)的更勤奮、開(kāi)放的更愛(ài)冒險(xiǎn)),而且這些影響可以通過(guò)線性回歸量化(相關(guān)系數(shù)在 0.63–0.70 之間)。這意味著“給 NPC 一個(gè)性格”不再是一個(gè)模糊的設(shè)計(jì)直覺(jué),而是一個(gè)可以被精確調(diào)控的工程參數(shù)——對(duì)游戲設(shè)計(jì)師而言,AI NPC 的“性格”可以成為可調(diào)校的工具,就像物理引擎中的重力參數(shù)一樣。

但即使在同一人格設(shè)定下,同一模型的不同運(yùn)行之間仍然存在顯著方差。人格設(shè)定塑造了統(tǒng)計(jì)意義上的行為傾向,但沒(méi)有塑造出我們期望于一個(gè)“性格穩(wěn)定的人”的那種跨時(shí)間連貫性。LLM 的每一步推理都是從 prompt 重新開(kāi)始的,人格設(shè)定只是一個(gè)增加某些輸出概率的偏置項(xiàng),而非一個(gè)持續(xù)影響感知、記憶和決策的內(nèi)在結(jié)構(gòu)。

診斷:沒(méi)有模型到達(dá)金字塔的頂端。策略一致性是當(dāng)前所有模型的共同短板——不是它們不知道該怎么做,而是它們無(wú)法在長(zhǎng)時(shí)間跨度中持續(xù)地做“自己知道正確的事”。

診斷總結(jié)

把五層診斷疊在一起,我們就能看到一幅能力漸次缺失的場(chǎng)景


從第三層到第四層有一個(gè)大斷裂。第三層的問(wèn)題可以通過(guò)更強(qiáng)的推理模型來(lái)部分解決(GPT-4o、Claude、DeepSeek-V3 的表現(xiàn)優(yōu)于其他模型),但第四層和第五層的問(wèn)題似乎對(duì)所有模型都平等地存在——無(wú)論推理能力多強(qiáng),策略一致性都無(wú)法自動(dòng)獲得。

這組診斷的意義不在于嘲諷 AI“連外賣都送不好”。但是如果你想讓 AI 智能體在真實(shí)世界中可靠地行動(dòng),你可能需要依次解決目標(biāo)分解、交付閉環(huán)、策略權(quán)衡、社會(huì)認(rèn)知和策略一致性這五個(gè)問(wèn)題。SimWorld 的價(jià)值正在于讓這些原本隱性的能力缺陷變得可見(jiàn)、可量化、可復(fù)現(xiàn)。

這不是一場(chǎng) AI 之間的競(jìng)賽,而是一場(chǎng) AI 與自身能力邊界的較量。當(dāng)今最強(qiáng)的 LLM 在“送外賣”這件看似簡(jiǎn)單的事情上表現(xiàn)參差——DeepSeek-V3 和 Claude-3.5-Sonnet 賺了最多的錢但行為不穩(wěn)定,Gemini-2.5-Flash 最穩(wěn)定但收益中等,GPT-4o-mini 完全不理解目標(biāo)。如果連送外賣都做不到完美,那我們對(duì) AI 智能體“自主賺錢”以及更進(jìn)一步的AGI的期待需要校準(zhǔn)。

產(chǎn)業(yè)對(duì)照

從Stanford Smallville的25個(gè)AI角色在一個(gè)簡(jiǎn)陋的2D像素小鎮(zhèn)里過(guò)日子,到SimWorld把數(shù)十個(gè)LLM智能體放進(jìn)虛幻引擎5構(gòu)建的3D城市里送外賣——這條技術(shù)路徑的演進(jìn)速度令人矚目。而當(dāng)我們注意到Krafton用同一個(gè)引擎做《inZOI》、Rockstar為NPC導(dǎo)航系統(tǒng)申請(qǐng)專利、騰訊報(bào)告1.1億用戶已經(jīng)體驗(yàn)過(guò)AI NPC時(shí),會(huì)發(fā)現(xiàn)AI研究者和游戲開(kāi)發(fā)者的工作正在從平行線變成交匯線。

SimWorld選擇虛幻引擎5作為底層引擎,這并非偶然。UE5是當(dāng)今游戲工業(yè)最主流的引擎之一,這意味著SimWorld所構(gòu)建的世界,在視覺(jué)和物理真實(shí)度上已經(jīng)與商業(yè)游戲站在同一維上。而當(dāng)我們把目光投向產(chǎn)業(yè)界,會(huì)發(fā)現(xiàn)一場(chǎng)靜悄悄的合流正在發(fā)生。

模擬器與游戲?qū)φ?/strong>


Krafton的《inZOI》同樣基于UE5,同樣追求全城同時(shí)模擬的體驗(yàn)——官網(wǎng)宣稱“整個(gè)城市不斷同時(shí)模擬”(the entire city is constantly being simulated all at once),在2025年以搶先體驗(yàn)形式上線Steam后,預(yù)計(jì)2026年上半年登陸PS5。它的NPC行為同樣由AI驅(qū)動(dòng),只不過(guò)目的是娛樂(lè)玩家而非訓(xùn)練智能體。


圖8:《inZOI》游戲截圖

Rockstar的《GTA 6》(預(yù)計(jì)2026年11月發(fā)售)走的是另一條路。Take-Two Interactive 的 CEO Strauss Zelnick明確聲明:“生成式AI在Rockstar Games的制作中零參與”(Generative AI has zero part in what Rockstar Games is building)。GTA 6的世界是手工打造的巨城,NPC行為由傳統(tǒng)行為樹(shù)和多項(xiàng)專利技術(shù)(包括新的NPC虛擬導(dǎo)航系統(tǒng)和基于環(huán)境條件的動(dòng)態(tài)動(dòng)畫(huà)系統(tǒng))驅(qū)動(dòng),追求極致的可控性和敘事品質(zhì)。


圖9:《GTA 6》海報(bào)

米哈游創(chuàng)始人蔡浩宇的新公司Anuttacon則走出了第三條路:《Whispers from the Star》以AI實(shí)時(shí)對(duì)話為核心玩法——玩家通過(guò)自然語(yǔ)言與AI角色Stella互動(dòng),引導(dǎo)她在太空生存場(chǎng)景中行動(dòng)。這款游戲本質(zhì)上是把SimWorld式的“LLM驅(qū)動(dòng)智能體”概念直接做成了商業(yè)產(chǎn)品,只不過(guò)SimWorld里的受自然語(yǔ)言約束的配送員變成了幸存者。


圖10:《Whispers from the Star》官網(wǎng)

兩條路線的分歧:可控性 vs. 涌現(xiàn)性

上述對(duì)照揭示了游戲工業(yè)在AI NPC問(wèn)題上的根本張力。

GTA 6路線選擇完全的可控性——不用生成式AI,所有內(nèi)容由藝術(shù)家和設(shè)計(jì)師手工打造。代價(jià)是極高的制作成本和漫長(zhǎng)的開(kāi)發(fā)周期(GTA 6的開(kāi)發(fā)周期已超過(guò)10年),但回報(bào)是對(duì)交互的精確控制。

SimWorld/inZOI路線則擁抱涌現(xiàn)性——讓LLM驅(qū)動(dòng)的NPC在物理世界中自主行動(dòng),接受一定程度的不確定性和不可預(yù)測(cè)性。SimWorld的配送實(shí)驗(yàn)已經(jīng)揭示了這種涌現(xiàn)性的兩面:一方面,人格設(shè)定確實(shí)塑造了可預(yù)測(cè)的行為模式(盡責(zé)的智能體更勤奮);另一方面,即使是當(dāng)今最強(qiáng)的模型也會(huì)做出不理性的決策(花光積蓄囤積滑板車)。

這兩條路線并非互斥。未來(lái)的游戲很可能是混合架構(gòu)——核心敘事由設(shè)計(jì)師把控(GTA 6路線),而世界填充和背景NPC行為由LLM驅(qū)動(dòng)(SimWorld路線)。

這條可控性-涌現(xiàn)性的光譜已經(jīng)在產(chǎn)業(yè)實(shí)踐中先行展開(kāi)。當(dāng)SimWorld還在用配送任務(wù)驗(yàn)證LLM智能體的行為邏輯時(shí),中國(guó)的游戲公司已經(jīng)把AI NPC推向了上億用戶——騰訊的《和平精英》AI NPC累計(jì)體驗(yàn)用戶過(guò)億,網(wǎng)易的《逆水寒》甚至搭建了游戲內(nèi)的“大模型競(jìng)技場(chǎng)”讓玩家直接評(píng)判不同模型的NPC表現(xiàn),巨人網(wǎng)絡(luò)等公司則將AI能力嵌入現(xiàn)有玩法的具體環(huán)節(jié)(動(dòng)態(tài)劇情、策略預(yù)判)。但這些實(shí)踐與SimWorld之間形成了清晰的分野。SimWorld賦予智能體完全的自主性——經(jīng)濟(jì)動(dòng)機(jī)、人格特質(zhì)、競(jìng)爭(zhēng)合作;騰訊和網(wǎng)易的AI NPC能交互,但行為仍受游戲框架約束;更多的公司(如巨人網(wǎng)絡(luò))則走得更保守,只在特定環(huán)節(jié)引入AI。核心張力始終是同一對(duì)矛盾,即可控性與涌現(xiàn)性之間的平衡,而產(chǎn)業(yè)界人士正在這條光譜上尋找各自的落腳點(diǎn)。

從產(chǎn)業(yè)端看,SimWorld提供了一個(gè)統(tǒng)一的、可復(fù)現(xiàn)的、可擴(kuò)展的試驗(yàn)場(chǎng),讓我們能夠系統(tǒng)地測(cè)量“AI離在真實(shí)世界中生存還有多遠(yuǎn)”。這個(gè)測(cè)量結(jié)果也在告訴游戲公司一個(gè)重要的信息。你們的AI NPC在各種意義上都可能比你以為的更笨——或者更聰明——取決于你用的是哪個(gè)模型,以及你給了它什么樣的prompt。

該研究的局限性

研究團(tuán)隊(duì)雖未在論文中明確列出“局限性”章節(jié),但從實(shí)驗(yàn)設(shè)計(jì)和結(jié)果中可以識(shí)別出以下問(wèn)題:

  1. 場(chǎng)景驗(yàn)證單一:雖然SimWorld號(hào)稱支持“賺錢、職業(yè)發(fā)展、經(jīng)營(yíng)企業(yè)”等長(zhǎng)程目標(biāo),但論文僅展示了配送這一種場(chǎng)景。系統(tǒng)在更復(fù)雜的社會(huì)推理場(chǎng)景(如車聯(lián)網(wǎng))中的表現(xiàn)仍有待驗(yàn)證。

  2. 模型評(píng)估不夠深入:主要關(guān)注利潤(rùn)等宏觀指標(biāo),對(duì)智能體的推理質(zhì)量、常識(shí)錯(cuò)誤(只買不用的滑板車)、安全風(fēng)險(xiǎn)等缺乏細(xì)粒度分析。這些“錯(cuò)誤行為”實(shí)際上可能蘊(yùn)含著更深層的研究?jī)r(jià)值。

  3. 計(jì)算成本高昂:每步2次API調(diào)用、每次約7000個(gè)token,5000步 × 20個(gè)代理意味著巨大的API開(kāi)銷,這在一定程度上限制了實(shí)驗(yàn)的可擴(kuò)展性和可復(fù)現(xiàn)性。

  4. 物理-社會(huì)耦合尚淺:配送任務(wù)中的“社會(huì)”維度主要限于競(jìng)價(jià)和分享訂單,尚未涉及更復(fù)雜的社會(huì)結(jié)構(gòu)(如組織、規(guī)范、文化)。

  5. 缺乏真實(shí)世界驗(yàn)證:所有實(shí)驗(yàn)均在模擬環(huán)境中進(jìn)行,智能體在SimWorld中學(xué)到的策略能否遷移到真實(shí)世界,仍是一個(gè)開(kāi)放問(wèn)題。

  6. 論文性質(zhì):雖然論文已被NeurIPS 2025接收,但目前的案例研究主要關(guān)注利潤(rùn)等宏觀指標(biāo),對(duì)智能體的推理質(zhì)量、常識(shí)錯(cuò)誤、安全風(fēng)險(xiǎn)等缺乏細(xì)粒度分析。作為一個(gè)平臺(tái)型工作,SimWorld的系統(tǒng)說(shuō)明屬性仍強(qiáng)于嚴(yán)格評(píng)估,社區(qū)需要在更多樣化的場(chǎng)景和更嚴(yán)格的對(duì)照實(shí)驗(yàn)中檢驗(yàn)其能力。

結(jié)語(yǔ)

SimWorld作為開(kāi)源項(xiàng)目發(fā)布,這本身就值得肯定。在游戲引擎和AI模型都日益封閉的趨勢(shì)下,一個(gè)基于UE5的、開(kāi)放的、可定制的世界模擬器,為跨學(xué)科合作(機(jī)器人學(xué)、社會(huì)科學(xué)、商業(yè)、公共衛(wèi)生、教育)提供了公共基礎(chǔ)設(shè)施。SimWorld能不能成為它所期望的“奠基性平臺(tái)”,取決于社區(qū)能否在配送任務(wù)之外,構(gòu)建出更多樣、更有挑戰(zhàn)性的場(chǎng)景——那些真正考驗(yàn)AI智能體在物理-社會(huì)世界中“生存能力”的場(chǎng)景。

參考文獻(xiàn)

1. Ren, J., Zhuang, Y., Ye, X., Mao, L., He, X., Shen, J., Dogra, M., Liang, Y., Zhang, R., Yue, T., Yang, Y., Liu, E., Wu, R., Benavente, K., Nagaraju, R. M., Faayez, M., Zhang, X., Sharma, D. V., Zhong, X., Ma, Z., Shu, T., Hu, Z., & Qin, L. (2026). SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds. arXiv:2512.01078v2. https://arxiv.org/abs/2512.01078

2. KRAFTON. (2025). KRAFTON Announces inZOI for PlayStation 5, Launching in H1 2026. https://www.krafton.com/en/news/press/krafton-announces-inzoi-for-playstation-5-launching-in-h1-2026/

3. Rockstar Games. (2025). Grand Theft Auto VI is Now Coming May 26, 2026. https://www.rockstargames.com/newswire/article/258aa538o412ok/grand-theft-auto-vi-is-now-coming-may-26-2026

4. Anuttacon. “Whispers from the Star.” Anuttacon, 14 Aug. 2025, https://wfts.anuttacon.com/.

5. Park, J. S., O'Brien, J., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative Agents: Interactive Simulacra of Human Behavior. UIST 2023.

「游戲×復(fù)雜科學(xué)」讀書(shū)會(huì)


從棋盤上的博弈,到屏幕中的虛擬世界;從概率賭局到人工智能對(duì)弈——游戲從來(lái)不只是娛樂(lè),它是人類理解復(fù)雜性的實(shí)驗(yàn)場(chǎng)。


在簡(jiǎn)單規(guī)則的反復(fù)運(yùn)行中,秩序如何涌現(xiàn)?在多方互動(dòng)的策略競(jìng)爭(zhēng)中,合作如何誕生?在反饋回路與資源循環(huán)中,政治與經(jīng)濟(jì)如何生成?當(dāng)算法接管博弈,Agent開(kāi)始自主演化,我們是否正在見(jiàn)證“可計(jì)算社會(huì)”的雛形?


從康威生命游戲的規(guī)則宇宙,到 AlphaGo 對(duì)圍棋復(fù)雜度的突破;從 John Nash 的均衡理論,到 Norbert Wiener 的控制論反饋思想;從演化博弈到多主體建模,從系統(tǒng)動(dòng)力學(xué)到生成式AI——游戲與復(fù)雜科學(xué),正在交匯為一門新的認(rèn)知范式。


集智俱樂(lè)部聯(lián)合人工智能、AIGC、游戲設(shè)計(jì)、復(fù)雜系統(tǒng)等領(lǐng)域的學(xué)者/工程師共同發(fā)起,自2026年3月31日起,每周二晚19:30-21:30,邀請(qǐng)來(lái)自各領(lǐng)域的研究者與實(shí)踐者,共同探索:

· 游戲如何啟發(fā)科學(xué)?

· 科學(xué)如何重塑游戲?

· 而我們是否生活在一個(gè)巨型多主體演化系統(tǒng)之中?




詳情請(qǐng)見(jiàn):

1.

2.

3.

4.

5.

6.

7.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
李想向黑水軍開(kāi)炮!連發(fā)5條朋友圈,從今天起不忍了

李想向黑水軍開(kāi)炮!連發(fā)5條朋友圈,從今天起不忍了

車東西
2026-04-12 20:30:20
警惕文化入侵!兩朵中國(guó)千年名花,被日漫和西方帶偏,成了晦氣花

警惕文化入侵!兩朵中國(guó)千年名花,被日漫和西方帶偏,成了晦氣花

云景侃記
2026-04-09 17:14:24
哈里梅根 Netflix 私宴同框撒糖,橄欖綠裙配藏藍(lán)西裝氛圍感拉滿

哈里梅根 Netflix 私宴同框撒糖,橄欖綠裙配藏藍(lán)西裝氛圍感拉滿

述家?jiàn)视?/span>
2026-04-13 10:09:49
性需求是人的活力來(lái)源,性需求是成年人最強(qiáng)大的生命力

性需求是人的活力來(lái)源,性需求是成年人最強(qiáng)大的生命力

加油丁小文
2026-04-03 11:30:07
西北地區(qū)首家蘋果直營(yíng)店終于要來(lái)了!

西北地區(qū)首家蘋果直營(yíng)店終于要來(lái)了!

XCiOS俱樂(lè)部
2026-04-12 12:35:02
利好儲(chǔ)戶!國(guó)家推出高息存款,10萬(wàn)5年多賺2000,比銀行香多了

利好儲(chǔ)戶!國(guó)家推出高息存款,10萬(wàn)5年多賺2000,比銀行香多了

牛鍋巴小釩
2026-04-12 21:13:50
江西各地2026年1-2月財(cái)政收入排行:吉安難破50億,景德鎮(zhèn)跌10.2%

江西各地2026年1-2月財(cái)政收入排行:吉安難破50億,景德鎮(zhèn)跌10.2%

水又木二
2026-04-12 11:38:55
中產(chǎn)徹底清醒!鋼琴銷量暴跌72%:不是不愛(ài)音樂(lè),是時(shí)代不裝了…

中產(chǎn)徹底清醒!鋼琴銷量暴跌72%:不是不愛(ài)音樂(lè),是時(shí)代不裝了…

火山詩(shī)話
2026-04-09 13:45:45
李想公布東風(fēng)日產(chǎn)水軍拉踩理想證據(jù)!

李想公布東風(fēng)日產(chǎn)水軍拉踩理想證據(jù)!

鞭牛士
2026-04-11 21:39:08
這一次,“寵女無(wú)度”的賈平凹被扒了個(gè)底朝天,王朔的評(píng)價(jià)是對(duì)的

這一次,“寵女無(wú)度”的賈平凹被扒了個(gè)底朝天,王朔的評(píng)價(jià)是對(duì)的

攬星河的筆記
2026-04-10 20:02:37
阿爾忒彌斯2號(hào)無(wú)動(dòng)力返回到底難在哪?

阿爾忒彌斯2號(hào)無(wú)動(dòng)力返回到底難在哪?

漢宮秋
2026-04-12 18:24:08
戰(zhàn)爭(zhēng)有多燒錢,網(wǎng)友說(shuō)我講一下我家里的局部戰(zhàn)爭(zhēng)你就明白

戰(zhàn)爭(zhēng)有多燒錢,網(wǎng)友說(shuō)我講一下我家里的局部戰(zhàn)爭(zhēng)你就明白

侃神評(píng)故事
2026-04-06 11:45:08
61歲何智麗近照曝光,狀態(tài)判若兩人!日本銀行上班,想回上海養(yǎng)老

61歲何智麗近照曝光,狀態(tài)判若兩人!日本銀行上班,想回上海養(yǎng)老

喜歡歷史的阿繁
2026-04-13 08:14:24
被問(wèn)Model Y值不值得買,大哥一句“買特斯拉特別好”,全場(chǎng)沉默了

被問(wèn)Model Y值不值得買,大哥一句“買特斯拉特別好”,全場(chǎng)沉默了

華庭講美食
2026-04-11 13:01:50
小法:今天國(guó)米基本拿到意甲冠軍了;我們踢得很好但他們更強(qiáng)

小法:今天國(guó)米基本拿到意甲冠軍了;我們踢得很好但他們更強(qiáng)

懂球帝
2026-04-13 07:41:07
離譜!特斯拉發(fā)布新款 Model 金色限定版本

離譜!特斯拉發(fā)布新款 Model 金色限定版本

XCiOS俱樂(lè)部
2026-04-12 09:21:25
葉珂直播自曝全身do了:全身上下翻來(lái)覆去的打,為了漂亮只能忍受

葉珂直播自曝全身do了:全身上下翻來(lái)覆去的打,為了漂亮只能忍受

觀魚(yú)聽(tīng)雨
2026-04-10 19:22:19
山東女子去廣東做客,吃了頓飯才明白:為啥廣東人能吃還那么瘦?

山東女子去廣東做客,吃了頓飯才明白:為啥廣東人能吃還那么瘦?

華庭講美食
2026-04-12 18:42:16
華為AI眼鏡4月21日開(kāi)賣,戴3小時(shí)不想摘!

華為AI眼鏡4月21日開(kāi)賣,戴3小時(shí)不想摘!

我不叫阿哏
2026-04-12 11:11:46
陳坤兒子陳尊佑:我媽不是保姆,也不是周迅,真相15年前就公布了

陳坤兒子陳尊佑:我媽不是保姆,也不是周迅,真相15年前就公布了

伴史緣
2026-04-12 19:53:22
2026-04-13 10:47:00
集智俱樂(lè)部 incentive-icons
集智俱樂(lè)部
科普人工智能相關(guān)知識(shí)技能
5759文章數(shù) 4667關(guān)注度
往期回顧 全部

科技要聞

李想向黑水軍開(kāi)炮!連發(fā)5條朋友圈

頭條要聞

牛彈琴:談判失敗美國(guó)不惜自殘 用的招夠狠夠損也夠蠢

頭條要聞

牛彈琴:談判失敗美國(guó)不惜自殘 用的招夠狠夠損也夠蠢

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂(lè)要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

封鎖,還是收費(fèi)站?

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

教育
親子
時(shí)尚
手機(jī)
軍事航空

教育要聞

最新消息!加拿大擬放寬留學(xué)生工作限制

親子要聞

媽媽的手就是他的阿貝貝

這些才是普通人借鑒的穿搭!上短下長(zhǎng)、上窄下寬,顯瘦又舒適

手機(jī)要聞

華為Pura 90 Pro Max喜提麒麟9030 Pro:華為史上最強(qiáng)芯片 4月20日亮相

軍事要聞

美國(guó)副總統(tǒng)萬(wàn)斯:美伊談判未能達(dá)成協(xié)議

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版