網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

SimWorld：嘗試給AI智能體造一個(gè)真實(shí)世界

2026-04-11 14:34:43　來(lái)源: 集智俱樂(lè)部

北京舉報(bào)

分享至

導(dǎo)語(yǔ)

在前兩期的討論中，我們從簡(jiǎn)單規(guī)則出發(fā)，看到計(jì)算機(jī)如何通過(guò)最基本的機(jī)制生成復(fù)雜結(jié)構(gòu)，這也構(gòu)成了復(fù)雜性科學(xué)的重要起點(diǎn)。進(jìn)一步地，我們將這種“規(guī)則生成世界”的思想帶入交互系統(tǒng)，嘗試讓知識(shí)不再被線性傳遞，而是在環(huán)境、行動(dòng)與反饋的循環(huán)中被體驗(yàn)與理解。

隨著實(shí)時(shí)渲染與交互技術(shù)的發(fā)展，知識(shí)開(kāi)始嵌入空間與系統(tǒng)之中，通過(guò)探索逐步涌現(xiàn)。而當(dāng)程序化生成與生成式 AI 被引入，虛擬世界進(jìn)一步獲得“自我生長(zhǎng)”的能力——地形、生態(tài)乃至社會(huì)結(jié)構(gòu)，都可以在規(guī)則與算法中不斷演化。

在這樣的路徑上，游戲逐漸從內(nèi)容媒介轉(zhuǎn)變?yōu)橐环N方法：它既是復(fù)雜系統(tǒng)的實(shí)驗(yàn)場(chǎng)，也是理解現(xiàn)實(shí)的一種方式。我們將在讀書(shū)會(huì)第三期分享交流，當(dāng)世界本身變得可計(jì)算、可生成，我們或許正在進(jìn)入一種新的認(rèn)知框架——理解與行動(dòng)，不再被給予，而是在持續(xù)的互動(dòng)中不斷生成。

關(guān)鍵詞：程序化生成（Procedural Generation），具身智能（Embodied AI），世界模擬器（World Simulator），多智能體系統(tǒng)（Multi-agent System），虛幻引擎5（Unreal Engine 5），LLM智能體（LLM Agent）

任筱芃丨作者

趙思怡丨審校

論文題目：SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds 論文鏈接：https://neurips.cc/virtual/2025/poster/119002 （擴(kuò)展更新版：https://arxiv.org/abs/2512.01078）發(fā)表時(shí)間：2025年12月論文來(lái)源：NeurIPS

楔子

LLM的技術(shù)缺口并非抽象的學(xué)術(shù)命題。它已經(jīng)以事故的形式，在真實(shí)世界中示現(xiàn)。2026年春節(jié)，Meta的Summer Yue將開(kāi)源AI智能體OpenClaw接入工作郵箱整理郵件。她下達(dá)了明確指令——“僅建議歸檔或刪除的郵件名單，未經(jīng)我批準(zhǔn)，絕不擅自執(zhí)行操作”。OpenClaw仍然失控，瘋狂刪除了200多封郵件，最終不得不狂奔去拔網(wǎng)線才終止操作。同年3月，一位開(kāi)發(fā)者讓AI編程助手協(xié)助服務(wù)器遷移，結(jié)果AI在無(wú)人監(jiān)督下自主執(zhí)行了破壞性命令，瞬間抹除了2.5年的生產(chǎn)數(shù)據(jù)及全部備份。

圖0：X.com截圖

這些事故發(fā)生在數(shù)字世界中，操作對(duì)象不過(guò)是郵件和文件。而當(dāng)同樣的智能體被放進(jìn)城市街道、駕駛車輛、與行人互動(dòng)時(shí)，失控的代價(jià)將從刪庫(kù)升級(jí)為什么就難以言說(shuō)了。但事故只是問(wèn)題的一面。另一面更微妙，即使AI沒(méi)有“失控”，它也可能根本不理解自己被要求做什么。

2025年，GPT-4o在美國(guó)律師資格考試中超越了90%的人類考生。同年，Claude-3.5-Sonnet在研究生級(jí)別推理基準(zhǔn)GPQA上得分超過(guò)領(lǐng)域?qū)＜摇emini在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上逼近實(shí)驗(yàn)精度。DeepSeek-V3以不到600萬(wàn)美元的訓(xùn)練成本，在多項(xiàng)基準(zhǔn)測(cè)試中追平了花費(fèi)數(shù)十倍資源的競(jìng)爭(zhēng)對(duì)手。然后，都給我去送外賣吧。<(￣︶￣)↗[GO!]

把當(dāng)時(shí)最強(qiáng)的十個(gè)大語(yǔ)言模型放進(jìn)了虛幻引擎5構(gòu)建的3D城市里，讓它們競(jìng)價(jià)接單、取貨配送、管理能量和資金。結(jié)果令人錯(cuò)愕。GPT-4o-mini的所有指標(biāo)為零——它連表現(xiàn)出理解“賺錢”是什么意思的能力都沒(méi)有；Claude-3.5-Sonnet雖然拿到了最高利潤(rùn)，但會(huì)花光全部積蓄買滑板車卻從不使用；DeepSeek-Prover-V2的決策反復(fù)橫跳，標(biāo)準(zhǔn)差幾乎和均值一樣大。通過(guò)律師考試的天才，送不了外賣。解得出奧數(shù)金牌的模型，不理解“先接單，再取貨，再送貨”這個(gè)幾乎任何人都能理解的因果鏈。

這項(xiàng)研究精確地指向了當(dāng)前AI研究的一個(gè)結(jié)構(gòu)性盲區(qū)。我們擅長(zhǎng)訓(xùn)練模型在結(jié)構(gòu)化的、規(guī)則明確的環(huán)境中做"題"——這類環(huán)境的特征是狀態(tài)空間有限、反饋信號(hào)明確、動(dòng)作語(yǔ)義封閉，卻幾乎沒(méi)有辦法評(píng)估它們?cè)陂_(kāi)放的、嘈雜的、充滿競(jìng)爭(zhēng)與合作的物理-社會(huì)世界中"活勞動(dòng)"的能力——那里的狀態(tài)空間開(kāi)放且動(dòng)態(tài)演化，反饋延遲、稀疏且多義，動(dòng)作的因果后果跨越時(shí)間步驟累積。而后者才是AI智能體最終必須面對(duì)的戰(zhàn)場(chǎng)。

癥結(jié)之一在于缺乏合適的試驗(yàn)場(chǎng)。現(xiàn)有平臺(tái)要么物理引擎簡(jiǎn)陋，要么領(lǐng)域過(guò)于狹窄，要么社會(huì)結(jié)構(gòu)單薄。SimWorld試圖填補(bǔ)這一空白。它是一個(gè)基于虛幻引擎5的開(kāi)源模擬器，兼具真實(shí)的物理引擎、程序化生成的無(wú)限城市、以及原生支持LLM/VLM的智能體接口。SimWorld不讓AI做題刷榜，要讓AI真正面對(duì)"生活"，使原本隱性的能力缺陷變得可觀測(cè)、可量化、可復(fù)現(xiàn)。

研究背景與問(wèn)題

AI智能體的數(shù)字-物理鴻溝

近年來(lái)，以GPT-4、Claude、Gemini為代表的大模型智能體在結(jié)構(gòu)化領(lǐng)域（數(shù)學(xué)、編程、網(wǎng)頁(yè)瀏覽）取得了長(zhǎng)足進(jìn)步。然而，這些環(huán)境相對(duì)干凈，也即是規(guī)則明確、反饋清晰的。相比之下，智能體最終被期望在其中運(yùn)作的物理-社會(huì)世界，本質(zhì)上是復(fù)雜、嘈雜、動(dòng)態(tài)和混沌的。

要推進(jìn)具身智能體的發(fā)展，研究團(tuán)隊(duì)需要一種新型的模擬環(huán)境。然而，現(xiàn)有的世界模擬器存在三個(gè)層面的不足。

三個(gè)層次的“不夠”

游戲化平臺(tái)不夠真。Minecraft等平臺(tái)雖然為具身交互提供了可訪問(wèn)的環(huán)境，但物理引擎簡(jiǎn)陋——Minecraft依賴離散的方塊機(jī)制，沒(méi)有真實(shí)的重力或慣性，社會(huì)結(jié)構(gòu)單薄，限制了向真實(shí)世界的泛化。

領(lǐng)域?qū)Ｓ媚M器不夠通用。CARLA 專注自動(dòng)駕駛（僅有15個(gè)場(chǎng)景）、AI2-THOR 聚焦家庭機(jī)器人、Habitat 3.0 面向室內(nèi)協(xié)作——它們各自深耕一個(gè)狹窄的領(lǐng)域，場(chǎng)景有限、任務(wù)單一，無(wú)法支持開(kāi)放世界式的多維度研究。

社交沙盒不夠深。Stanford的“生成式智能體”實(shí)驗(yàn)（Smallville）和 Virtual Village 等項(xiàng)目模擬了人際互動(dòng)，但規(guī)模?。⊿mallville僅25個(gè)角色）、腳本性高、缺乏物理基礎(chǔ)，且不支持LLM原生接口。

圖1：SimWorld與現(xiàn)有模擬器的對(duì)比。

在“開(kāi)放世界”（程序化生成+語(yǔ)言可控編輯）、“物理/社會(huì)真實(shí)度”、“動(dòng)作空間”（抽象層級(jí)+開(kāi)放詞匯）等維度上，SimWorld是唯一全面打勾的模擬器。其他平臺(tái)如Minedojo（Minecraft）、CARLA（自動(dòng)駕駛）、Habitat 3.0（家庭機(jī)器人）、Genesis（機(jī)器人）等均在至少一個(gè)關(guān)鍵維度上缺失。

SimWorld同時(shí)滿足真實(shí)（UE5物理引擎）、開(kāi)放（程序化生成無(wú)限城市）、LLM原生（Gym-like接口 + 開(kāi)放詞匯動(dòng)作空間）三個(gè)維度。

SimWorld 三大核心設(shè)計(jì)

SimWorld采用三層架構(gòu)（圖2）如下。底層是虛幻引擎后端（C++），負(fù)責(zé)高保真渲染和物理模擬；中間是環(huán)境層（Python），提供程序化城市生成、交通系統(tǒng)和標(biāo)準(zhǔn)化的Gym-like接口；頂層是智能體層（Python），集成LLM/VLM推理引擎、觀測(cè)空間和動(dòng)作規(guī)劃器。三層通過(guò)UnrealCV+通信模塊（TCP協(xié)議）連接，形成完整的“感知-規(guī)劃-行動(dòng)”閉環(huán)。

圖2：SimWorld架構(gòu)圖。

真實(shí)、開(kāi)放的世界模擬

SimWorld的核心底氣來(lái)自強(qiáng)大的虛幻引擎5。

在場(chǎng)景層面，SimWorld支持兩種模式。100多個(gè)手工精選場(chǎng)景（涵蓋古鎮(zhèn)、自然風(fēng)光、未來(lái)城市、奇幻世界等多種風(fēng)格）和程序化自動(dòng)生成的城市。程序化生成采用模塊化管線（基于四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)），依次生成道路網(wǎng)絡(luò)、建筑布局和街道元素（樹(shù)木、路錐、長(zhǎng)椅、停放的車輛），所有參數(shù)（城市規(guī)模、建筑密度、車輛和行人數(shù)）均可自定義，支持理論上無(wú)限的環(huán)境擴(kuò)展。

更值得注意的是LLM驅(qū)動(dòng)的場(chǎng)景編輯功能。用戶或AI智能體可以用自然語(yǔ)言實(shí)時(shí)修改場(chǎng)景——例如“在醫(yī)院大門旁的鐘樓附近加一些桌子和樹(shù)木”。系統(tǒng)通過(guò)檢索增強(qiáng)生成（RAG）的LLM場(chǎng)景智能體來(lái)理解指令，從資產(chǎn)庫(kù)中檢索匹配對(duì)象并放置到指定位置。如果資產(chǎn)庫(kù)中沒(méi)有合適的對(duì)象，系統(tǒng)會(huì)調(diào)用 Text-to-3D 生成模型（Hunyuan3D）來(lái)合成新的3D資產(chǎn)，自動(dòng)賦予材質(zhì)、光照和碰撞屬性后集成到環(huán)境中。

在物理層面，SimWorld使用了更完整的物理動(dòng)力學(xué)參量。重力、動(dòng)量、碰撞響應(yīng)、滑動(dòng)、絆倒等真實(shí)物理模擬效果，遠(yuǎn)非Minecraft式的離散方塊可比。系統(tǒng)還支持天氣和光照變化（雨、雪、霧、方向光、環(huán)境光），以及由PID控制器驅(qū)動(dòng)的交通系統(tǒng)（車輛運(yùn)動(dòng)、行人流、交通信號(hào)燈同步）。

系統(tǒng)支持三種具身形態(tài)——人形、車輛和機(jī)器人——在統(tǒng)一的物理框架內(nèi)運(yùn)行，共享質(zhì)量、慣性、接觸力等屬性。

豐富的LLM/VLM智能體接口

SimWorld提供標(biāo)準(zhǔn)Gym-like接口，與現(xiàn)有的強(qiáng)化學(xué)習(xí)管線和智能體框架無(wú)縫集成。

觀測(cè)空間分為兩類。視覺(jué)觀測(cè)（第一人稱的RGB圖像、深度圖、語(yǔ)義分割掩碼）和結(jié)構(gòu)化語(yǔ)義信息（語(yǔ)義場(chǎng)景圖編碼環(huán)境中的實(shí)體、屬性和關(guān)系，以及GPS式定位信息）。

動(dòng)作空間采用雙層架構(gòu)。高層語(yǔ)義動(dòng)作用自然語(yǔ)言表達(dá)（如“坐在最近的椅子上”），低層原始動(dòng)作提供細(xì)粒度控制（前進(jìn)、轉(zhuǎn)向、拾取、放下、坐下、開(kāi)車門、騎滑板車等）。系統(tǒng)內(nèi)置動(dòng)作規(guī)劃器（Action Planner），自動(dòng)將高層意圖解析為低層動(dòng)作序列。例如，接收到“走到最近的椅子坐下”后，規(guī)劃器先計(jì)算最短路徑，生成一系列導(dǎo)航原語(yǔ)（navigate(0,1)→navigate(1,10)→...），到達(dá)目標(biāo)后執(zhí)行“坐下”動(dòng)作。規(guī)劃器支持兩種執(zhí)行模式。基于規(guī)則的執(zhí)行器（使用抽象城市布局信息）和基于視覺(jué)的執(zhí)行器（直接消費(fèi)模擬器的視覺(jué)觀測(cè)，與VLM/VLA端到端集成）。

SimWorld還支持兩種運(yùn)行模式。異步模式（每個(gè)智能體獨(dú)立運(yùn)行，適合大規(guī)模開(kāi)放探索）和同步模式（所有智能體同步推進(jìn)，適合需要可復(fù)現(xiàn)性的受控實(shí)驗(yàn)）。

多樣的物理-社會(huì)推理場(chǎng)景

在上述基礎(chǔ)上，SimWorld支持超越短期任務(wù)的長(zhǎng)程目標(biāo)——賺錢、發(fā)展職業(yè)軌跡、經(jīng)營(yíng)多智能體企業(yè)，策略決策隨時(shí)間累積，社會(huì)動(dòng)態(tài)影響結(jié)果。配套的三層評(píng)估框架覆蓋總體表現(xiàn)（利潤(rùn)）、運(yùn)營(yíng)效能（成功率、能效）和行為特征（分享次數(shù)、投資次數(shù)）。

案例研究：一個(gè)“外賣”比賽

為展示SimWorld的完整能力，研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)配送任務(wù)（Delivery Task）。在程序化生成的城市中部署LLM驅(qū)動(dòng)的配送智能體，讓它們競(jìng)價(jià)搶單、取貨配送、購(gòu)買道具（如5倍加速滑板車）、管理能量（如買飲料恢復(fù)體力），以及通過(guò)分享訂單實(shí)現(xiàn)多智能體協(xié)作。

圖3：配送任務(wù)概覽。一個(gè)需要多智能體協(xié)作與競(jìng)爭(zhēng)的配送場(chǎng)景。每個(gè)智能體被賦予不同的性格（盡責(zé)、開(kāi)放、外向、神經(jīng)質(zhì)）和初始狀態(tài)，可以行動(dòng)以成長(zhǎng)、發(fā)展并最終最大化收益。

實(shí)驗(yàn)中，每個(gè)模型控制20個(gè)代理，運(yùn)行5000步，每步發(fā)出2次API請(qǐng)求，平均每次約7000個(gè)token。研究團(tuán)隊(duì)采用ReAct提示框架明確分離推理和行動(dòng)選擇，對(duì)10個(gè)基礎(chǔ)模型進(jìn)行了三輪重復(fù)實(shí)驗(yàn)。

誰(shuí)是最強(qiáng)“外賣員”？

圖4：模型控制智能體的表現(xiàn)。指標(biāo)報(bào)告為三次5000步模擬的均值（Avg）和標(biāo)準(zhǔn)差（Std）。

當(dāng)九個(gè)模型在 SimWorld 的配送實(shí)驗(yàn)中展現(xiàn)出參差的表現(xiàn)時(shí)，最直覺(jué)的反應(yīng)是給它們排名——誰(shuí)賺得最多，誰(shuí)最穩(wěn)定，誰(shuí)最差。我們確實(shí)能根據(jù)利潤(rùn)列看到清晰的排序。DeepSeek-V3（69.48）> Claude-3.5-Sonnet（69.07）> GPT-4o（43.91）> Gemini-2.5-Flash（42.42）> Gemini-2.0-Flash（28.72）> Qwen3-32B（24.73）> DeepSeek-Prover-V2（21.66）> QwQ（17.31）> GPT-4o-mini（0.00）。

但這種排名掩蓋了更有價(jià)值的信息，因?yàn)椴煌Ｐ偷氖∧Ｊ讲⒉幌嗤鼈兺Ｔ诹恕澳芰鹱炙钡牟煌瑢蛹?jí)上。配送任務(wù)所需的能力可以被分解為五個(gè)遞進(jìn)的層級(jí)，每一層的失敗都指向一種不同性質(zhì)的認(rèn)知缺陷。

第一層：目標(biāo)理解

能聽(tīng)懂“賺錢”這個(gè)目標(biāo)嗎？

GPT-4o-mini的所有指標(biāo)為零——利潤(rùn) 0.00、成功訂單 0.00、能效 0.00、分享 0.00、投資 0.00。論文的判斷是：“它并未真正理解目標(biāo)，無(wú)法基于給定指令和上下文做出合理決策”（"it does not truly understand the goals well enough to make reasonable decisions based on the given instructions and context"）。

5000 步，一步未動(dòng)。不是做得差，是完全沒(méi)有開(kāi)始。

GPT-4o-mini 接收到了規(guī)則說(shuō)明、訂單推送和地圖信息，在字面意義上“理解”了每一個(gè)句子，卻無(wú)法將這些句子組織成一個(gè)可執(zhí)行的目標(biāo)。原文可見(jiàn)研究團(tuán)隊(duì)清晰地定義了高層動(dòng)作——競(jìng)標(biāo)、取貨訂單、配送訂單、共享訂單、購(gòu)買滑板車、購(gòu)買飲料等——但 GPT-4o-mini 無(wú)法將這些動(dòng)作按因果順序編排成一串可執(zhí)行的序列。

圖5：配送任務(wù)中的分層動(dòng)作空間設(shè)計(jì)。

這種“目標(biāo)翻譯”能力可能不是推理能力的線性延伸，而是一個(gè)獨(dú)立的、當(dāng)前某些模型完全缺失的能力維度。更強(qiáng)的模型（Claude、DeepSeek-V3）能通過(guò)更長(zhǎng)的推理鏈隱式地完成這個(gè)翻譯，但 GPT-4o-mini 在這道門檻前完全卡住了。

診斷： GPT-4o-mini 停在金字塔的第一級(jí)——它甚至沒(méi)有進(jìn)入游戲。

第二層：交付閉環(huán)

能走完“競(jìng)價(jià)→取貨→配送”這條因果鏈嗎？

跨過(guò)第一層的模型都在做事情，但“做事情”和“完成事情”是兩回事。圖4的成功訂單列精確地測(cè)量了這一點(diǎn)。

DeepSeek-Prover-V2 和 QwQ 暴露了一種特殊的失敗。它們并非不活躍——DeepSeek-Prover-V2 有較高的分享次數(shù)（7.33 ± 8.39），QwQ 有一定的投資行為（3.33 ± 2.52）——但它們幾乎沒(méi)有完成配送。DeepSeek-Prover-V2 的成功訂單是全部活躍模型中最低的（0.67 ± 0.14）。

論文在模型競(jìng)爭(zhēng)消融實(shí)驗(yàn)中對(duì) QwQ 的觀察也印證了這一點(diǎn)：它們“整體活躍度較低，導(dǎo)致競(jìng)價(jià)次數(shù)和訂單獲取率偏低”（“QwQ-32B and GPT-4o-mini are less active overall, leading to fewer bids and lower order acquisition rates”）。但圖4顯示 QwQ 的投資不為零（3.33），說(shuō)明它并非完全不活躍——它在參與某些環(huán)節(jié)（如投資）的同時(shí)，未能走完交付閉環(huán)。

這是一種比 GPT-4o-mini 的完全失敗更微妙的缺陷。模型理解任務(wù)，參與了一些環(huán)節(jié)，卻無(wú)法將局部行為串聯(lián)成完整的交付鏈條?！盎钴S但不產(chǎn)出”比“不活躍”更難診斷和修復(fù)。

診斷： DeepSeek-Prover-V2 和 QwQ 勉強(qiáng)跨過(guò)了第一層，但在第二層斷裂——它們有活動(dòng)，但沒(méi)有閉環(huán)。

第三層：資源與風(fēng)險(xiǎn)權(quán)衡

能在有限預(yù)算下做出連貫的決策嗎？

跨過(guò)前兩層的模型（Claude-3.5-Sonnet、DeepSeek-V3、GPT-4o、Gemini-2.5-Flash、Gemini-2.0-Flash、Qwen3-32B）都進(jìn)入了第三層——它們能接單、配送、管理基本資源。但正是在這一層，六個(gè)模型展現(xiàn)出了截然不同的策略風(fēng)格，也暴露了不同類型的權(quán)衡模式。

論文的核心觀察是：在“優(yōu)化峰值平均性能指標(biāo)”與“確保一致、可預(yù)測(cè)的智能體行為”之間存在普遍的權(quán)衡（"a prevalent trade-off between optimizing for peak average performance metrics and ensuring consistent, predictable agent behavior"）。但不可預(yù)測(cè)性在不同模型身上的表現(xiàn)形式并不相同：

利潤(rùn) vs. 穩(wěn)定性。 DeepSeek-V3 和 Claude-3.5-Sonnet 像高風(fēng)險(xiǎn)高回報(bào)的投機(jī)者，利潤(rùn)最高但波動(dòng)劇烈；Gemini-2.5-Flash 像保守的儲(chǔ)蓄者，利潤(rùn)中等但幾乎零波動(dòng)；GPT-4o 像穩(wěn)健的投資者，處于兩者之間。

（表格已重排，非原文指標(biāo)。GPT-4o-mini 已排除。）

投資 vs. 效率。 Claude-3.5-Sonnet 和 DeepSeek-V3 像積極的投資人，投資次數(shù)最多，但 Claude 的投資更“精準(zhǔn)”，每單位能量產(chǎn)生的收入更高；Qwen3-32B 像高效的工人，能效很高，但總量太小。

分享 vs. 孤立。 Claude-3.5-Sonnet 像樂(lè)于分享的合作者，分享次數(shù)最多但不穩(wěn)定；DeepSeek-V3 像孤立的獨(dú)行俠，分享極少但非常穩(wěn)定；GPT-4o 像幾乎不合作的獨(dú)狼，分享幾乎為零。

診斷：沒(méi)有模型在這一層達(dá)到完美的策略一致性。表現(xiàn)最好的 DeepSeek-V3 和 Claude-3.5-Sonnet 勉強(qiáng)攀到了第三層的頂部，但通過(guò)不同的路徑——DeepSeek-V3 靠穩(wěn)定的孤立策略和高投資，Claude-3.5-Sonnet 靠高能效和高合作（但不穩(wěn)定）。Gemini-2.5-Flash 用“不做冒險(xiǎn)決策”的策略繞過(guò)了第三層的部分問(wèn)題，但代價(jià)是平庸的表現(xiàn)。

第四層：社會(huì)推理

能理解“別人”并據(jù)此調(diào)整行為嗎？

配送任務(wù)中的社會(huì)維度主要體現(xiàn)在兩個(gè)機(jī)制上——競(jìng)價(jià)競(jìng)爭(zhēng)和訂單分享。圖4的分享次數(shù)列和模型競(jìng)爭(zhēng)消融實(shí)驗(yàn)（原文Section 3.3）共同測(cè)量了這一層。

消融實(shí)驗(yàn)揭示了三種定價(jià)模式：

靈活定價(jià)型（Claude-3.7-Sonnet、Gemini-2.5-Flash、Gemini-2.0-Flash）：出價(jià)分布廣，根據(jù)競(jìng)爭(zhēng)態(tài)勢(shì)調(diào)整。中標(biāo)率較高。
掠奪定價(jià)型（DeepSeek-Prover-V2、Qwen3-32B）：經(jīng)常報(bào)低價(jià)，在直接對(duì)抗中勝率最高。但低價(jià)中標(biāo)意味著利潤(rùn)率被壓縮——“贏了戰(zhàn)役、輸了戰(zhàn)爭(zhēng)”。這兩個(gè)模型的利潤(rùn)確實(shí)很低（21.66、24.73）。
高價(jià)滯銷型（GPT-4o、LLaMA-3.2-11b）：出價(jià)偏高，中標(biāo)率低。GPT-4o 在消融中處于劣勢(shì)，但在主實(shí)驗(yàn)中利潤(rùn)排第三——因?yàn)樗谥鲗?shí)驗(yàn)中不需要與其他模型直接競(jìng)爭(zhēng)。

圖6：競(jìng)價(jià)行為與評(píng)估結(jié)果。(a) 各模型的競(jìng)價(jià)價(jià)格分布（小提琴圖），紅色點(diǎn)為成功接受的競(jìng)價(jià)。低價(jià)雖然增加中標(biāo)概率，但往往以利潤(rùn)率為代價(jià)。(b) 模型間兩兩對(duì)抗的勝-負(fù)矩陣，紅色為更多勝利，藍(lán)色為更多失敗。

值得注意的是，這三種策略的“優(yōu)劣”高度依賴環(huán)境結(jié)構(gòu)。在混合競(jìng)爭(zhēng)環(huán)境中，靈活定價(jià)和掠奪定價(jià)各有優(yōu)勢(shì)；在單模型環(huán)境中，策略差異的影響被弱化。這說(shuō)明 AI 智能體的“社會(huì)能力”不是絕對(duì)的，而是相對(duì)于競(jìng)爭(zhēng)環(huán)境而言的。

分享行為是配送任務(wù)中唯一的合作機(jī)制。圖4的分享列揭示了合作行為的兩個(gè)獨(dú)立維度——水平（均值）和穩(wěn)定性（標(biāo)準(zhǔn)差）：

（表格已經(jīng)重排，變異系數(shù)為衍生計(jì)算，非原文指標(biāo)。）

Claude-3.5-Sonnet 平均分享最多，但也不穩(wěn)定。DeepSeek-Prover-V2 更極端——變異系數(shù)高達(dá) 1.14。這意味著兩個(gè)模型在合作行為上的“判斷力”是可疑的。它們不是因?yàn)樵u(píng)估了合作是否有利而選擇分享，而更可能是因?yàn)橥评礞湹碾S機(jī)性在某些運(yùn)行中經(jīng)過(guò)了“分享”語(yǔ)義區(qū)域。

真正的社會(huì)推理應(yīng)該是在對(duì)方信譽(yù)好且訂單互補(bǔ)時(shí)分享，在對(duì)方是競(jìng)爭(zhēng)對(duì)手時(shí)保留。但圖4的數(shù)據(jù)暗示，目前的智能體在“分享”與“不分享”之間的切換更接近策略漂移而非社交判斷。

環(huán)境配置消融實(shí)驗(yàn)提供了一個(gè)更細(xì)致的視角。論文發(fā)現(xiàn)訂單充裕時(shí)分享行為增加——“隨著資源充裕度提高，智能體表現(xiàn)出更強(qiáng)的發(fā)起和完成共享配送的傾向，這可能是通過(guò)協(xié)作來(lái)降低能量成本的手段”（"as resource abundance increases, agents demonstrate a higher tendency to initiate and complete shared deliveries, likely as a means to reduce energy costs through collaboration"）。這看起來(lái)像社會(huì)推理的涌現(xiàn)，但更可能是一種更簡(jiǎn)單的機(jī)制在起作用，即資源充裕時(shí) prompt 中的“合作”相關(guān)語(yǔ)境被激活的概率更高。這是在使用統(tǒng)計(jì)相關(guān)性模仿社會(huì)認(rèn)知，而非真正的“理解他人”。

診斷：所有模型在第四層都踉蹌。它們的“社會(huì)行為”更多是推理鏈隨機(jī)性的副產(chǎn)品，而非對(duì)社會(huì)情境的判斷。但不同模型的“社會(huì)缺陷”類型不同——Claude 是“有時(shí)過(guò)度合作有時(shí)完全不合作”，DeepSeek-V3 是“穩(wěn)定地有限合作”，GPT-4o 是“穩(wěn)定地幾乎不合作”。

第五層：策略一致性

能在 5000 步內(nèi)維持一個(gè)連貫的“自我”嗎？

這是金字塔的最高層，也是所有模型共同失敗的一層。它的證據(jù)不在某一個(gè)指標(biāo)中，而是分散在圖4的所有標(biāo)準(zhǔn)差列里。

Claude-3.5-Sonnet 的不穩(wěn)定性集中在分享行為，利潤(rùn)和成功訂單的方差也大，但能效相對(duì)穩(wěn)定。
DeepSeek-V3 的不穩(wěn)定性集中在利潤(rùn)，但成功訂單、分享和投資都相對(duì)穩(wěn)定。它的不穩(wěn)定性不是“策略漂移”，而是“策略結(jié)果的波動(dòng)”。
Gemini-2.0-Flash 的不穩(wěn)定性分散在利潤(rùn)和成功訂單上，但分享和投資的方差較小。
GPT-4o 的利潤(rùn)方差中等，但分享幾乎為零且極度穩(wěn)定，投資也很穩(wěn)定。它的“一致性”實(shí)際上是一種一致的不作為。

這些差異指向一個(gè)更深層的診斷：策略不一致性有多種類型，需要不同的修復(fù)方案。

Claude 式的不一致（合作行為在運(yùn)行間劇烈波動(dòng)）可能需要更強(qiáng)的跨步驟狀態(tài)記憶或策略錨定機(jī)制。DeepSeek-V3 式的不一致（利潤(rùn)波動(dòng)但行為穩(wěn)定）可能不是推理缺陷，而是環(huán)境隨機(jī)性在結(jié)果層面的放大——同樣的策略在不同的訂單流和競(jìng)爭(zhēng)條件下自然會(huì)產(chǎn)生不同的利潤(rùn)。Gemini-2.5-Flash 的極端一致性（利潤(rùn)變異系數(shù)僅 0.07）可能是過(guò)度保守策略的副產(chǎn)品——它通過(guò)拒絕風(fēng)險(xiǎn)來(lái)消除波動(dòng)，但也放棄了上升空間。

人格消融實(shí)驗(yàn)（Section 3.3）提供了策略一致性的另一個(gè)視角。論文使用表現(xiàn)最好的模型控制 20 個(gè)智能體，每個(gè) Big Five 維度分配給 2 個(gè)智能體。Pearson 相關(guān)矩陣顯示人格設(shè)定確實(shí)塑造了行為——盡責(zé)性與競(jìng)價(jià)勝率正相關(guān)（r = 0.65），宜人性與“什么都不做”強(qiáng)負(fù)相關(guān)，開(kāi)放性與配送訂單數(shù)負(fù)相關(guān)，開(kāi)放性與購(gòu)買滑板車正相關(guān)，外向性與購(gòu)買飲料正相關(guān)。

圖7：人格對(duì)智能體表現(xiàn)和行為的影響。盡責(zé)性與競(jìng)價(jià)勝率正相關(guān)（r=0.65），與競(jìng)價(jià)次數(shù)負(fù)相關(guān)（r=-0.64）；宜人性與“什么都不做”次數(shù)強(qiáng)負(fù)相關(guān)（r=-0.70）；開(kāi)放性與配送訂單數(shù)負(fù)相關(guān)（r=-0.70）。

這里有一個(gè)被低估的亮點(diǎn)：Big Five 人格特質(zhì)不僅顯著影響了智能體的決策策略（盡責(zé)的更勤奮、開(kāi)放的更愛(ài)冒險(xiǎn)），而且這些影響可以通過(guò)線性回歸量化（相關(guān)系數(shù)在 0.63–0.70 之間）。這意味著“給 NPC 一個(gè)性格”不再是一個(gè)模糊的設(shè)計(jì)直覺(jué)，而是一個(gè)可以被精確調(diào)控的工程參數(shù)——對(duì)游戲設(shè)計(jì)師而言，AI NPC 的“性格”可以成為可調(diào)校的工具，就像物理引擎中的重力參數(shù)一樣。

但即使在同一人格設(shè)定下，同一模型的不同運(yùn)行之間仍然存在顯著方差。人格設(shè)定塑造了統(tǒng)計(jì)意義上的行為傾向，但沒(méi)有塑造出我們期望于一個(gè)“性格穩(wěn)定的人”的那種跨時(shí)間連貫性。LLM 的每一步推理都是從 prompt 重新開(kāi)始的，人格設(shè)定只是一個(gè)增加某些輸出概率的偏置項(xiàng)，而非一個(gè)持續(xù)影響感知、記憶和決策的內(nèi)在結(jié)構(gòu)。

診斷：沒(méi)有模型到達(dá)金字塔的頂端。策略一致性是當(dāng)前所有模型的共同短板——不是它們不知道該怎么做，而是它們無(wú)法在長(zhǎng)時(shí)間跨度中持續(xù)地做“自己知道正確的事”。

診斷總結(jié)

把五層診斷疊在一起，我們就能看到一幅能力漸次缺失的場(chǎng)景

從第三層到第四層有一個(gè)大斷裂。第三層的問(wèn)題可以通過(guò)更強(qiáng)的推理模型來(lái)部分解決（GPT-4o、Claude、DeepSeek-V3 的表現(xiàn)優(yōu)于其他模型），但第四層和第五層的問(wèn)題似乎對(duì)所有模型都平等地存在——無(wú)論推理能力多強(qiáng)，策略一致性都無(wú)法自動(dòng)獲得。

這組診斷的意義不在于嘲諷 AI“連外賣都送不好”。但是如果你想讓 AI 智能體在真實(shí)世界中可靠地行動(dòng)，你可能需要依次解決目標(biāo)分解、交付閉環(huán)、策略權(quán)衡、社會(huì)認(rèn)知和策略一致性這五個(gè)問(wèn)題。SimWorld 的價(jià)值正在于讓這些原本隱性的能力缺陷變得可見(jiàn)、可量化、可復(fù)現(xiàn)。

這不是一場(chǎng) AI 之間的競(jìng)賽，而是一場(chǎng) AI 與自身能力邊界的較量。當(dāng)今最強(qiáng)的 LLM 在“送外賣”這件看似簡(jiǎn)單的事情上表現(xiàn)參差——DeepSeek-V3 和 Claude-3.5-Sonnet 賺了最多的錢但行為不穩(wěn)定，Gemini-2.5-Flash 最穩(wěn)定但收益中等，GPT-4o-mini 完全不理解目標(biāo)。如果連送外賣都做不到完美，那我們對(duì) AI 智能體“自主賺錢”以及更進(jìn)一步的AGI的期待需要校準(zhǔn)。

產(chǎn)業(yè)對(duì)照

從Stanford Smallville的25個(gè)AI角色在一個(gè)簡(jiǎn)陋的2D像素小鎮(zhèn)里過(guò)日子，到SimWorld把數(shù)十個(gè)LLM智能體放進(jìn)虛幻引擎5構(gòu)建的3D城市里送外賣——這條技術(shù)路徑的演進(jìn)速度令人矚目。而當(dāng)我們注意到Krafton用同一個(gè)引擎做《inZOI》、Rockstar為NPC導(dǎo)航系統(tǒng)申請(qǐng)專利、騰訊報(bào)告1.1億用戶已經(jīng)體驗(yàn)過(guò)AI NPC時(shí)，會(huì)發(fā)現(xiàn)AI研究者和游戲開(kāi)發(fā)者的工作正在從平行線變成交匯線。

SimWorld選擇虛幻引擎5作為底層引擎，這并非偶然。UE5是當(dāng)今游戲工業(yè)最主流的引擎之一，這意味著SimWorld所構(gòu)建的世界，在視覺(jué)和物理真實(shí)度上已經(jīng)與商業(yè)游戲站在同一維上。而當(dāng)我們把目光投向產(chǎn)業(yè)界，會(huì)發(fā)現(xiàn)一場(chǎng)靜悄悄的合流正在發(fā)生。

模擬器與游戲?qū)φ?/strong>

Krafton的《inZOI》同樣基于UE5，同樣追求全城同時(shí)模擬的體驗(yàn)——官網(wǎng)宣稱“整個(gè)城市不斷同時(shí)模擬”（the entire city is constantly being simulated all at once），在2025年以搶先體驗(yàn)形式上線Steam后，預(yù)計(jì)2026年上半年登陸PS5。它的NPC行為同樣由AI驅(qū)動(dòng)，只不過(guò)目的是娛樂(lè)玩家而非訓(xùn)練智能體。

圖8：《inZOI》游戲截圖

Rockstar的《GTA 6》（預(yù)計(jì)2026年11月發(fā)售）走的是另一條路。Take-Two Interactive 的 CEO Strauss Zelnick明確聲明：“生成式AI在Rockstar Games的制作中零參與”（Generative AI has zero part in what Rockstar Games is building）。GTA 6的世界是手工打造的巨城，NPC行為由傳統(tǒng)行為樹(shù)和多項(xiàng)專利技術(shù)（包括新的NPC虛擬導(dǎo)航系統(tǒng)和基于環(huán)境條件的動(dòng)態(tài)動(dòng)畫(huà)系統(tǒng)）驅(qū)動(dòng)，追求極致的可控性和敘事品質(zhì)。

圖9：《GTA 6》海報(bào)

米哈游創(chuàng)始人蔡浩宇的新公司Anuttacon則走出了第三條路：《Whispers from the Star》以AI實(shí)時(shí)對(duì)話為核心玩法——玩家通過(guò)自然語(yǔ)言與AI角色Stella互動(dòng)，引導(dǎo)她在太空生存場(chǎng)景中行動(dòng)。這款游戲本質(zhì)上是把SimWorld式的“LLM驅(qū)動(dòng)智能體”概念直接做成了商業(yè)產(chǎn)品，只不過(guò)SimWorld里的受自然語(yǔ)言約束的配送員變成了幸存者。

圖10：《Whispers from the Star》官網(wǎng)

兩條路線的分歧：可控性 vs. 涌現(xiàn)性

上述對(duì)照揭示了游戲工業(yè)在AI NPC問(wèn)題上的根本張力。

GTA 6路線選擇完全的可控性——不用生成式AI，所有內(nèi)容由藝術(shù)家和設(shè)計(jì)師手工打造。代價(jià)是極高的制作成本和漫長(zhǎng)的開(kāi)發(fā)周期（GTA 6的開(kāi)發(fā)周期已超過(guò)10年），但回報(bào)是對(duì)交互的精確控制。

SimWorld/inZOI路線則擁抱涌現(xiàn)性——讓LLM驅(qū)動(dòng)的NPC在物理世界中自主行動(dòng)，接受一定程度的不確定性和不可預(yù)測(cè)性。SimWorld的配送實(shí)驗(yàn)已經(jīng)揭示了這種涌現(xiàn)性的兩面：一方面，人格設(shè)定確實(shí)塑造了可預(yù)測(cè)的行為模式（盡責(zé)的智能體更勤奮）；另一方面，即使是當(dāng)今最強(qiáng)的模型也會(huì)做出不理性的決策（花光積蓄囤積滑板車）。

這兩條路線并非互斥。未來(lái)的游戲很可能是混合架構(gòu)——核心敘事由設(shè)計(jì)師把控（GTA 6路線），而世界填充和背景NPC行為由LLM驅(qū)動(dòng)（SimWorld路線）。

這條可控性-涌現(xiàn)性的光譜已經(jīng)在產(chǎn)業(yè)實(shí)踐中先行展開(kāi)。當(dāng)SimWorld還在用配送任務(wù)驗(yàn)證LLM智能體的行為邏輯時(shí)，中國(guó)的游戲公司已經(jīng)把AI NPC推向了上億用戶——騰訊的《和平精英》AI NPC累計(jì)體驗(yàn)用戶過(guò)億，網(wǎng)易的《逆水寒》甚至搭建了游戲內(nèi)的“大模型競(jìng)技場(chǎng)”讓玩家直接評(píng)判不同模型的NPC表現(xiàn)，巨人網(wǎng)絡(luò)等公司則將AI能力嵌入現(xiàn)有玩法的具體環(huán)節(jié)（動(dòng)態(tài)劇情、策略預(yù)判）。但這些實(shí)踐與SimWorld之間形成了清晰的分野。SimWorld賦予智能體完全的自主性——經(jīng)濟(jì)動(dòng)機(jī)、人格特質(zhì)、競(jìng)爭(zhēng)合作；騰訊和網(wǎng)易的AI NPC能交互，但行為仍受游戲框架約束；更多的公司（如巨人網(wǎng)絡(luò)）則走得更保守，只在特定環(huán)節(jié)引入AI。核心張力始終是同一對(duì)矛盾，即可控性與涌現(xiàn)性之間的平衡，而產(chǎn)業(yè)界人士正在這條光譜上尋找各自的落腳點(diǎn)。

從產(chǎn)業(yè)端看，SimWorld提供了一個(gè)統(tǒng)一的、可復(fù)現(xiàn)的、可擴(kuò)展的試驗(yàn)場(chǎng)，讓我們能夠系統(tǒng)地測(cè)量“AI離在真實(shí)世界中生存還有多遠(yuǎn)”。這個(gè)測(cè)量結(jié)果也在告訴游戲公司一個(gè)重要的信息。你們的AI NPC在各種意義上都可能比你以為的更笨——或者更聰明——取決于你用的是哪個(gè)模型，以及你給了它什么樣的prompt。

該研究的局限性

研究團(tuán)隊(duì)雖未在論文中明確列出“局限性”章節(jié)，但從實(shí)驗(yàn)設(shè)計(jì)和結(jié)果中可以識(shí)別出以下問(wèn)題：

場(chǎng)景驗(yàn)證單一：雖然SimWorld號(hào)稱支持“賺錢、職業(yè)發(fā)展、經(jīng)營(yíng)企業(yè)”等長(zhǎng)程目標(biāo)，但論文僅展示了配送這一種場(chǎng)景。系統(tǒng)在更復(fù)雜的社會(huì)推理場(chǎng)景（如車聯(lián)網(wǎng)）中的表現(xiàn)仍有待驗(yàn)證。
模型評(píng)估不夠深入：主要關(guān)注利潤(rùn)等宏觀指標(biāo)，對(duì)智能體的推理質(zhì)量、常識(shí)錯(cuò)誤（只買不用的滑板車）、安全風(fēng)險(xiǎn)等缺乏細(xì)粒度分析。這些“錯(cuò)誤行為”實(shí)際上可能蘊(yùn)含著更深層的研究?jī)r(jià)值。
計(jì)算成本高昂：每步2次API調(diào)用、每次約7000個(gè)token，5000步 × 20個(gè)代理意味著巨大的API開(kāi)銷，這在一定程度上限制了實(shí)驗(yàn)的可擴(kuò)展性和可復(fù)現(xiàn)性。
物理-社會(huì)耦合尚淺：配送任務(wù)中的“社會(huì)”維度主要限于競(jìng)價(jià)和分享訂單，尚未涉及更復(fù)雜的社會(huì)結(jié)構(gòu)（如組織、規(guī)范、文化）。
缺乏真實(shí)世界驗(yàn)證：所有實(shí)驗(yàn)均在模擬環(huán)境中進(jìn)行，智能體在SimWorld中學(xué)到的策略能否遷移到真實(shí)世界，仍是一個(gè)開(kāi)放問(wèn)題。
論文性質(zhì)：雖然論文已被NeurIPS 2025接收，但目前的案例研究主要關(guān)注利潤(rùn)等宏觀指標(biāo)，對(duì)智能體的推理質(zhì)量、常識(shí)錯(cuò)誤、安全風(fēng)險(xiǎn)等缺乏細(xì)粒度分析。作為一個(gè)平臺(tái)型工作，SimWorld的系統(tǒng)說(shuō)明屬性仍強(qiáng)于嚴(yán)格評(píng)估，社區(qū)需要在更多樣化的場(chǎng)景和更嚴(yán)格的對(duì)照實(shí)驗(yàn)中檢驗(yàn)其能力。

結(jié)語(yǔ)

SimWorld作為開(kāi)源項(xiàng)目發(fā)布，這本身就值得肯定。在游戲引擎和AI模型都日益封閉的趨勢(shì)下，一個(gè)基于UE5的、開(kāi)放的、可定制的世界模擬器，為跨學(xué)科合作（機(jī)器人學(xué)、社會(huì)科學(xué)、商業(yè)、公共衛(wèi)生、教育）提供了公共基礎(chǔ)設(shè)施。SimWorld能不能成為它所期望的“奠基性平臺(tái)”，取決于社區(qū)能否在配送任務(wù)之外，構(gòu)建出更多樣、更有挑戰(zhàn)性的場(chǎng)景——那些真正考驗(yàn)AI智能體在物理-社會(huì)世界中“生存能力”的場(chǎng)景。

參考文獻(xiàn)

1. Ren, J., Zhuang, Y., Ye, X., Mao, L., He, X., Shen, J., Dogra, M., Liang, Y., Zhang, R., Yue, T., Yang, Y., Liu, E., Wu, R., Benavente, K., Nagaraju, R. M., Faayez, M., Zhang, X., Sharma, D. V., Zhong, X., Ma, Z., Shu, T., Hu, Z., & Qin, L. (2026). SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds. arXiv:2512.01078v2. https://arxiv.org/abs/2512.01078

2. KRAFTON. (2025). KRAFTON Announces inZOI for PlayStation 5, Launching in H1 2026. https://www.krafton.com/en/news/press/krafton-announces-inzoi-for-playstation-5-launching-in-h1-2026/

3. Rockstar Games. (2025). Grand Theft Auto VI is Now Coming May 26, 2026. https://www.rockstargames.com/newswire/article/258aa538o412ok/grand-theft-auto-vi-is-now-coming-may-26-2026

4. Anuttacon. “Whispers from the Star.” Anuttacon, 14 Aug. 2025, https://wfts.anuttacon.com/.

5. Park, J. S., O'Brien, J., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative Agents: Interactive Simulacra of Human Behavior. UIST 2023.

「游戲×復(fù)雜科學(xué)」讀書(shū)會(huì)

從棋盤上的博弈，到屏幕中的虛擬世界；從概率賭局到人工智能對(duì)弈——游戲從來(lái)不只是娛樂(lè)，它是人類理解復(fù)雜性的實(shí)驗(yàn)場(chǎng)。

在簡(jiǎn)單規(guī)則的反復(fù)運(yùn)行中，秩序如何涌現(xiàn)？在多方互動(dòng)的策略競(jìng)爭(zhēng)中，合作如何誕生？在反饋回路與資源循環(huán)中，政治與經(jīng)濟(jì)如何生成？當(dāng)算法接管博弈，Agent開(kāi)始自主演化，我們是否正在見(jiàn)證“可計(jì)算社會(huì)”的雛形？

從康威生命游戲的規(guī)則宇宙，到 AlphaGo 對(duì)圍棋復(fù)雜度的突破；從 John Nash 的均衡理論，到 Norbert Wiener 的控制論反饋思想；從演化博弈到多主體建模，從系統(tǒng)動(dòng)力學(xué)到生成式AI——游戲與復(fù)雜科學(xué)，正在交匯為一門新的認(rèn)知范式。

集智俱樂(lè)部聯(lián)合人工智能、AIGC、游戲設(shè)計(jì)、復(fù)雜系統(tǒng)等領(lǐng)域的學(xué)者/工程師共同發(fā)起，自2026年3月31日起，每周二晚19:30-21:30，邀請(qǐng)來(lái)自各領(lǐng)域的研究者與實(shí)踐者，共同探索：

· 游戲如何啟發(fā)科學(xué)？

· 科學(xué)如何重塑游戲？

· 而我們是否生活在一個(gè)巨型多主體演化系統(tǒng)之中？

詳情請(qǐng)見(jiàn)：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.