国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

網(wǎng)民票選AI王者,LMArena一夜變17億美元獨角獸!

0
分享至

一場AI界的《創(chuàng)造101》火了!LMArena讓你盲投選出最強AI,三年從校園項目逆襲,剛剛?cè)?.5億美元,估值飆到17億美元。眾包投票挑戰(zhàn)專家權(quán)威,爭議四起,卻已成行業(yè)標桿。你的票,就能決定下一個AI頂流!

一場AI界的《創(chuàng)造101》火了!

ChatGPT、Claude、Gemini、Grok等一眾AI「練習生」整齊站好,緊張等待公演。

這不是選秀節(jié)目,而是真實發(fā)生在lmarena.ai上的AI大亂斗。

這個曾經(jīng)的校園開源小項目,最近剛?cè)诘?.5億美元,估值17億美元。

頂級AI實驗室如OpenAI、Google、xAI、Microsoft,都搶著把自家模型送來「試鏡」。

現(xiàn)在,AI強弱不再是大公司自己說了算,決定權(quán)掌握在全球網(wǎng)民手上。

這場「AI創(chuàng)造營」到底怎么玩?誰會成為下一個出道頂流?讓我們一起揭秘。

LMArena的「選秀起源」

從校園項目到硅谷舞臺

一切要從2023年說起。當時,加州大學伯克利分校Sky Computing Lab里,一群研究生和教授搞了個開源小項目,叫Chatbot Arena。

創(chuàng)始人包括伯克利計算機科學教授Ion Stoica(Databricks聯(lián)合創(chuàng)始人)、研究生Anastasios Angelopoulos(現(xiàn)CEO)和Wei-Lin Chiang(現(xiàn)CTO)。


他們最初只是想做一個簡單實驗:讓網(wǎng)友匿名比拼不同AI聊天機器人,看哪個回答更好。

沒想到,這個項目一上線就火了,迅速變成AI圈最受歡迎的眾包基準平臺。

短短三年時間,Chatbot Arena就積累了海量用戶。2025年5月,它正式轉(zhuǎn)為營利性公司,更名為LMArena,并完成1億美元種子輪融資,估值6億美元。

轉(zhuǎn)折點發(fā)生在2026年1月6日——就在昨天!

LMArena宣布完成1.5億美元新一輪融資,由Felicis和加州大學投資臂聯(lián)合領(lǐng)投,Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners等明星機構(gòu)跟投。

公司估值直接飆升到17億美元,總?cè)谫Y額超過2.5億美元!

如今,LMArena已經(jīng)擁有超過500萬月活躍用戶,覆蓋150個國家,每月產(chǎn)生超過6000萬次對話。

這些用戶像是投票的「全民制作人」。連最頂級AI實驗室,都把自家最新模型悄悄送來PK。


從一個學術(shù)小實驗,到硅谷新貴,LMArena用三年時間完成了許多選秀冠軍都羨慕的逆襲。

但真正讓它火起來的秘密武器,正是那個簡單卻上癮的「盲盒PK」投票機制。

盲盒PK與網(wǎng)民投票

「全民制作人」的權(quán)利游戲

選秀節(jié)目的高潮,是舞臺公演和現(xiàn)場打投。LMArena的「公演舞臺」也一樣刺激:它叫Arena模式,核心就是一個字——盲!

打開lmarena.ai,進入戰(zhàn)斗模式,隨便輸入一個問題,系統(tǒng)開始隨機匹配兩個匿名AI模型,同時給出答案。

你不知道是誰生成的,只能憑感覺投票。投完票,網(wǎng)站才會揭曉:哦,原來左邊是Gemini-3-Pro,右邊是Grok-4.1!

這種形式很像拆盲盒——公平又上癮。

總得票數(shù)也算入評分體系。LMArena用Elo評分系統(tǒng)實時計算,每贏一次加分,輸了扣分。


7天前的總分榜單,Gemini-3-pro穩(wěn)居榜首

總得分匯總之后,還會公開不同類別的榜單:文本對話、網(wǎng)頁開發(fā)、視覺理解文本生成圖像、圖像編輯、搜索、甚至文本/圖像生成視頻。

在熱門類別里,Gemini-3-Pro在文本和視覺領(lǐng)域遙遙領(lǐng)先,Grok-4.1-thinking緊追不舍,而圖像編輯里GPT-Image-1.5和Gemini的變種輪流霸榜。

怎么一場「選秀比賽」能引得這些頂級模型下場?CEO Anastasios Angelopoulos揭開真相:

領(lǐng)先的AI公司用我們,是因為他們自己都很難判斷模型到底好不好。

還沒公開發(fā)布的新模型,都會偷偷托管到LMArena先測試一下,拿網(wǎng)友反饋快速更新迭代。

網(wǎng)友也不只是實驗的小白鼠,甚至還有點爽——不用懂技術(shù),上手幾分鐘就能當「全民制作人」,把喜歡的AI投上C位。

數(shù)百萬張票匯成熱搜排行,誰上誰下,全看網(wǎng)友心情。

「黑幕」質(zhì)疑與「付費導師」的對決

選秀節(jié)目再火,也逃不過「黑幕」質(zhì)疑和粉絲撕X。LMArena同樣不例外——它一出道就卷入各種爭議,有人喊「太民主了」,有人罵「太亂了」。

吐槽最多的,是眾包投票容易被操縱。

2025年,一篇論文直接曝出黑幕:Meta在Llama 4發(fā)布前,偷偷提交了36個私有變體模型,反復測試「刷分」,成功gaming 排行榜。


研究者來自Cohere、Stanford、MIT等機構(gòu),直指頂級實驗室能通過多次私測優(yōu)化,中小玩家根本玩不起。

類似指控還有:某些大公司被懷疑刷票或優(yōu)先托管新模型,讓排行榜看起來「偏心」。

還有人認為,網(wǎng)民投票不夠?qū)I(yè)。隨便一個網(wǎng)友的票,怎么能跟專家比?

這就牽扯出最大競爭對手——Scale AI。Scale的評價方式完全不同:他們花大錢雇傭付費專家,比如律師、教授、醫(yī)生,來給AI答案打分。

2025年9月,Scale直接推出「Seal Showdown」平臺,公開叫板 LMArena,宣稱自己的方法更有代表性、更嚴謹,避免了眾包的噪音和偏見。


聯(lián)合創(chuàng)始人Ion Stoica去年接受采訪時說過:

最高質(zhì)量的評估——黃金標準——就是讓人們在自己熟悉的話題上投票。

他們認為,用戶對自家問題最懂,能給出最誠實的反饋;付費專家反而可能有偏見或不接地氣。

而且,全球150國用戶的多樣性,讓排行榜更全面,避免了單一文化霸權(quán)。

爭議歸爭議,LMArena的排行榜還是成了行業(yè)事實標準——大公司照樣搶著上。

但選秀不會止步于打投,LMArena已經(jīng)在憋大招。

從排行榜到「AI經(jīng)紀公司」

選秀冠軍出道后,最興奮的莫過于「后續(xù)規(guī)劃」:開演唱會、拍綜藝、接代言,還是轉(zhuǎn)型演員?

LMArena也一樣它不滿足于只辦比賽,已經(jīng)在準備進化成AI界的「全能經(jīng)紀公司」。

新一輪1.5億美元融資,主要就是砸在這上面。

公司公告明確表示,資金將用于大規(guī)模擴充計算資源、招聘頂級工程師,并推出企業(yè)級AI評估服務(wù)。


以后,LMArena不光讓網(wǎng)友玩盲測,還會為OpenAI、Google、xAI這樣的大廠提供付費專業(yè)評估,幫他們跑模型、收集反饋、生成報告,甚至深度定制基準測試。

LMArena在強化學習方向同樣野心勃勃。聯(lián)合創(chuàng)始人Ion Stoica早前就透露過,公司正考慮用海量用戶投票數(shù)據(jù)來訓練AI模型——這就是傳說中的RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)。

把「好回答」當獎勵、「差回答」當懲罰,讓AI像練習生苦練舞蹈一樣,不斷優(yōu)化自己。

投資者、Felicis合伙人Peter Deng在采訪中直言:

一旦成為事實上的基準層,產(chǎn)品自然會擴展。真正價值在于與AI實驗室的深度合作——結(jié)合他們的內(nèi)部數(shù)據(jù)和我們的比較外部數(shù)據(jù)。”

這場「AI創(chuàng)造營」才剛剛開播,高潮還在后頭。

LMArena用三年時間證明了一個瘋狂的事實——在AI時代,眾包的力量能碾壓傳統(tǒng)專家,民主投票能成為最鋒利的標尺。

更重要的是,它把我們從旁觀者變成了主角。你的每一張票,不只決定了今天的排行榜C位,還可能在悄無聲息中塑造明天的超級AI。

ChatGPT、Grok、Gemini……誰能持續(xù)霸榜,誰又會突然被黑馬反超,全看我們這些「全民制作人」的心情。

AI的未來不再遙遠,它就藏在你的下一票里。

參考資料:

https://www.theinformation.com/articles/ai-evaluation-startup-lmarena-valued-1-7-billion-new-funding-round?rc=epv9gi

文章來源:新智元。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
許世友晚年三次自殺,用毛巾勒脖子,拔掉靜脈插管,醫(yī)生:何苦啊

許世友晚年三次自殺,用毛巾勒脖子,拔掉靜脈插管,醫(yī)生:何苦啊

搜史君
2026-02-25 15:20:07
秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認了,憑什么還要跪岳飛的母親?

秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認了,憑什么還要跪岳飛的母親?

不八卦掌門人
2026-02-23 13:35:25
央媒對谷愛凌的稱呼變了,七字之差釋放強烈信號,鄧亞萍說得太對

央媒對谷愛凌的稱呼變了,七字之差釋放強烈信號,鄧亞萍說得太對

TVB的四小花
2026-02-25 07:32:05
吳石后人有點意思:明明父親是烈士,兒子吳韶成在河南卻格外低調(diào)

吳石后人有點意思:明明父親是烈士,兒子吳韶成在河南卻格外低調(diào)

冰雅憶史
2026-02-25 09:17:13
荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應商,不再合作!

荷蘭沒回頭路了!中國子公司宣布:正式換國內(nèi)供應商,不再合作!

時尚的弄潮
2026-02-25 15:10:22
國防部重磅定調(diào),從臺軍到臺獨武裝,稱謂之變藏統(tǒng)一加速信號

國防部重磅定調(diào),從臺軍到臺獨武裝,稱謂之變藏統(tǒng)一加速信號

華山穹劍
2026-02-25 19:19:18
2026年公務(wù)員政審三代最新標準

2026年公務(wù)員政審三代最新標準

深度報
2026-02-22 22:51:50
前國腳高峰現(xiàn)狀:54歲很顯老,妻子也是運動員,二兒子和繼父更親

前國腳高峰現(xiàn)狀:54歲很顯老,妻子也是運動員,二兒子和繼父更親

以茶帶書
2026-02-25 19:52:54
18點05,CCTV直播!中國男籃vs日本 媒體人曝新消息 預測首發(fā)如下

18點05,CCTV直播!中國男籃vs日本 媒體人曝新消息 預測首發(fā)如下

大秦壁虎白話體育
2026-02-25 17:00:28
長得太漂亮了,真正的珠圓玉潤,標準的東方美女!

長得太漂亮了,真正的珠圓玉潤,標準的東方美女!

TVB的四小花
2026-02-25 15:16:05
漲停,17萬手封單!A股第一名

漲停,17萬手封單!A股第一名

新浪財經(jīng)
2026-02-25 16:56:34
民調(diào)飆升,點名蔣萬安接替賴清德?只怕趕走臺獨,又迎來更難纏的

民調(diào)飆升,點名蔣萬安接替賴清德?只怕趕走臺獨,又迎來更難纏的

不似少年游
2026-02-25 07:35:29
日元購買力狂降,對人民幣急速貶值,中國游客不去經(jīng)濟還有希望嗎

日元購買力狂降,對人民幣急速貶值,中國游客不去經(jīng)濟還有希望嗎

次元君情感
2026-02-25 19:21:48
孕婦深夜路邊直播求救,稱羊水破了老公不管?民警搜尋近一小時發(fā)現(xiàn)其編造引流:已批評教育

孕婦深夜路邊直播求救,稱羊水破了老公不管?民警搜尋近一小時發(fā)現(xiàn)其編造引流:已批評教育

極目新聞
2026-02-25 19:04:50
一年掉粉120萬!頂流網(wǎng)紅瑤一瑤「被迫表演」炸上熱搜,網(wǎng)友吵翻

一年掉粉120萬!頂流網(wǎng)紅瑤一瑤「被迫表演」炸上熱搜,網(wǎng)友吵翻

雷科技
2026-02-25 17:37:34
iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

中國能源網(wǎng)
2026-02-24 12:01:06
上海海港官宣:安佩姆租借加盟

上海海港官宣:安佩姆租借加盟

五星體育
2026-02-25 16:57:41
訂單排到年底!亨通、永鼎、華工、烽火,誰是光通信里最能漲的?

訂單排到年底!亨通、永鼎、華工、烽火,誰是光通信里最能漲的?

Thurman在昆明
2026-02-25 04:45:03
爭議?楊瀚森紀念杯的中國地圖缺少臺灣海南地區(qū) 開拓者已下架視頻

爭議?楊瀚森紀念杯的中國地圖缺少臺灣海南地區(qū) 開拓者已下架視頻

風過鄉(xiāng)
2026-02-25 19:51:50
馬筱梅分享兒子睜眼照!闊嘴大鼻好像媽媽,蘭姐大方曬孫子沒拘束

馬筱梅分享兒子睜眼照!闊嘴大鼻好像媽媽,蘭姐大方曬孫子沒拘束

樂悠悠娛樂
2026-02-25 15:07:24
2026-02-25 20:36:49
算法與數(shù)學之美 incentive-icons
算法與數(shù)學之美
分享知識,交流思想
5374文章數(shù) 64616關(guān)注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

新房被淹男子12年未交物業(yè)費 春節(jié)前后家中停水超50天

頭條要聞

新房被淹男子12年未交物業(yè)費 春節(jié)前后家中停水超50天

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

游戲
本地
教育
親子
公開課

《Reloadian》正式亮相Steam新品試玩節(jié)

本地新聞

津南好·四時總相宜

教育要聞

關(guān)注 | 當孩子滿口“網(wǎng)絡(luò)諧音?!保菏钦Z言潮流,還是表達力危機?

親子要聞

總想把世界上最好的都給你 但卻發(fā)現(xiàn)世界上最好的就是你!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版