国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

挑戰(zhàn)谷歌!硅谷150人創(chuàng)企發(fā)新模型,性能比肩香蕉、價格便宜三成!

0
分享至


智東西
編譯 楊京麗
編輯 李水青

智東西3月24日消息,3月23日,硅谷初創(chuàng)公司Luma AI正式推出全新圖像模型Uni-1。該模型將圖像理解與圖像生成統(tǒng)一起來,因而既能思考又能創(chuàng)作。Uni-1基準測試與Google的Gemini 3 Pro持平,并且在高分辨率圖像生成任務(wù)中成本降低了約10%到30%,空間理解能力測試得分甚至超過谷歌Nano Banana 2和OpenAI GPT Image 1.5。


▲Luma AI官宣圖片模型Uni-1(圖源:X)

創(chuàng)立于2021年的Luma AI此前以視頻生成工具Dream Machine聞名。此次Uni-1的發(fā)布標志著其從單一視頻生成向“統(tǒng)一智能”方向轉(zhuǎn)型。該模型最早于3月5日隨Luma Agents創(chuàng)意平臺一同亮相,3月22日的公開發(fā)布則面向更廣泛的開發(fā)者和用戶。

值得注意的是,Uni-1大膽地在底層架構(gòu)上做了一次“換道”,拋棄了當前主流的擴散模型(Diffusion)路線,轉(zhuǎn)而采用自回歸生成架構(gòu),即大語言模型所使用的“逐token預(yù)測”方法。這意味著,Uni-1在生成圖像時能夠像語言模型一樣進行推理,而非僅僅“降噪出圖”。一家150人的舊金山初創(chuàng)公司,正在試圖重新定義AI圖像生成的技術(shù)范式。

智東西也親身體驗了一下。我讓它“生成一張宿命感照片,一個長發(fā)飄飄的女子身穿戰(zhàn)國袍,配了把劍”,輸入提示詞后,他會先花幾秒鐘分析我的需求,然后再進行創(chuàng)作。創(chuàng)作花了差不多5分鐘終于完成了,生成的畫面很有電影感,頭發(fā)、衣擺隨風自然飄動,服飾很有質(zhì)感。整體語義理解精準、細節(jié)豐富,但是仔細看可以發(fā)現(xiàn)劍出現(xiàn)了兩把,貌似有點小問題。


▲Uni-1生成的圖片(圖源:Lumalabs)

體驗鏈接在這里,大家也可以去試試。
https://app.lumalabs.ai/

一、告別擴散模型,Uni-1用“語言模型的方式”畫圖

要理解Uni-1的意義,需要先理解它替代了什么。目前AI圖像生成領(lǐng)域的主流方案是擴散模型,即從隨機噪聲出發(fā),在文本嵌入的引導(dǎo)下逐步去噪,最終生成一張圖像。Midjourney、Stable Diffusion、谷歌Imagen 3等知名模型均基于這一范式。擴散模型的視覺效果不錯,但有一個根本性缺陷:它不具備真正的“推理”能力,無法在生成過程中思考空間關(guān)系、物理合理性或邏輯約束。

業(yè)界此前的應(yīng)對方式是“打補丁”。比如,DALL-E 3用GPT-4先改寫用戶提示詞,再交給生成模型;谷歌Imagen 3則依賴Gemini做前置推理。這些方案本質(zhì)上引入了一道“翻譯層”,用來消除創(chuàng)作中的理解偏差。


▲X上網(wǎng)友對于Uni-1的評價(圖源:X)

Uni-1則選擇了一種完全不同的方式。據(jù)Luma AI的技術(shù)文檔,Uni-1采用純解碼器(decoder-only)自回歸Transformer架構(gòu),即文本和圖像token在同一序列中交錯排列,共享傳播通道,不依賴獨立的視覺編碼器。Luma AI稱,Uni-1能在圖像合成前和合成中進行結(jié)構(gòu)化內(nèi)部推理,包括分解指令、解決約束和規(guī)劃構(gòu)圖。

在實際操作中,模型可將多張寵物照片中的動物合成到一個全新場景中,穿上學(xué)術(shù)禮服、站在寫滿科學(xué)圖表的白板前,保留每只動物的獨特特征。以往這些任務(wù)通常需要大量手動調(diào)整或后期處理。


▲Uni-1技術(shù)文檔中示例圖片(圖源:Lumalabs)

二、關(guān)鍵跑分:推理能力拉開差距,邏輯推理得分翻倍

基于推理的視覺編輯的基準測試工具RISEBench從時間、因果、空間和邏輯四大維度對圖像生成AI進行了跑分,Uni-1綜合分0.51,谷歌Nano Banana 2得分0.50,Nano Banana Pro是0.49,OpenAI GPT Image 1.5是0.46??偡挚粗У煤芫o,我們可以聚焦不同維度來比一比:

  • 空間推理:Uni-1得分0.58,Nano Banana 2僅0.47;
  • 邏輯推理:Uni-1得分0.32,略次于Nano Banana 2(0.38),是GPT Image 1.5(0.15)和Qwen-Image-2(0.17)的兩倍以上。


▲五款圖片生成模型RISEBench跑分對比(圖源:Lumalabs)

在ODinW-13物體檢測基準測試中,Uni-1完整版得分46.2 mAP,幾乎追平谷歌Gemini 3 Pro的46.3,大幅領(lǐng)先Qwen3-VL-Thinking的43.2。值得注意的是,Uni-1僅具備理解能力(未經(jīng)生成訓(xùn)練)的變體得分為43.9,而完整版提升了2.3分。這直接證明了一個關(guān)鍵假設(shè):學(xué)會生成圖像,能反過來提升模型的圖像理解能力。


▲物體檢測基準測試Uni-1幾乎追平谷歌Gemini 3 Pro(圖源:Lumalabs)

在與Midjourney v8的對比中,科技媒體The Decoder的測試認為Uni-1在復(fù)雜推理類生成任務(wù)上“明顯優(yōu)于Midjourney v8”。有Reddit用戶在逐一對比后評價:“在真正的邏輯推理、復(fù)雜場景理解、空間合理性這些方面,Uni-1完全碾壓?!辈贿^,Midjourney在藝術(shù)風格化和審美質(zhì)感方面仍保有優(yōu)勢。

三、定價策略:高分辨率比谷歌便宜,瞄準企業(yè)客戶

根據(jù)公開定價數(shù)據(jù),Uni-1在企業(yè)常用的2K分辨率上具有明顯的價格優(yōu)勢:

谷歌Nano Banana 2在低分辨率上仍有價格優(yōu)勢,0.5K圖像約0.045美元/張(約合人民幣0.31元),1K圖像約0.067美元/張(約合人民幣0.46元)。對于大規(guī)模生產(chǎn)高分辨率圖像的企業(yè)團隊而言,Uni-1在質(zhì)量和成本兩端同時占優(yōu)。Luma AI在輸出端的token定價為每百萬token 45.45美元(約合人民幣322元)。

面向個人用戶,定價則分為包年、包月和單次計價三種模式。作為一家初創(chuàng)公司,Luma AI無法在分發(fā)渠道和基礎(chǔ)設(shè)施上與谷歌抗衡,“性能更強、價格更低”是它能打動客戶的核心籌碼。


▲Uni-1定價(圖源:Uni-1官網(wǎng))

四、社區(qū)反饋:從“提示詞碰運氣”到“真正的創(chuàng)作控制”

Uni-1發(fā)布后,盡管大規(guī)模獨立測試仍在進行中,早期社區(qū)反應(yīng)積極。

X平臺用戶反饋良好,網(wǎng)友直言,圖像生成終于不用費勁想提示詞了。Reddit上一位進行了逐項對比測試的用戶給出了更細致的評價:Nano Banana 2在速度和文字渲染上仍有優(yōu)勢,但在“真正的邏輯推理、復(fù)雜場景理解和需要深度思考的編輯任務(wù)”上,Uni-1略勝一籌。該用戶總結(jié)道:“如果你在意的是圖像真正‘合理’,而不只是‘好看又快’,Uni-1是目前的最佳選擇?!?/p>


▲X上網(wǎng)友對于Uni-1的評價(圖源:X)

不過,也有用戶持觀望態(tài)度。部分用戶表示仍在等待完整API權(quán)限以進行獨立測試,對非拉丁文字的處理效果、極端邊緣場景以及最高分辨率下的生成速度仍有疑問??陀^地說,社區(qū)的興奮更多針對“新技術(shù)路線的突破感”,長期表現(xiàn)仍需時間驗證。

目前Uni-1可在lumalabs.ai免費體驗,API訪問正在逐步開放。

結(jié)語:Luma真的能后來居上嗎?

從Uni-1的發(fā)布可以預(yù)測到,AI圖像生成的競爭正在從“誰的圖更好看”轉(zhuǎn)向“誰的模型更能理解指令”。擴散模型統(tǒng)治這一領(lǐng)域已有三年之久,而自回歸架構(gòu)以大語言模型式的推理能力切入,第一次在核心基準測試上證明了這條路線的可行性,也可能影響未來更多實驗室的技術(shù)路線選擇。

真正的考驗在于,Uni-1能否在API大規(guī)模調(diào)用、多語言支持和生成速度上經(jīng)受住企業(yè)級場景的檢驗。這場“架構(gòu)之爭”才剛剛進入正賽。你認為自回歸路線能在圖像生成領(lǐng)域站穩(wěn)腳跟嗎?

來源:VentureBeat、Lumalabs、X、The Decoder

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
4000噸稀土被轉(zhuǎn)運美國?大陸停供臺灣稀土!臺學(xué)者:不如直接統(tǒng)一

4000噸稀土被轉(zhuǎn)運美國?大陸停供臺灣稀土!臺學(xué)者:不如直接統(tǒng)一

小舟談歷史
2026-03-19 17:27:44
人民日報、環(huán)球時報接連發(fā)出警示:日本的軍國主義獠牙已露出來了

人民日報、環(huán)球時報接連發(fā)出警示:日本的軍國主義獠牙已露出來了

賤議你讀史
2026-03-24 00:30:08
新婚13天,她被丈夫砍斷手指,虐待到終生不孕,葬送了大好星途

新婚13天,她被丈夫砍斷手指,虐待到終生不孕,葬送了大好星途

往史過眼云煙
2026-03-13 10:43:13
爆大冷!騎士無緣21分大逆轉(zhuǎn):米切爾28分,哈登背靠背打42分鐘

爆大冷!騎士無緣21分大逆轉(zhuǎn):米切爾28分,哈登背靠背打42分鐘

體壇小李
2026-03-26 10:51:11
又不缺土地,為什么全世界只有中國,在瘋狂地修建高層住宅?

又不缺土地,為什么全世界只有中國,在瘋狂地修建高層住宅?

張黿鹵說體育
2026-02-07 12:45:26
屢犯不改!足協(xié)內(nèi)部處罰變一紙空文,麥麥提江復(fù)出又制造爭議判罰

屢犯不改!足協(xié)內(nèi)部處罰變一紙空文,麥麥提江復(fù)出又制造爭議判罰

格斗聯(lián)盟
2026-03-26 10:11:05
李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

西樓知趣雜談
2026-02-28 21:36:48
中國游客到朝鮮游玩,朝鮮人疑問:為什么中國人自由卻過的不幸福

中國游客到朝鮮游玩,朝鮮人疑問:為什么中國人自由卻過的不幸福

白色得季節(jié)
2026-03-16 19:50:53
壽命與心率的關(guān)系被發(fā)現(xiàn):心率40的人和心率80的人,誰更長壽?

壽命與心率的關(guān)系被發(fā)現(xiàn):心率40的人和心率80的人,誰更長壽?

杜醫(yī)生聊健康
2026-03-23 21:45:03
張雪峰提醒今年高考可能會扎堆報考的五大專業(yè):電氣第一口腔第二

張雪峰提醒今年高考可能會扎堆報考的五大專業(yè):電氣第一口腔第二

解說阿洎
2026-03-25 06:57:46
CBA瘋狂一夜!積分榜亂了:榜首易主,遼寧男籃下跌,廣東升第3

CBA瘋狂一夜!積分榜亂了:榜首易主,遼寧男籃下跌,廣東升第3

銜春信
2026-03-26 09:31:29
楓可憐:在“神顏”標簽下,認真生活與演戲的“燉肉系”女U

楓可憐:在“神顏”標簽下,認真生活與演戲的“燉肉系”女U

碧波萬覽
2026-03-26 00:26:50
肯豆不穿內(nèi)搭不尷尬嗎?

肯豆不穿內(nèi)搭不尷尬嗎?

鄉(xiāng)野小珥
2026-03-26 08:38:37
馬杜羅今天再次“出庭” 此前拒絕美方一切所謂“犯罪指控”

馬杜羅今天再次“出庭” 此前拒絕美方一切所謂“犯罪指控”

閃電新聞
2026-03-26 10:21:04
55年授銜,當主席看到名單中有個熟悉的名字,大筆一揮:他不是少將

55年授銜,當主席看到名單中有個熟悉的名字,大筆一揮:他不是少將

睡前講故事
2025-12-12 13:58:11
深圳粵B牌競價結(jié)果!(2026第3期)

深圳粵B牌競價結(jié)果!(2026第3期)

深圳本地寶
2026-03-25 22:09:43
52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

52歲北京炒股冠軍罕見發(fā)聲:如果手里有10萬,建議死啃美人肩戰(zhàn)法

股經(jīng)縱橫談
2026-03-16 21:56:42
87年,已退休的張愛萍提醒總參謀長:飲鴆止渴你懂吧,所為何事?

87年,已退休的張愛萍提醒總參謀長:飲鴆止渴你懂吧,所為何事?

大運河時空
2026-03-25 09:00:03
“隱形糖王”被揪出:是白糖的8倍,醫(yī)生:天天吃血糖恐怕難穩(wěn)住

“隱形糖王”被揪出:是白糖的8倍,醫(yī)生:天天吃血糖恐怕難穩(wěn)住

健康科普365
2026-03-06 19:00:05
李鵬晚年親口澄清身世:說我是周總理養(yǎng)子?這話其實不準確

李鵬晚年親口澄清身世:說我是周總理養(yǎng)子?這話其實不準確

老杉說歷史
2026-03-21 16:56:05
2026-03-26 11:19:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11433文章數(shù) 117015關(guān)注度
往期回顧 全部

科技要聞

硅谷因AI大裁員?一線工程師戳破真相

頭條要聞

上海36歲女子嫁23歲小伙 拿千萬元房產(chǎn)99%份額"閃離"

頭條要聞

上海36歲女子嫁23歲小伙 拿千萬元房產(chǎn)99%份額"閃離"

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
健康
親子
房產(chǎn)
公開課

教育要聞

ISAR選修課丨重磅古典占星預(yù)測課程:整合6大預(yù)測技法,從入門到實戰(zhàn)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

親子要聞

科普|兒童能不能使用阿片類藥物——專業(yè)解讀家長最怕的“止痛藥”

房產(chǎn)要聞

41億!259畝!建學(xué)?!齺嗊@個大城更,最新方案曝光!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版