国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

香蕉和GPT Image之外的第3條路:華人15人團(tuán)隊(duì)造出AI生圖黑馬

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

一支不到15人的團(tuán)隊(duì),把圖像模型做到了全球第三

5月6日凌晨,Luma AI正式宣布開放Uni-1.1 API

幾乎在同一時(shí)間,由第三方機(jī)構(gòu)Arena.ai發(fā)布的圖像生成榜單,完成了最新一輪的“大洗牌”——

Luma憑UNI-1.1與UNI-1.1-Max直接沖進(jìn)全球前三,僅次于OpenAI(gpt-image-2)Google(nano-banana-2)。


△Arena.ai圖片生成榜單

把Microsoft AI、Reve、xAI等玩家……悉數(shù)甩在身后。

這個(gè)排名的含金量不言而喻,Arena.ai采用的是一套依靠用戶盲測(cè)投票產(chǎn)出的ELO評(píng)分系統(tǒng),沒有官方公關(guān)或自報(bào)數(shù)據(jù),每張圖都是由真實(shí)用戶在不知道模型來源的前提下,對(duì)兩份生成結(jié)果二選一投出來的。

這意味著,在真實(shí)場(chǎng)景下,圖像模型Uni-1.1的審美和輸出質(zhì)量,已經(jīng)成了OpenAI和Google之外的最優(yōu)解。

隨API、排名榜單一同發(fā)布的,還有兩項(xiàng)硬指標(biāo)值得一起看:

  • 價(jià)格腰斬:2K分辨率單圖最低$0.0404(合人民幣0.2755元),對(duì)比Nano Banana級(jí)別模型直接砍半;
  • 落地飛快:阿迪達(dá)斯、馬自達(dá)以及陽(yáng)獅集團(tuán)等廣告大戶,已經(jīng)帶頭簽了單。

更值得注意的是,一個(gè)原本預(yù)算1500萬美元、周期一年的廣告campaign,用Luma Agents跑了40小時(shí)、花了不到2萬美元,不僅拓展成多國(guó)本地化版本,還通過了甲方內(nèi)審。

這已經(jīng)不是在討論“圖畫得好不好看”了。

推理和生成,住進(jìn)同一個(gè)模型

很多人最初看到Uni-1,第一反應(yīng)覺得這是又一個(gè)圖像模型。

但Luma這次發(fā)布的真正賣點(diǎn),并不在像素質(zhì)量本身,而是它把推理(reasoning)和生成(generation)放進(jìn)了同一個(gè)模型。

傳統(tǒng)圖像模型的工作流是:用戶寫prompt → 模型直接出圖 → 不滿意→ 換prompt重抽。

整個(gè)過程里,模型理解了什么和模型畫了什么是兩件事,企業(yè)拿這種AI工具去跑品牌投放,最大的痛點(diǎn)是不可控,同一個(gè)角色到了下一張圖就變樣、品牌色每次都飄、跨市場(chǎng)素材風(fēng)格各跑各的。

而Uni的架構(gòu)改變了這件事。

它采用decoder-only自回歸Transformer,文本token與圖像token共享同一個(gè)序列——

也就是說,模型不是先翻譯再畫,而是同時(shí)跨模態(tài)推理;構(gòu)圖、空間、品牌一致性這些約束,是在像素生成之前就已經(jīng)在結(jié)構(gòu)層面被求解。



API層面的體現(xiàn)就是兩個(gè)端點(diǎn):

  • Reasoning端點(diǎn):解構(gòu)指令、規(guī)劃構(gòu)圖、鎖定品牌/角色/產(chǎn)品約束;
  • Generation端點(diǎn):在推理結(jié)果之上完成像素渲染。

這套設(shè)計(jì)的產(chǎn)業(yè)意義,是把創(chuàng)意可控性從prompt工程的玄學(xué),變成了一組能寫進(jìn)生產(chǎn)pipeline的API契約。

誰在用:廣告巨頭、運(yùn)動(dòng)品牌、素材平臺(tái)

Luma這次沒有把Uni-1.1當(dāng)成開發(fā)者玩具發(fā)布,而是直接把企業(yè)客戶名單亮了出來。

1、廣告與營(yíng)銷側(cè)

Publicis Groupe(陽(yáng)獅,全球領(lǐng)先的廣告與傳播集團(tuán))和Serviceplan(歐洲最大的自主經(jīng)營(yíng)廣告代理集團(tuán)):

把Luma Agents(基于Uni-1.1)部署到從策略、創(chuàng)意開發(fā)到生產(chǎn)的全流程。

一個(gè)被多次援引的標(biāo)桿案例是,把某品牌原計(jì)劃1500萬美元、一年期的廣告campaign,用40小時(shí)、不到2萬美元(合人民幣約13.6萬元)的成本,拓展為多國(guó)本地化版本,且通過了甲方內(nèi)部質(zhì)量審核。

Adidas、Mazda:

把Uni-1.1接入品牌內(nèi)容生產(chǎn)流水線,用于跨市場(chǎng)視覺素材的批量生成與一致性維護(hù)。

2、素材與開發(fā)者生態(tài)側(cè)

Envato、Comfy、Runware、Flora、Krea、Magnific、Fal、LovArt等創(chuàng)作者平臺(tái)與AI工作流公司,已基于Uni-1.1 API發(fā)布了集成。

Luma創(chuàng)始人兼CEO Amit Jain把這件事概括為:

用語(yǔ)言思考,用像素想象與渲染,這就是像素中的智能(intelligence in pixels)。
三個(gè)最先被產(chǎn)業(yè)驗(yàn)證的應(yīng)用方向

從已落地的客戶案例倒推,Uni-1.1 API在以下三個(gè)方向上,已經(jīng)有了清晰的ROI模型:

1. 廣告本地化

一支在紐約拍的廣告主視覺,要在東京、利雅得、巴黎、上海各發(fā)一版。

傳統(tǒng)流程要重拍、重P、重做合規(guī)審查,單條預(yù)算從幾萬到幾十萬美元不等。

Uni-1.1單次API調(diào)用支持最多9張參考圖聯(lián)合輸入,把品牌主形象、文字、產(chǎn)品、地域元素作為模型層級(jí)的硬約束傳入,多語(yǔ)言渲染(含中文、阿拉伯文等非拉丁字符)一次到位。

Publicis案例里40小時(shí) vs 一年的差距,就是從這里擠出來的。

2. 電商與產(chǎn)品可視化

電商場(chǎng)景的痛點(diǎn)是量大、SKU雜、還要保證產(chǎn)品本體一致。

開發(fā)者可以把產(chǎn)品照、面料樣、場(chǎng)景參考一并喂給API,單圖成本最低$0.0404,做到按頁(yè)/按用戶/按地域?qū)崟r(shí)生成產(chǎn)品圖,而不是一次拍完反復(fù)套模板。

Luma官方把這種用法叫作reference-grounded brand workflows at scale,即參考圖作為模型級(jí)約束,把視覺身份鎖在所有channel里。

3. 角色與IP一致性

游戲美宣、漫畫、影視前期、虛擬代言——

這些場(chǎng)景需要同一個(gè)角色穿越不同場(chǎng)景、姿態(tài)、光線,但身份信息必須穩(wěn)如老狗。

Uni-1.1的多參考圖機(jī)制+ 句子級(jí)編輯(按句改圖,默認(rèn)保留其他元素),讓這件事可以做成確定性流水線,而不是反復(fù)抽卡賭運(yùn)氣。

能力速覽:3個(gè)例子,看懂邊界

單圖直出一整張「2036年新聞網(wǎng)站」

Prompt:Generate a news website page from the year 2036, featuring relevant news stories and ad blocks designed not for humans, but for AI agents who have evolved into distinct personalities. Both the website and all the advertisements featured on it should be in English.

(生成一個(gè)來自2036年的新聞網(wǎng)站頁(yè)面,其中包含相關(guān)的新聞,以及專門為Agent設(shè)計(jì)的廣告模塊。這些Agent已經(jīng)進(jìn)化出各自獨(dú)特的“人格”。整個(gè)網(wǎng)站內(nèi)容以及所有廣告都必須使用英文呈現(xiàn)。)



一張圖測(cè)出一個(gè)模型的「真實(shí)成色」——

Uni-1.1單次推理生成了一整頁(yè)可讀的新聞網(wǎng)站:

包括報(bào)頭、欄目導(dǎo)航、突發(fā)新聞條、頭條主圖、多欄正文、署名/時(shí)間戳、面向AI受眾的橫幅廣告位、頁(yè)腳鏈接,十幾類版式元素同框,每一類的英文文本都是真實(shí)可讀的。

而不是圖像模型常見的「遠(yuǎn)看OK、但近看全是亂碼」。

這樣的復(fù)雜版面+長(zhǎng)文本任務(wù),在傳統(tǒng)pipeline里要由文本編輯、OCR一致性、版面結(jié)構(gòu)多個(gè)模塊聯(lián)合完成,Uni-1.1把它們捏在了一次推理里。

多參考圖+品牌logo+真人融合



兩只貓+一位真人+Luma logo,4張參考圖融合成一個(gè)有邏輯的會(huì)議場(chǎng)景。

GPT Image 1.5把參考圖當(dāng)貼圖直接嵌入了PPT區(qū)域,Uni-1在語(yǔ)義層面完成了融合,這是品牌campaign里產(chǎn)品+代言人+場(chǎng)景+logo組合最常見的需求。

多輪編輯:三連改不丟主體



去掉前面那只熊→加一個(gè)黑色布簾→改成黑白照片,三輪指令疊加,主體一致性和空間關(guān)系在每一輪都沒崩。

這是按句編輯在生產(chǎn)環(huán)境里最值錢的能力,產(chǎn)品經(jīng)理可以像編輯文檔一樣迭代視覺。

(注:Uni-1.1還支持中文文字渲染、UV貼圖、草稿轉(zhuǎn)漫畫、風(fēng)格遷移、跨年齡角色故事板等更多場(chǎng)景,本文不再展開。)

價(jià)格:把圖像生成的邊際成本打到地板

API直接對(duì)企業(yè)敞開了兩檔計(jì)費(fèi):

Build計(jì)劃(按量計(jì)費(fèi))



Scale計(jì)劃(預(yù)留吞吐,最低8單元起訂)



Luma的官方說法是,價(jià)格與延遲均不到同類模型的一半

這一點(diǎn)在第三方榜單和早期接入客戶的成本對(duì)比里已被實(shí)證。

SDK覆蓋Python/JavaScript/TypeScript/Go/CLI,從platform.lumalabs.ai拿key即可接入。

團(tuán)隊(duì)不到15人,干到全球第三:DDIM之父&CVPR最佳論文作者帶隊(duì)

Uni-1的核心研究團(tuán)隊(duì)不到15人,由兩位華人學(xué)者領(lǐng)銜:

  • 宋佳銘(Jiaming Song):清華本科、斯坦福博士。代表作DDIM(Denoising Diffusion Implicit Models)是擴(kuò)散模型采樣加速的奠基工作之一,被Stable Diffusion、DALL·E等系統(tǒng)廣泛采用;
  • 沈博魁(William Shen):斯坦福本科及博士。代表作獲CVPR 2018 Best Paper Award和RSS 2022 Best Student Paper Award。

一位深耕“生成”、一位精于“理解”。

這種互補(bǔ)的陣容,恰好對(duì)應(yīng)了Uni-1.1“腦手合一”的架構(gòu),讓模型在落筆畫圖之前,先學(xué)會(huì)像人類一樣思考構(gòu)圖和品牌邏輯。



在Google、OpenAI主導(dǎo)的圖像賽道里,一支不到15人的團(tuán)隊(duì),把API定價(jià)壓到同行一半,還順便在Arena.ai上完成了對(duì)一眾大廠的“越級(jí)反殺”,是這次發(fā)布另一個(gè)值得記一筆的產(chǎn)業(yè)信號(hào)。

API發(fā)布前后,Luma團(tuán)隊(duì)在X平臺(tái)上,貼出了三條短評(píng):

Luma首席科學(xué)家宋佳銘說:

我們用的算力規(guī)??赡軙?huì)讓你感到意外。為我們團(tuán)隊(duì)感到驕傲。
(稍微更詳細(xì)的報(bào)告,很快會(huì)發(fā)布。)

Uni-1研究負(fù)責(zé)人沈博魁(William Shen)說:

UNI-1的首發(fā),讓我們成了除OpenAI與Gemini App之外排名最高的實(shí)驗(yàn)室。對(duì)一個(gè)第一代統(tǒng)一圖像模型來說,這個(gè)起點(diǎn)不算差。順帶一提,這次榜單更新里,GPT Image 2的ELO比之前掉了110分,不太確定中間發(fā)生了什么……

而Luma模型產(chǎn)品lead Barkley Dai說:

Luma現(xiàn)在是Arena.ai第三名了。GPT-Image 2級(jí)別的智能,Midjourney級(jí)別的審美,價(jià)格只有Nano Banana的零頭。

兩條背后的潛臺(tái)詞是,Uni-1.1是Luma統(tǒng)一智能路線的第一代產(chǎn)品;

而它是以第一代的身份,直接干到Arena.ai第三名,把價(jià)格壓到同類一半。

下一步:從圖像到“看說推想”的連續(xù)流

按照Luma的路線圖,Uni-1.1只是統(tǒng)一智能的第一代落地形態(tài)。

下一步,他們會(huì)把這套統(tǒng)一框架從靜態(tài)圖像擴(kuò)展到視頻、語(yǔ)音和交互式世界模擬

目標(biāo)是構(gòu)建一個(gè)能在連續(xù)流里看、說、推理、想象的多模態(tài)系統(tǒng)

其CEO Amit Jain對(duì)此的總結(jié)是:

統(tǒng)一智能的真正價(jià)值,不是更好看的圖,而是模型既能理解又能生成之后,AI第一次真正具備了端到端完成創(chuàng)意工作的能力。

API入口:lumalabs.ai/api
官方公告:lumalabs.ai/news/uni-1-1-api
接入文檔:platform.lumalabs.ai
SDK:Python/JavaScript/TypeScript/Go/CLI

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
消失9年后復(fù)出,《藍(lán)色生死戀》最美蘿莉近照嚇壞網(wǎng)友:原來這些年她過得這么慘……

消失9年后復(fù)出,《藍(lán)色生死戀》最美蘿莉近照嚇壞網(wǎng)友:原來這些年她過得這么慘……

英國(guó)那些事兒
2026-05-05 23:35:10
北大韋神近況曝光:模樣大變樣,舊背包不見了,引起網(wǎng)友熱議。

北大韋神近況曝光:模樣大變樣,舊背包不見了,引起網(wǎng)友熱議。

愛下廚的阿椅
2026-05-06 17:32:58
王楚欽,請(qǐng)向“劉爸爸”道歉!功勛隊(duì)醫(yī)不該被呼來喝去

王楚欽,請(qǐng)向“劉爸爸”道歉!功勛隊(duì)醫(yī)不該被呼來喝去

曹老師評(píng)球
2026-05-05 23:03:16
100架美軍機(jī)已經(jīng)到位!開始動(dòng)手前,美方對(duì)中國(guó)提了一個(gè)霸道要求

100架美軍機(jī)已經(jīng)到位!開始動(dòng)手前,美方對(duì)中國(guó)提了一個(gè)霸道要求

流史歲月
2026-05-06 13:25:04
帕金斯怒撕亞歷山大:他的風(fēng)格就是在侮辱籃球,每次進(jìn)攻都在假摔

帕金斯怒撕亞歷山大:他的風(fēng)格就是在侮辱籃球,每次進(jìn)攻都在假摔

小徐講八卦
2026-05-05 16:04:24
韓國(guó)夫婦游完山東后,回去跟朋友說:中國(guó)根本不是我們想象的那樣

韓國(guó)夫婦游完山東后,回去跟朋友說:中國(guó)根本不是我們想象的那樣

石辰搞笑日常
2026-05-06 14:57:38
瀏陽(yáng)爆炸煙花廠附近居民:多名中老年婦女在廠內(nèi)工作,一女性從圍墻洞口逃生

瀏陽(yáng)爆炸煙花廠附近居民:多名中老年婦女在廠內(nèi)工作,一女性從圍墻洞口逃生

雞蛋bot
2026-05-05 15:44:51
油價(jià)大漲超1.71元/升,今年一箱油貴85元后,5月8日油價(jià)或再大漲

油價(jià)大漲超1.71元/升,今年一箱油貴85元后,5月8日油價(jià)或再大漲

油價(jià)早知道
2026-05-04 01:15:42
隨著泰國(guó)0-2,中國(guó)男足0-1,日本3-1,亞洲杯最新積分榜出爐

隨著泰國(guó)0-2,中國(guó)男足0-1,日本3-1,亞洲杯最新積分榜出爐

側(cè)身凌空斬
2026-05-06 03:41:46
定了!斯諾克巨星邀請(qǐng)賽5月9日開桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

定了!斯諾克巨星邀請(qǐng)賽5月9日開桿,吳宜澤領(lǐng)銜,6世界冠軍出戰(zhàn)

劉姚堯的文字城堡
2026-05-06 08:31:36
財(cái)政部擬取消準(zhǔn)入限制,越南汽車行業(yè)三大巨頭慌了!

財(cái)政部擬取消準(zhǔn)入限制,越南汽車行業(yè)三大巨頭慌了!

緬甸中文網(wǎng)
2026-05-06 13:09:17
iPhone用戶為什么突然集體裝VPN

iPhone用戶為什么突然集體裝VPN

我是一個(gè)養(yǎng)蝦人
2026-05-01 07:00:40
新西蘭鄰國(guó)HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國(guó)家危機(jī)”

新西蘭鄰國(guó)HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國(guó)家危機(jī)”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
50歲查理茲·塞隆自曝不婚原因:睡小鮮肉太爽了!

50歲查理茲·塞隆自曝不婚原因:睡小鮮肉太爽了!

阿廢冷眼觀察所
2026-05-05 14:57:32
火出圈了!痞幼自曝已訂購(gòu)張雪機(jī)車:排隊(duì)很久也要買

火出圈了!痞幼自曝已訂購(gòu)張雪機(jī)車:排隊(duì)很久也要買

雷科技
2026-05-06 18:25:39
特朗普訪華有變?美軍機(jī)剛到北京中方就阻斷,華盛頓坐不住了!

特朗普訪華有變?美軍機(jī)剛到北京中方就阻斷,華盛頓坐不住了!

阿器談史
2026-05-06 13:15:47
貝弗利:韋德希望看到哈登輸?shù)魮屍?,騎士輸了他肯定要發(fā)推的

貝弗利:韋德希望看到哈登輸?shù)魮屍?,騎士輸了他肯定要發(fā)推的

懂球帝
2026-05-06 10:53:11
倫敦世乒賽:大捷報(bào)!王楚欽力挽狂瀾,3:0零封對(duì)手,梁靖崑3連敗

倫敦世乒賽:大捷報(bào)!王楚欽力挽狂瀾,3:0零封對(duì)手,梁靖崑3連敗

國(guó)乒二三事
2026-05-06 18:07:11
尷尬極了!母親天天穿緊身褲,女兒吐槽:都快50歲了,穿給誰看呢

尷尬極了!母親天天穿緊身褲,女兒吐槽:都快50歲了,穿給誰看呢

川渝視覺
2026-05-05 20:33:39
一中國(guó)女子西班牙街頭被刺身亡,一男子稱曾試圖阻止兇手也被刺傷

一中國(guó)女子西班牙街頭被刺身亡,一男子稱曾試圖阻止兇手也被刺傷

紅星新聞
2026-05-06 18:10:02
2026-05-06 18:44:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12578文章數(shù) 176461關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

合肥市委書記費(fèi)高云任上被查 曾任江蘇省委政法委書記

頭條要聞

合肥市委書記費(fèi)高云任上被查 曾任江蘇省委政法委書記

體育要聞

活塞1比0騎士:坎寧安不再是一個(gè)人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財(cái)經(jīng)要聞

最新GDP!全國(guó)30強(qiáng)城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

教育
時(shí)尚
健康
本地
數(shù)碼

教育要聞

三桶油招聘哪些專業(yè)?

夏天的白裙,可以像赫本那樣穿

干細(xì)胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

數(shù)碼要聞

券后639元!長(zhǎng)城SPARK S8 PRO 850W氮化鎵版電源正式開售

無障礙瀏覽 進(jìn)入關(guān)懷版