国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

蘋果把傳統(tǒng)手藝交給AI了:微調(diào)千問模型自動完成UI設(shè)計(jì)

0
分享至

對于軟件開發(fā)者而言,AI 及通用大語言模型(LLM)固然可在創(chuàng)意寫作和基礎(chǔ)編程任務(wù)上“搭把手”。然而,面對圖形用戶界面(UI)這一占據(jù)現(xiàn)代應(yīng)用程序半壁江山的領(lǐng)域時(shí),它們往往顯得力不從心。

UI 開發(fā)是一項(xiàng)涉及多任務(wù)處理的繁雜工作,一個(gè)能夠從頭設(shè)計(jì) UI 的大模型,必須具備像素級的視覺理解能力、能夠生成邏輯嚴(yán)謹(jǐn)?shù)目删幾g代碼,還要擁有符合人類審美與交互直覺的設(shè)計(jì)判斷力。

蘋果(Apple)公司的研究團(tuán)隊(duì)認(rèn)為,做好 UI 設(shè)計(jì)的關(guān)鍵在于設(shè)計(jì)師的“隱性領(lǐng)域知識”(tacit domain knowledge)。這種關(guān)于美學(xué)、交互和權(quán)衡的直覺,無法通過簡單的爬取網(wǎng)頁數(shù)據(jù)獲得,畢竟,UI 代碼在通用代碼數(shù)據(jù)集中的占比甚至不足 1%。

為填補(bǔ)這一鴻溝,近期,蘋果公司的機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)聯(lián)合卡內(nèi)基梅隆大學(xué)、阿爾托大學(xué)等多家頂尖科研機(jī)構(gòu),通過一系列層層遞進(jìn)的研究,讓 AI 學(xué)會了“看懂”復(fù)雜的移動端屏幕,并結(jié)合獨(dú)特的自動化反饋機(jī)制讓模型“自學(xué)”編寫 UI 代碼,甚至將其引入專業(yè)設(shè)計(jì)師的工作流,由人類專家教導(dǎo) AI,提高其審美與交互設(shè)計(jì)的能力。


(來源:Apple)

首先,要讓 AI 生成 UI,必須讓它能夠像人類一樣精準(zhǔn)地理解屏幕上的每一個(gè)像素。然而,通用的多模態(tài)模型在處理移動 UI 時(shí)存在天然的劣勢:移動設(shè)備屏幕通常具有細(xì)長的縱橫比,充滿了極其微小卻功能關(guān)鍵的圖標(biāo)和文本,這些細(xì)節(jié)在傳統(tǒng)模型的圖像壓縮處理中往往會丟失。

為了解決這一感知瓶頸,研究團(tuán)隊(duì)率先于 2024 年 4 月推出了 Ferret-UI 模型。該模型引入了一種創(chuàng)新的“下任意分辨率”技術(shù),它不再粗暴地縮放圖像,而是根據(jù)屏幕的原始縱橫比(如手機(jī)的豎屏或平板的橫屏),將畫面靈活切割為多個(gè)子圖像,在對此進(jìn)行獨(dú)立編碼。這種處理方式如同給了 AI 一把清晰的“放大鏡”,使其能夠捕捉到微小的 UI 元素。


(來源:Apple)

通過在涵蓋圖標(biāo)識別、文本查找、組件列表等基礎(chǔ)任務(wù),包含功能推斷、交互對話等高級任務(wù)的精選數(shù)據(jù)集上進(jìn)行訓(xùn)練,F(xiàn)erret-UI 展現(xiàn)出了卓越的指代(Referring)與定位(Grounding)能力,其能描述屏幕內(nèi)容,處理點(diǎn)、框、線條等空間指令都不在話下,還能對具體內(nèi)容進(jìn)行精確的坐標(biāo)區(qū)域定位,在理解移動 UI 的基礎(chǔ)任務(wù)方面甚至超越了當(dāng)時(shí)占據(jù)領(lǐng)先地位的 GPT-4V 模型。

此外,針對 UI 領(lǐng)域稀缺高質(zhì)量訓(xùn)練數(shù)據(jù)的痛點(diǎn),團(tuán)隊(duì)也早在 2023 年發(fā)布的另一項(xiàng)名為 ILuvUI 的研究中,提出一種無需人工介入的數(shù)據(jù)生成方案,證明了合成數(shù)據(jù)在提升模型視覺理解力方面的巨大潛力。

研究者利用現(xiàn)有的 UI 檢測技術(shù)提取屏幕元數(shù)據(jù),再結(jié)合 GPT-3.5,生成逼真的問答與描述,形成一套包含 33.5 萬個(gè)樣本的豐富數(shù)據(jù)集。利用這一高質(zhì)量數(shù)據(jù)集,研究人員初步訓(xùn)練出了一個(gè)既能理解界面,也能進(jìn)行多步交互規(guī)劃的大模型。

在解決“看懂”的問題后,下一個(gè)挑戰(zhàn)是如何讓模型寫出高質(zhì)量的 UI 代碼。在 UI 開發(fā)中,代碼不僅要語法正確,還必須能被編譯器接受,同時(shí)渲染出符合預(yù)期的視覺效果。然而,現(xiàn)有的開源代碼數(shù)據(jù)集(如 TheStack)中,SwiftUI 等特定 UI 框架的代碼占比極低,這就讓通用模型難以掌握其編程范式。

2024 年 6 月,蘋果的研究團(tuán)隊(duì)再次優(yōu)化了他們的 UI 模型,提出一種巧妙的“自動化反饋閉環(huán)”訓(xùn)練方法。他們首先使用一個(gè)幾乎沒有接觸過 SwiftUI 數(shù)據(jù)的開源基礎(chǔ)模型(StarChat-Beta),要求其根據(jù)文本描述強(qiáng)行生成大量代碼。

隨后,系統(tǒng)引入了兩個(gè)冷酷的“判官”:一個(gè)是 Swift 編譯器,負(fù)責(zé)剔除無法運(yùn)行的垃圾代碼;另一個(gè)是視覺-語言模型(CLIP),負(fù)責(zé)對比生成的界面截圖與原始描述的匹配度。只有同時(shí)通過編譯檢查且視覺評分高的代碼,才會被用于微調(diào)模型。

經(jīng)過五輪“代碼生成-編譯器驗(yàn)證-視覺匹配度評分(CLIP)-篩選去重”的迭代,這個(gè)名為 UICoder、參數(shù)僅有 15.5B 的模型最終“無中生有”地掌握了 SwiftUI 編程,不僅在代碼的可編譯性上大幅超越基準(zhǔn)模型,還在編譯成功率上擊敗了 GPT-4。

這項(xiàng)技術(shù)成功解決了“理解需求”和“寫出能跑的代碼”之間的 UI 工程鴻溝,確立了利用自動化工具反饋來提升代碼生成質(zhì)量的技術(shù)范式。


(來源:Apple)

蘋果團(tuán)隊(duì)并不想止步于此。眾所周知,在蘋果哲學(xué)中,“設(shè)計(jì)”從來不僅僅意味著外觀,它是功能的靈魂,更是其軟硬件生態(tài)難以被逾越的護(hù)城河。通用 AI 最多能寫出邏輯正確的代碼,卻缺乏對人類交互直覺的深刻理解,簡而言之,AI“沒品味”,也不知道什么是真正的“好設(shè)計(jì)”。

為了讓 AI 也能做出蘋果級別的優(yōu)質(zhì)設(shè)計(jì),研究人員將目光投向了人類設(shè)計(jì)師的專業(yè)知識。傳統(tǒng)的強(qiáng)化學(xué)習(xí)(RLHF)通常要求人類在兩個(gè)選項(xiàng)中進(jìn)行簡單排名(Ranking),但在主觀性極強(qiáng)的設(shè)計(jì)領(lǐng)域,這種二元選擇會導(dǎo)致數(shù)據(jù)噪聲極大,難以傳達(dá)具體的設(shè)計(jì)意圖。

時(shí)間來到 2025 年 9 月,研究團(tuán)隊(duì)在一項(xiàng)最新研究中展示了他們的最終成果,他們推出了一款貼合 UI 設(shè)計(jì)師日常工作流的反饋工具,允許設(shè)計(jì)師“評論”(Commenting)、“繪圖標(biāo)注”(Sketching)甚至直接“修改”(Revising)AI 生成的界面,對其提供反饋。設(shè)計(jì)師的修改痕跡也將轉(zhuǎn)化為訓(xùn)練數(shù)據(jù),用于對模型進(jìn)行獎勵型微調(diào)。


(來源:Apple)

實(shí)驗(yàn)數(shù)據(jù)表明,相比于簡單的比較排名,人類設(shè)計(jì)師直接上手修改的調(diào)整數(shù)據(jù)具有極高的一致性,大模型由此得以精準(zhǔn)捕捉到設(shè)計(jì)師在布局、層級和美學(xué)方面的隱性知識。

令人驚訝的是,僅需使用 181 個(gè)高質(zhì)量的繪圖反饋樣本,對開源模型 Qwen2.5-Coder 進(jìn)行微調(diào),其與其變體系列生成的 UI 質(zhì)量就能在盲測中擊敗包括 GPT-5 在內(nèi)的頂尖專有模型。研究還強(qiáng)調(diào),在 UI 生成的高階階段,領(lǐng)會相應(yīng)領(lǐng)域?qū)<业木唧w修改意圖遠(yuǎn)比海量的模糊評分更為關(guān)鍵。

最終,這項(xiàng)歷時(shí)近三年的系列研究工作共同構(gòu)成了一個(gè)完整的技術(shù)進(jìn)化鏈條:Ferret-UI 賦予了 AI 精準(zhǔn)的視覺感知能力,UICoder 通過自動化反饋解決了代碼實(shí)現(xiàn)的工程難題,而基于設(shè)計(jì)師反饋的研究則注入了人類的審美與設(shè)計(jì)智慧。

長久以來,軟件開發(fā)的本質(zhì)是一場耗時(shí)的“翻譯”游戲:設(shè)計(jì)師將意圖翻譯成圖紙,工程師將圖紙翻譯成代碼,機(jī)器將代碼翻譯成界面。未來,這種轉(zhuǎn)譯之間的損耗有望被消滅:設(shè)計(jì)師落筆的瞬間,就是產(chǎn)品誕生的時(shí)刻。

參考資料:

https://9to5mac.com/2026/02/05/designers-teach-ai-to-generate-better-ui-in-new-apple-study/

https://9to5mac.com/2025/08/14/apple-trained-an-llm-to-teach-itself-good-interface-design-in-swiftui/

https://arxiv.org/pdf/2310.04869

https://arxiv.org/pdf/2404.05719

https://arxiv.org/pdf/2406.07739

https://arxiv.org/pdf/2509.16779

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費(fèi)35萬一年,國內(nèi)學(xué)生僅6千元

西湖大學(xué)打了誰的臉?外籍學(xué)生學(xué)費(fèi)35萬一年,國內(nèi)學(xué)生僅6千元

妍妍教育日記
2026-02-24 18:35:18
“DeepSeek打破慣例,不讓英偉達(dá)先用了”

“DeepSeek打破慣例,不讓英偉達(dá)先用了”

觀察者網(wǎng)
2026-02-26 09:44:08
好消息:2026年起70歲以上老人可享優(yōu)待,農(nóng)民也不例外

好消息:2026年起70歲以上老人可享優(yōu)待,農(nóng)民也不例外

風(fēng)雨與陽光
2026-02-25 22:03:05
希望我國出手相助?計(jì)劃在中國建廠,還承諾將整條生產(chǎn)線搬來我國

希望我國出手相助?計(jì)劃在中國建廠,還承諾將整條生產(chǎn)線搬來我國

古事尋蹤記
2026-01-18 07:06:23
白天作陪晚上同宿?明碼標(biāo)價(jià)8000一回!高端伴游淪為色情交易窩點(diǎn)

白天作陪晚上同宿?明碼標(biāo)價(jià)8000一回!高端伴游淪為色情交易窩點(diǎn)

網(wǎng)絡(luò)易不易
2026-01-20 10:17:46
特朗普苦等4天,被中方“潑了冷水”,來不了北京?中國話里有話

特朗普苦等4天,被中方“潑了冷水”,來不了北京?中國話里有話

嫹筆牂牂
2026-02-25 14:26:29
送他走吧!湖人109-110惜敗魔術(shù),詹姆斯砍21+6+4,東契奇22+9+15

送他走吧!湖人109-110惜敗魔術(shù),詹姆斯砍21+6+4,東契奇22+9+15

星Xin辰大海
2026-02-25 15:10:22
特朗普突放大招,稀有金屬要變天?

特朗普突放大招,稀有金屬要變天?

每日經(jīng)濟(jì)新聞
2026-02-25 15:52:23
我為什么那么厭惡高市早苗

我為什么那么厭惡高市早苗

天真無牙
2026-02-23 11:06:20
50歲重回單身!加拿大前第一夫人蘇菲談離婚后生活:當(dāng)特魯多與水果姐出雙入對,她活出了另一種美...

50歲重回單身!加拿大前第一夫人蘇菲談離婚后生活:當(dāng)特魯多與水果姐出雙入對,她活出了另一種美...

二胎媽媽圈
2026-02-25 21:46:23
北京廟會離譜謝幕:京味兒消亡史,一場關(guān)于"智商稅"的集體記憶

北京廟會離譜謝幕:京味兒消亡史,一場關(guān)于"智商稅"的集體記憶

據(jù)說說娛樂
2026-02-25 15:41:39
從左權(quán)之妻到改嫁左權(quán)秘書,再到山西奪權(quán),劉志蘭究竟經(jīng)歷了什么

從左權(quán)之妻到改嫁左權(quán)秘書,再到山西奪權(quán),劉志蘭究竟經(jīng)歷了什么

舊書卷里的長安
2026-02-22 00:08:58
上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴(yán)選的國泰民安臉

上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴(yán)選的國泰民安臉

大鐵貓娛樂
2026-02-08 00:10:03
美軍不想打仗,跑到航母最底層甲板的廁所,往馬桶里丟垃圾

美軍不想打仗,跑到航母最底層甲板的廁所,往馬桶里丟垃圾

安安說
2026-02-26 10:29:39
特朗普突然發(fā)文昭告全球,包括中國俄羅斯在內(nèi),這次一個(gè)都跑不掉

特朗普突然發(fā)文昭告全球,包括中國俄羅斯在內(nèi),這次一個(gè)都跑不掉

華史談
2026-02-26 09:04:22
除夕前一天,李書福的好搭檔病逝,享年61歲

除夕前一天,李書福的好搭檔病逝,享年61歲

龔進(jìn)輝
2026-02-25 15:07:57
“體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

“體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

米果說識
2026-02-22 11:29:00
小學(xué)階段的大實(shí)話:小學(xué)差的,那是真的差,基本沒有逆襲的可能

小學(xué)階段的大實(shí)話:小學(xué)差的,那是真的差,基本沒有逆襲的可能

好爸育兒
2026-02-25 19:22:49
四川26歲男子離世:初三去奶奶墳前,遺體距家不遠(yuǎn),手機(jī)留著遺言

四川26歲男子離世:初三去奶奶墳前,遺體距家不遠(yuǎn),手機(jī)留著遺言

墨印齋
2026-02-26 04:11:04
庫爾圖瓦:16強(qiáng)大概率會抽到曼城,但還是希望這次能換個(gè)對手

庫爾圖瓦:16強(qiáng)大概率會抽到曼城,但還是希望這次能換個(gè)對手

懂球帝
2026-02-26 07:48:09
2026-02-26 11:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16320文章數(shù) 514656關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

"花壇白骨案"2名兇手因4萬元?dú)⑷寺袷?受害人兒子發(fā)聲

頭條要聞

"花壇白骨案"2名兇手因4萬元?dú)⑷寺袷?受害人兒子發(fā)聲

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財(cái)經(jīng)要聞

短劇市場風(fēng)云突變!有人投百萬賠得精光

汽車要聞

雷克薩斯ES雙色特別版上市 售30.79萬元起

態(tài)度原創(chuàng)

游戲
藝術(shù)
旅游
健康
公開課

劇情設(shè)定已有爆料!《德軍總部》新作真要來了?

藝術(shù)要聞

誰能認(rèn)出這幅14字草書的真正作者?

旅游要聞

“引客入滇”入境旅游激勵3月1日起申報(bào) 符合條件的企業(yè)最高可獲50萬元激勵資金

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版