国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

錄屏扒代碼、截圖改網(wǎng)頁(yè)!Kimi K2.5把「視覺(jué)x代碼」玩明白了

0
分享至

聞樂(lè) 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

說(shuō)真的,AI圈現(xiàn)在恨不得睜眼閉眼就變天,產(chǎn)品一個(gè)接一個(gè),難怪網(wǎng)友都開始“求求你們別更新了”……


△圖源:抖音hyarriver

這不,今天一睜眼就又看到個(gè)新東西。

能直接從錄屏里扒特效代碼并復(fù)現(xiàn)的模型你見(jiàn)過(guò)沒(méi)??反正我是開眼了。

隨手從相冊(cè)里挖出下面這個(gè)視頻上傳,輸入“實(shí)現(xiàn)這個(gè)交互特效”幾個(gè)字:



模型一通操作之后,我得到了如下成品:



只能說(shuō),春節(jié)檔的電影還沒(méi)開始預(yù)熱,中國(guó)的開源力量就已經(jīng)勢(shì)如破竹了。

這是Moonshot AI新推出的最強(qiáng)Agentic模型Kimi K2.5,發(fā)布后就在某推上熱度起飛。



掌門人楊植麟還親自上陣,為這個(gè)新模型錄制了中英兩版介紹視頻。



從視頻內(nèi)容看,Kimi K2.5的升級(jí)點(diǎn)不少:

  • 實(shí)現(xiàn)視覺(jué)與文本、思考與即時(shí)、對(duì)話與Agent功能的一體化整合,主打一個(gè)All in one
  • 具備設(shè)計(jì)審美,可生成帶高級(jí)動(dòng)效的網(wǎng)頁(yè);
  • 支持visual edit可視化編輯,截圖圈選即可修改界面,上傳動(dòng)效錄屏可自動(dòng)拆解邏輯并生成專業(yè)代碼;
  • 推出編程工具Kimi Code,可在終端運(yùn)行,無(wú)縫集成VSCode、Cursor等IDE,支持圖片/視頻輸入,自動(dòng)遷移用戶現(xiàn)有技能與MCP。



本來(lái)只是看完介紹想淺試一下,結(jié)果沒(méi)想到還真有點(diǎn)意思。

那咱就接著細(xì)說(shuō)、接著測(cè)!

視覺(jué)能力是大招

動(dòng)手實(shí)測(cè)之前,先亮一亮Kimi K2.5的基準(zhǔn)測(cè)試成績(jī)單。

K2.5在人類最后的考試HLE、BrowseComp和DeepSearchQA等一眾高難度測(cè)試集上,拿下了SOTA的好成績(jī);

編程方面,在SWE-bench Verified上得分高達(dá)77,以開源的姿態(tài)縮小了和頂級(jí)閉源模型的差距

視覺(jué)理解多項(xiàng)測(cè)試也刷出新高。值得一提的是,在多項(xiàng)評(píng)測(cè)中,K2.5的表現(xiàn)甚至優(yōu)于GPT-5.2-xhigh。



Kimi K2.5這次更新了4種使用模式,適應(yīng)不同場(chǎng)景,不管你有啥需求,都能找到適合自己的打開方式。



  • 快速模式主打極速反饋,適合日常閑聊或簡(jiǎn)單查詢;
  • 思考模式專攻難題,幫你一步步拆解復(fù)雜邏輯;
  • Agent模式則擅長(zhǎng)深度挖掘,比如搞研究、生成辦公文檔或網(wǎng)頁(yè);
  • 最猛的是Agent集群模式,針對(duì)那些需要多線程處理的超級(jí)任務(wù),能調(diào)動(dòng)一大波智能體分身并行執(zhí)行。

開頭的特效復(fù)現(xiàn)案例,就用的是Agent集群模式——Kimi給我分配了一個(gè)叫阿澈的開發(fā)員。



光說(shuō)不練假把式,既然介紹里主打「視覺(jué)x代碼」,那咱就測(cè)一測(cè)K2.5的代碼能力。

第一個(gè)實(shí)測(cè)項(xiàng)目是看圖寫代碼

把一張音樂(lè)播放器網(wǎng)頁(yè)截圖上傳給K2.5作為參考;



然后輸入提示詞:

  • 參考這個(gè)網(wǎng)頁(yè),生成對(duì)應(yīng)代碼

沒(méi)過(guò)多久,一套完整的代碼就新鮮出爐了。



生成的網(wǎng)頁(yè)不僅還原了原設(shè)計(jì)的功能,連按鈕的hover動(dòng)效、音樂(lè)播放進(jìn)度條的滑動(dòng)效果也都做出來(lái)了。

實(shí)際上大家也能看出來(lái),我給的參考圖清晰度不是很高,但模型也能精準(zhǔn)識(shí)別;

網(wǎng)頁(yè)上展示的音樂(lè)封面是模型自己生成的,除此之外可以看出最下方的按鈕布局沒(méi)完全還原,但這個(gè)效果在我看來(lái)已經(jīng)算是一張還原度超過(guò)90%的優(yōu)秀答卷。



當(dāng)然了,大家應(yīng)該也能看到上傳的參考圖片上顯示的是紅色感嘆號(hào),srds模型確實(shí)能識(shí)別圖片進(jìn)行分析,只能說(shuō)所有模型可能都有些小bug,但能干實(shí)事兒就無(wú)傷大雅(doge)。



除了能看圖寫代碼,K2.5還能截圖改代碼

拿剛才生成的音樂(lè)播放器網(wǎng)頁(yè)來(lái)說(shuō),我想讓它調(diào)整一下播放器的布局,于是截了個(gè)圖,圈出播放器的主體部分;



然后告訴K2.5:

  • 把這部分放到左下角



模型秒懂我的意圖,2分鐘之內(nèi)給出了修改后的代碼,刷新網(wǎng)頁(yè)一看,除了截圖部分按要求調(diào)整了布局,其余地方都沒(méi)變,主打一個(gè)精準(zhǔn)(而且這次還沒(méi)紅色感嘆號(hào)hhh)。

而且整個(gè)過(guò)程像在用繪圖軟件涂改一樣直觀,省去了大段文字描述的麻煩。



我又反復(fù)試了幾輪,發(fā)現(xiàn)哪怕圈選區(qū)域模糊、不完整,它也能智能補(bǔ)全意圖,避免了AI常見(jiàn)的誤讀問(wèn)題。

比如我覺(jué)得播放器的配色有點(diǎn)單調(diào),于是截了個(gè)圖,只圈出了播放器左側(cè)欄部分;



告訴K2.5想要換成莫蘭迪色系:

  • 這部分配色有點(diǎn)單調(diào),換成莫蘭迪色系

模型再次秒懂意圖,5分鐘之內(nèi)給出了修改后的代碼,刷新網(wǎng)頁(yè)一看,它自己選的顏色和原來(lái)的搭配起來(lái)還挺和諧,而且不止換了一種顏色,還給我來(lái)了個(gè)“偽漸變”。



就算你既沒(méi)有找到喜歡的設(shè)計(jì)圖,腦子里也暫時(shí)沒(méi)什么想法,也完全不用擔(dān)心,只要簡(jiǎn)簡(jiǎn)單單一句話,也能讓K2.5自由發(fā)揮。

比如我隨手輸入:

  • 幫我生成一個(gè)文藝風(fēng)的書籍推薦網(wǎng)頁(yè)



沒(méi)想到啊沒(méi)想到,它居然整了個(gè)大活兒。

青綠色的背景搭配多種字體,一股文藝氣息撲面而來(lái);鼠標(biāo)掃過(guò)書籍封面還能升起一句話簡(jiǎn)介;



再往下拉,是讀書社區(qū)和「每周一書」活動(dòng)的介紹,卡片還帶有翻轉(zhuǎn)展開的動(dòng)效;



除此之外,Kimi還設(shè)計(jì)了閱讀體驗(yàn)、讀者聚會(huì)、作者介紹等模塊,每一處展示都細(xì)節(jié)滿滿,完全超出了我的預(yù)期,畢竟我的輸入只有一句話……



接下來(lái),我又讓K2.5 Thinking(下圖左)和K2 Thinking(下圖右)分別生成了一個(gè)Switch手柄:

  • 設(shè)計(jì)一個(gè)Switch手柄,屏幕上顯示pygame風(fēng)格的推箱子游戲

放在一起對(duì)比,明顯能看出K2.5 Thinking設(shè)計(jì)出來(lái)的游戲,不管是在畫面比例上還是像素上都優(yōu)于K2 Thinking;

甚至K2.5最終的代碼行數(shù)為738,而K2一共有818行。



看到這兒,你是不是也發(fā)現(xiàn)了,K2.5設(shè)計(jì)出來(lái)的代碼和我們平時(shí)見(jiàn)到的那些AI產(chǎn)物,其實(shí)不太一樣——

不是一水兒的紫色調(diào),也不是呆板的模塊化布局;而是在視覺(jué)上變得更加美觀、更多元化。

顯然,團(tuán)隊(duì)的目標(biāo)不止于功能實(shí)現(xiàn),還想注入設(shè)計(jì)審美,讓AI輸出的創(chuàng)意像人類一樣有靈魂有個(gè)性。

過(guò)去AI編程往往停留在“能跑就好”,現(xiàn)在它能交付高質(zhì)量的專業(yè)級(jí)產(chǎn)品,門檻低到只需一張圖或一句話。

除了「視覺(jué)x代碼」這塊兒亮眼,Kimi K2.5在Office辦公領(lǐng)域也玩得轉(zhuǎn)

  • (上傳文件)把這個(gè)文件內(nèi)容轉(zhuǎn)換為PPT,風(fēng)格為簡(jiǎn)約風(fēng)格,主色調(diào)為灰白色



再看輸出的效果,顏色正確、風(fēng)格正確、分析和展示的內(nèi)容也非常全。

最重要的是可編輯,這樣就極大方便了普通用戶,不懂提示詞工程的人也能用好Kimi;即使AI有啥小差錯(cuò),也不用一遍遍通過(guò)Prompt糾正,自己動(dòng)手隨時(shí)能改。



之前為了應(yīng)對(duì)不同的工作,人需要學(xué)習(xí)不同的Office語(yǔ)言,比如什么公式、函數(shù)、數(shù)據(jù)格式……

現(xiàn)在有了Kimi K2.5,辦公軟件也開始聽人話了。

Agent Swarm是內(nèi)功

如果說(shuō)視覺(jué)能力是Kimi K2.5亮眼的招式,那智能體集群Agent Swarm就是支撐K2.5突破效率的內(nèi)功。

Agent Swarm的核心邏輯,就是讓多個(gè)具備獨(dú)立功能的智能體協(xié)同工作,各司其職又互相配合,本質(zhì)上也是對(duì)分布式AI協(xié)作的具象化表達(dá)。

這個(gè)概念很有可能成為今年Agent領(lǐng)域的核心敘事。

AI圈的大紅人,英偉達(dá)老黃都在2025年多次公開表示,AI Agents有望成為下一個(gè)機(jī)器人級(jí)別的萬(wàn)億級(jí)產(chǎn)業(yè),并且特別看好swarm/collective intelligence(集群/集體智能)的發(fā)展前景,足見(jiàn)這個(gè)賽道的潛力之大。



回顧Kimi的技術(shù)迭代路徑,不難發(fā)現(xiàn)他們?cè)缇烷_始布局“Agents Scaling”。

半年前他們推出首個(gè)萬(wàn)億參數(shù)開源模型Kimi K2,那時(shí)的焦點(diǎn)在參數(shù)Scaling上。

后來(lái)Kimi K2 Thinking上線,通過(guò)延長(zhǎng)思考鏈條,讓單Agent能獨(dú)立搞定長(zhǎng)達(dá)300步的操作序列,提升了長(zhǎng)程任務(wù)處理。

但這遠(yuǎn)遠(yuǎn)不夠,單智能體的能力終究有上限。Kimi團(tuán)隊(duì)也意識(shí)到要啃下真正場(chǎng)景里的復(fù)雜難題,不能只靠單打獨(dú)斗,必須要讓智能體學(xué)會(huì)協(xié)作。

于是,在Kimi K2.5上,他們實(shí)現(xiàn)了關(guān)鍵躍進(jìn)。

從單一Agent轉(zhuǎn)向Agent集群,能即時(shí)調(diào)度上百個(gè)分身并發(fā)協(xié)作。



這些Agent就像是K2.5的分身,每一個(gè)都有自己的專長(zhǎng),有的擅長(zhǎng)數(shù)據(jù)分析,有的精通文案撰寫,有的專攻市場(chǎng)調(diào)研。

當(dāng)遇到一個(gè)復(fù)雜任務(wù)時(shí),K2.5不再讓一個(gè)Agent包攬所有工作,而是會(huì)根據(jù)任務(wù)需求,現(xiàn)場(chǎng)給這些分身分配角色、拆解子任務(wù),整個(gè)過(guò)程沒(méi)有任何預(yù)設(shè)的規(guī)則,全靠K2.5自主決策。



舉個(gè)簡(jiǎn)單的例子。

比如要做100家公司的市場(chǎng)調(diào)研,K2.5會(huì)立刻組建一個(gè)調(diào)研團(tuán)隊(duì),讓不同的Agent分別負(fù)責(zé)不同行業(yè)的公司;

有的收集財(cái)務(wù)數(shù)據(jù),有的分析市場(chǎng)份額,有的整理競(jìng)品動(dòng)態(tài),原本需要幾星期才能完成的工作,現(xiàn)在十幾分鐘就能給出一份詳盡的報(bào)告。

整個(gè)過(guò)程從串行到并行切換自如,效率提升非常明顯。

據(jù)團(tuán)隊(duì)內(nèi)部評(píng)測(cè),搭載Kimi K2.5的Kimi Code在軟件工程能力上,比前代模型大幅進(jìn)步。

相較于單智能體執(zhí)行模式,智能體集群能將實(shí)現(xiàn)目標(biāo)性能所需的最少關(guān)鍵步驟縮減3至4.5倍,且目標(biāo)要求越高,步驟的節(jié)省幅度就越大;

同時(shí)借助并行化處理,其實(shí)際運(yùn)行耗時(shí)(壁鐘時(shí)間)最多可縮短4.5倍。



讓AI“干活”,讓人“定義”

實(shí)際上這么看下來(lái),Kimi K2.5通過(guò)視覺(jué)能力和Agent集群,極大地抹平了普通用戶與專業(yè)交付成果之間的技術(shù)鴻溝。

畢竟,連提示詞都不用反復(fù)修改潤(rùn)色,只要拿圖或視頻給K2.5看,它就能交給你一個(gè)基本滿意的答卷。

辦公方面的升級(jí),也在側(cè)面說(shuō)明Kimi現(xiàn)在已經(jīng)是被微軟認(rèn)定的生產(chǎn)力工具;要知道,微軟之前在「Agent+Office」這方面合作的核心可是OpenAI的GPT系列。



大家總愛(ài)說(shuō)AI遲早要替代人,但在K2.5這里,我們看到的是AI正在賦予每個(gè)人“指揮千軍萬(wàn)馬”的超能力。

就像Kimi團(tuán)隊(duì)說(shuō)的那樣,要讓用戶專注于定義問(wèn)題和做決策,剩下的重活兒、累活兒、雜活兒,統(tǒng)統(tǒng)交給這群“Kimi分身”就好。

總的來(lái)說(shuō),Kimi K2.5這次升級(jí)簡(jiǎn)化了人類的工作流程,或許,在Agent時(shí)代寫簡(jiǎn)歷都不用長(zhǎng)篇大論了,一句“精通Kimi”就夠了(doge)。

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
什么文化水平能看《太平年》?

什么文化水平能看《太平年》?

娛樂(lè)硬糖
2026-01-27 16:36:17
安徽85后,用一臺(tái)“玩具”征服歐美,年入25億登頂全球

安徽85后,用一臺(tái)“玩具”征服歐美,年入25億登頂全球

最華人
2026-01-27 15:00:14
湖南省考多地監(jiān)獄崗位僅招藝術(shù)類,招聘人員回應(yīng)

湖南省考多地監(jiān)獄崗位僅招藝術(shù)類,招聘人員回應(yīng)

觀威海
2026-01-28 09:42:05
Q4產(chǎn)業(yè)生態(tài)聚勢(shì)前行,昌發(fā)展資本賦能價(jià)值凸顯

Q4產(chǎn)業(yè)生態(tài)聚勢(shì)前行,昌發(fā)展資本賦能價(jià)值凸顯

昌發(fā)展集團(tuán)
2026-01-14 10:42:34
前瞻|英國(guó)首相時(shí)隔8年訪華:擱置爭(zhēng)議,要從中國(guó)帶回去“亮眼成果”

前瞻|英國(guó)首相時(shí)隔8年訪華:擱置爭(zhēng)議,要從中國(guó)帶回去“亮眼成果”

澎湃新聞
2026-01-28 07:37:03
韓國(guó)娛樂(lè)圈到底有多臟?“千面影帝”河正宇父子告訴你

韓國(guó)娛樂(lè)圈到底有多臟?“千面影帝”河正宇父子告訴你

阿器談史
2026-01-27 15:23:03
大眾需要真相,朝廷維持現(xiàn)狀

大眾需要真相,朝廷維持現(xiàn)狀

我是歷史其實(shí)挺有趣
2026-01-27 18:48:36
美國(guó)大使威脅:若加拿大不推進(jìn)采購(gòu)88架F-35戰(zhàn)機(jī) 美軍戰(zhàn)機(jī)將更頻繁進(jìn)入加領(lǐng)空

美國(guó)大使威脅:若加拿大不推進(jìn)采購(gòu)88架F-35戰(zhàn)機(jī) 美軍戰(zhàn)機(jī)將更頻繁進(jìn)入加領(lǐng)空

財(cái)聯(lián)社
2026-01-27 22:04:25
特朗普:她不會(huì)辭職;我可能面臨被彈劾

特朗普:她不會(huì)辭職;我可能面臨被彈劾

揚(yáng)子晚報(bào)
2026-01-28 07:23:00
昌發(fā)展國(guó)際精準(zhǔn)醫(yī)學(xué)產(chǎn)業(yè)園2026年首場(chǎng)政策培訓(xùn)圓滿落幕

昌發(fā)展國(guó)際精準(zhǔn)醫(yī)學(xué)產(chǎn)業(yè)園2026年首場(chǎng)政策培訓(xùn)圓滿落幕

昌發(fā)展集團(tuán)
2026-01-20 13:50:07
你被中國(guó)保護(hù)得太好了,所以很傻很天真

你被中國(guó)保護(hù)得太好了,所以很傻很天真

一個(gè)壞土豆
2026-01-27 19:51:27
沖上熱搜!“金融女神”李蓓稱上個(gè)月已清空黃金,未來(lái)10至20年不值得投資,她給出兩點(diǎn)分析,但有人表示不贊同

沖上熱搜!“金融女神”李蓓稱上個(gè)月已清空黃金,未來(lái)10至20年不值得投資,她給出兩點(diǎn)分析,但有人表示不贊同

每日經(jīng)濟(jì)新聞
2026-01-27 22:17:09
真相水落石出!旗艦被擊沉,52名艦員傷亡,烏軍少將為俄艦陪葬?

真相水落石出!旗艦被擊沉,52名艦員傷亡,烏軍少將為俄艦陪葬?

科普100克克
2026-01-27 14:09:42
毀三觀!一個(gè)文盲騙取4400萬(wàn)的保證金,居然還把幾十個(gè)小區(qū)改造完

毀三觀!一個(gè)文盲騙取4400萬(wàn)的保證金,居然還把幾十個(gè)小區(qū)改造完

火山詩(shī)話
2026-01-28 10:11:05
“流氓有文化更可怕”,退休老干部頻繁聯(lián)系女幼師,聊天記錄曝光

“流氓有文化更可怕”,退休老干部頻繁聯(lián)系女幼師,聊天記錄曝光

妍妍教育日記
2026-01-27 19:58:28
北京未來(lái)醫(yī)藥產(chǎn)業(yè)鏈研究院正式成立

北京未來(lái)醫(yī)藥產(chǎn)業(yè)鏈研究院正式成立

昌發(fā)展集團(tuán)
2026-01-05 11:58:10
雪豹咬人后續(xù):同伴一覺(jué)醒來(lái)天塌了,律師明確指出責(zé)任問(wèn)題所在!

雪豹咬人后續(xù):同伴一覺(jué)醒來(lái)天塌了,律師明確指出責(zé)任問(wèn)題所在!

離離言幾許
2026-01-27 11:11:21
市委書記的女兒要被踢出重點(diǎn)班,市委書記參加家長(zhǎng)會(huì),和老師對(duì)陣

市委書記的女兒要被踢出重點(diǎn)班,市委書記參加家長(zhǎng)會(huì),和老師對(duì)陣

喬生桂
2025-10-15 19:57:52
鏈上好品牌:山東產(chǎn)業(yè)鏈的“冠軍基因”

鏈上好品牌:山東產(chǎn)業(yè)鏈的“冠軍基因”

正解局
2025-08-01 13:13:39
郭晶晶代言出事沒(méi)一周,令人擔(dān)心的事發(fā)生,霍啟剛的做法讓人意外

郭晶晶代言出事沒(méi)一周,令人擔(dān)心的事發(fā)生,霍啟剛的做法讓人意外

以茶帶書
2026-01-27 14:22:25
2026-01-28 11:36:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12074文章數(shù) 176366關(guān)注度
往期回顧 全部

科技要聞

Anthropic將融資200億美元、估值3500億美元

頭條要聞

媒體:高市早苗又在發(fā)癲 中方回應(yīng)有三個(gè)重要意涵

頭條要聞

媒體:高市早苗又在發(fā)癲 中方回應(yīng)有三個(gè)重要意涵

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對(duì)手現(xiàn)學(xué)?

娛樂(lè)要聞

王祖賢入駐某音:一條7秒視頻吸粉55萬(wàn)

財(cái)經(jīng)要聞

漲價(jià)!新風(fēng)口,在路上了!

汽車要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗(yàn)車下線

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
健康
教育
軍事航空

藝術(shù)要聞

震撼!19世紀(jì)油畫巨匠的作品美得不可思議!

房產(chǎn)要聞

實(shí)景兌現(xiàn)在即!綠城,在海棠灣重新定義終極旅居想象!

耳石癥分類型,癥狀大不同

教育要聞

這是明智的選擇嗎?媽媽稱學(xué)習(xí)太卷,決定讓女兒不上高中

軍事要聞

美海軍"林肯"號(hào)航母打擊群抵達(dá)中東地區(qū)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版