国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ChatGPT6,自主進(jìn)化的大模型

0
分享至

在計(jì)算機(jī)博士里,我日常除了創(chuàng)業(yè)與做產(chǎn)品工作,最大的時(shí)間花費(fèi)就是看別人的論文了,其中我最近看到一篇文章,可以說(shuō)是未來(lái)所有大模型的發(fā)展方向,以及實(shí)現(xiàn)方法。

其論文提到了在強(qiáng)化學(xué)習(xí)、監(jiān)督學(xué)習(xí)之外,另外一種優(yōu)化模型的方式,通過(guò)監(jiān)督每次模型生成的機(jī)制(可以理解為prompt),從而對(duì)比結(jié)果,將結(jié)果好的prompt繼續(xù)優(yōu)化再來(lái)訓(xùn)練。

并且支持自己內(nèi)容生成,將生成的內(nèi)容可以用于做模型訓(xùn)練。

也就是AI模型的自我進(jìn)化

在論文開頭,論文就提到了一個(gè)比喻,模仿學(xué)生在考試前,通過(guò)碎片化的筆記本來(lái)復(fù)習(xí)考試,通過(guò)讓自己記憶得到更準(zhǔn)確的生成結(jié)果,就會(huì)用碎片化。

提到了一個(gè)舉例,就是人類在考試之前都會(huì)自己記錄筆記,在復(fù)習(xí)的時(shí)候都會(huì)通過(guò)閱讀筆記來(lái)想起之前知識(shí)學(xué)習(xí)塊,從而加深自己的記憶同時(shí)能夠讓考試更加容易答對(duì)通過(guò)。

依靠這種方式,AI模型也應(yīng)該可以參考學(xué)生復(fù)習(xí)筆記的方式,將其零碎的知識(shí)內(nèi)容首先可以自己組合、重建,并且去生成更加精準(zhǔn)的內(nèi)容。

每次內(nèi)容生成后,可以判斷內(nèi)容效果,再來(lái)不斷優(yōu)化每一次的策略“prompt”,最終就實(shí)現(xiàn)了模型的進(jìn)化。

在這篇文獻(xiàn)里,他們也利用ARC方法(完成模型生成數(shù)據(jù)),將其碎片的數(shù)據(jù)進(jìn)行組塊、重建完整生成,再用模型校驗(yàn)自己的提示詞是否最佳的,從而不斷讓模型具備不斷優(yōu)化提示詞能力,也就是模型的自我進(jìn)化與學(xué)習(xí)。


如上圖是文章片段生成完整片段,并且用來(lái)評(píng)估。最終通過(guò)SEAL叫做自我學(xué)習(xí)大模型框架生成的準(zhǔn)確度在僅有幾塊的情況下,可以達(dá)到和ChatGPT4.1的生成準(zhǔn)確度。

相比以往的模型訓(xùn)練,這個(gè)模型框架最大的區(qū)別是如下圖,可以理解為在生成策略的優(yōu)化:Prompt


如下是文獻(xiàn)李SEAL方法的實(shí)現(xiàn)效果,給出了模型輸入內(nèi)容之后,模型通過(guò)不斷地重寫,從而讓模型自己提升自己,讓每一次重寫內(nèi)容更準(zhǔn)確。

其中第一次rewrite 和最后一次內(nèi)容長(zhǎng)度與質(zhì)量都有顯著的變化。


可想而知,這套框架用在圖像模型也是可以的,讓模型幾乎0標(biāo)注的進(jìn)行自我訓(xùn)練,在用戶任務(wù)完成一輪,就可以利用任務(wù)圖片數(shù)據(jù)集完成訓(xùn)練自我提升。

這幾乎就可用讓醫(yī)生、律師、甚至是產(chǎn)品經(jīng)理以及寫代碼,可以完成自己熟悉領(lǐng)域越來(lái)越準(zhǔn),并且越來(lái)越達(dá)到自己的要求與目標(biāo)范圍。

在研究文獻(xiàn)里,SEAL模型框架研究也有限制:災(zāi)難性遺忘

隨著時(shí)間逐步前進(jìn),知識(shí)陳舊之后,模型拉起的準(zhǔn)確度會(huì)越來(lái)越低,甚至是出現(xiàn)幻覺,所以模型會(huì)過(guò)渡擬合,以及過(guò)渡蒸餾。

現(xiàn)在AI模型的災(zāi)難性遺忘幾乎是一個(gè)難題,曾經(jīng)就有人做過(guò)實(shí)驗(yàn),將一個(gè)圖像利用通用模型不斷的重復(fù)訓(xùn)練,反復(fù)把結(jié)果再來(lái)訓(xùn)練。

當(dāng)訓(xùn)練超過(guò)幾百次之后,就會(huì)得到女性二次元,這是因?yàn)榇竽P蛿?shù)據(jù)源采用海量數(shù)據(jù),包含了海量女性角色、以及二次元圖,所以最終過(guò)渡擬合就會(huì)成為二次元


如上圖是rice university做的算法研究,將其一張圖片反復(fù)訓(xùn)練,最終得到的結(jié)果是另外一個(gè)人物,甚至是性別都變了。

如何對(duì)過(guò)往的數(shù)據(jù)進(jìn)行存儲(chǔ)以及模型檢索,是接下來(lái)這套算法需要做的衍生,在其論文里,給出了后續(xù)的研究計(jì)劃,將會(huì)繼續(xù)擴(kuò)展到記憶的問題。

比如通過(guò)以往的數(shù)據(jù)整合與單獨(dú)保存,以及過(guò)往數(shù)據(jù)調(diào)用策略的修改,從而讓模型能夠避免災(zāi)難性遺忘。

相比通用模型來(lái)說(shuō),SEAL模型其對(duì)于過(guò)往的數(shù)據(jù)災(zāi)難性遺忘程度要低的多,可以看見模型是有效果的。


如上圖是論文里隨著知識(shí)塊增加,以及自己反復(fù)進(jìn)化收斂,仍然會(huì)出現(xiàn)模型記憶丟失,在只有一段數(shù)據(jù)下,反復(fù)8次進(jìn)化,從0.33變成了0.19的準(zhǔn)確度,幾乎不管是幾段都會(huì)進(jìn)行降低。

將其算法在不僅是prompt校準(zhǔn)上的進(jìn)化,而是對(duì)過(guò)往數(shù)據(jù)的精準(zhǔn)度也要進(jìn)行計(jì)算,從而讓模型在實(shí)現(xiàn)自我進(jìn)化的同時(shí),不會(huì)出現(xiàn)遺忘,相信這就是未來(lái)ChatGPT7甚至是8的發(fā)展目標(biāo)。

其實(shí)對(duì)于人類來(lái)說(shuō),到不會(huì)把以前記住的事情記錯(cuò),而是會(huì)遺忘,讓一個(gè)人記住以往時(shí)間的數(shù)據(jù)這一點(diǎn)也是很難,就想讓我們現(xiàn)在想象小時(shí)候的記憶,我們?nèi)匀粫?huì)覺得很難記得住,就是因?yàn)檫@些記憶碎片往往難以尋找,但是當(dāng)我們找到了某一個(gè)記憶碎片或情景,就可以迅速記得到當(dāng)時(shí)的更多片段情況。

這就是大腦記憶的數(shù)據(jù)檢索,而目前AI模型在進(jìn)化模型上,這一點(diǎn)反復(fù)進(jìn)化會(huì)導(dǎo)致出現(xiàn)錯(cuò)誤數(shù)據(jù),也就是錯(cuò)誤記憶這一點(diǎn)是現(xiàn)在團(tuán)隊(duì)要去做的。

ChatGPT6自我進(jìn)化

從現(xiàn)在來(lái)看,這篇論文至少給了一個(gè)趨勢(shì),也就是一個(gè)AI大模型會(huì)包含進(jìn)化能力,這樣就不需要再給他數(shù)據(jù)訓(xùn)練了,而是自己通過(guò)日常的溝通與任務(wù)完成,他其實(shí)就在不斷訓(xùn)練自己。

這篇文獻(xiàn)的研究作者已經(jīng)跳槽到OPENAI去了,這篇文章最大的意義就是讓模型越來(lái)越聰明,甚至是對(duì)于用戶來(lái)說(shuō),自己賬戶下的ChatGPT將會(huì)越來(lái)越懂你,并且知道你所了解的方向與知識(shí),逐步成為超越或者完美契合你的靈魂伴侶。

讓模型自我進(jìn)化,而且模型的進(jìn)化小到個(gè)人賬戶,大到整個(gè)模型基座,都是可以進(jìn)化的,從而不用擔(dān)心模型還需要人工來(lái)進(jìn)行訓(xùn)練。

不再需要依靠開發(fā)者每次發(fā)版本一樣release,用戶就能體驗(yàn)到模型的新能力。

當(dāng)然現(xiàn)在這種進(jìn)化只是在模型的準(zhǔn)確度與生成內(nèi)容量,和模型在功能、多模態(tài)上還沒有關(guān)系,也就是模型不能從文本模型變成圖像模型,這一點(diǎn)進(jìn)化還做不到。

以上就是這篇文獻(xiàn),我相信ChatGPT6以及后續(xù)模型將會(huì)更加“人”化。

今天的分享就到這里

文獻(xiàn)地址:https://arxiv.org/pdf/2506.10943

來(lái)源:網(wǎng)絡(luò)博客

題圖來(lái)自 Unsplash ,基于 CC0 協(xié)議, 如有侵權(quán),請(qǐng)聯(lián)系pmtalk123刪除

“分享產(chǎn)品經(jīng)理改變世界的點(diǎn)滴”

產(chǎn)品顧問| 產(chǎn)品咨詢|培訓(xùn)合作

請(qǐng)?zhí)砑游⑿? PMxiaowanzi

最近我的原創(chuàng)

每日案例拆解庫(kù),AI等產(chǎn)品打卡群

我創(chuàng)建的產(chǎn)品設(shè)計(jì)打卡社群,加入后365天,每天體驗(yàn)一款A(yù)PP。提升產(chǎn)品設(shè)計(jì)能力,同時(shí)有1300份體驗(yàn)報(bào)告幫助你找到競(jìng)品

在這里你可以隨時(shí)查詢到你想找的各類競(jìng)品行業(yè)APP,無(wú)須自己親自下載就可以馬上得到APP的一手產(chǎn)品優(yōu)化、交互設(shè)計(jì)、功能描述信息。

從優(yōu)化&建議、商業(yè)模式、運(yùn)營(yíng)、功能描述、交互設(shè)計(jì)、產(chǎn)品定位至少6個(gè)維度,體驗(yàn)一款應(yīng)用。

平均1天1塊錢,掃碼購(gòu)買即可加入

連續(xù)體驗(yàn)48款應(yīng)用,通過(guò)后原路退回


報(bào)名后添加星球助理

PMTalk123

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1隊(duì)出線2隊(duì)出局!U23亞洲杯最新晉級(jí)形勢(shì):中國(guó)隊(duì)輸泰國(guó)=基本淘汰

1隊(duì)出線2隊(duì)出局!U23亞洲杯最新晉級(jí)形勢(shì):中國(guó)隊(duì)輸泰國(guó)=基本淘汰

侃球熊弟
2026-01-12 00:17:32
26年春晚首次彩排,16位大咖亮相,看到他們出現(xiàn),今年是真穩(wěn)了

26年春晚首次彩排,16位大咖亮相,看到他們出現(xiàn),今年是真穩(wěn)了

洲洲影視娛評(píng)
2026-01-10 20:05:52
鄰居天天蹭充電樁,我沒鬧裝上地鎖去度假,20天后物業(yè)急電:出事了

鄰居天天蹭充電樁,我沒鬧裝上地鎖去度假,20天后物業(yè)急電:出事了

黃家湖的憂傷
2026-01-10 18:50:06
人生10大忌,切忌切忌

人生10大忌,切忌切忌

尚曦讀史
2025-12-06 09:19:09
600億抄底!美財(cái)長(zhǎng)的學(xué)生竟然收購(gòu)了中國(guó)萬(wàn)達(dá),難怪王健林會(huì)輸!

600億抄底!美財(cái)長(zhǎng)的學(xué)生竟然收購(gòu)了中國(guó)萬(wàn)達(dá),難怪王健林會(huì)輸!

蜉蝣說(shuō)
2026-01-11 17:51:23
大反轉(zhuǎn)!特朗普突然轉(zhuǎn)向!

大反轉(zhuǎn)!特朗普突然轉(zhuǎn)向!

財(cái)經(jīng)要參
2026-01-12 12:46:14
咸魚還是太全面了,怪不得人稱國(guó)內(nèi)黑市

咸魚還是太全面了,怪不得人稱國(guó)內(nèi)黑市

另子維愛讀史
2025-12-20 17:07:20
蒙古國(guó)暴雨沖出神秘石刻,中國(guó)專家當(dāng)場(chǎng)愣?。菏窌涊d竟全是真的

蒙古國(guó)暴雨沖出神秘石刻,中國(guó)專家當(dāng)場(chǎng)愣?。菏窌涊d竟全是真的

大千世界觀
2025-12-17 20:53:40
大潰?。≈袊?guó)網(wǎng)貸公司,在印度全軍覆沒

大潰敗!中國(guó)網(wǎng)貸公司,在印度全軍覆沒

首席品牌評(píng)論
2026-01-07 18:20:00
太原一“五證齊全”新房,跌破5000元/㎡大關(guān)...

太原一“五證齊全”新房,跌破5000元/㎡大關(guān)...

無(wú)比
2026-01-12 19:27:51
坐3.6億飛機(jī),戴1000萬(wàn)名表,拿5000萬(wàn)炒股的秦奮究竟什么背景

坐3.6億飛機(jī),戴1000萬(wàn)名表,拿5000萬(wàn)炒股的秦奮究竟什么背景

青史樓蘭
2025-08-25 10:50:56
北京擬對(duì)32.7公里二環(huán)主路進(jìn)行大修

北京擬對(duì)32.7公里二環(huán)主路進(jìn)行大修

北青網(wǎng)-北京青年報(bào)
2026-01-12 13:31:24
蔡依林演唱會(huì)被舉報(bào)成“邪教儀式”,數(shù)百封投訴已遞交文旅部門

蔡依林演唱會(huì)被舉報(bào)成“邪教儀式”,數(shù)百封投訴已遞交文旅部門

橙星文娛
2026-01-12 17:49:19
網(wǎng)格員深夜入戶檢查引居民投訴,深圳一街道回應(yīng):將加強(qiáng)培訓(xùn)

網(wǎng)格員深夜入戶檢查引居民投訴,深圳一街道回應(yīng):將加強(qiáng)培訓(xùn)

南方都市報(bào)
2026-01-12 07:33:11
庫(kù)明加還剩4天解禁!網(wǎng)媒稱交易臨近:模擬三方交易勇士需出2首輪

庫(kù)明加還剩4天解禁!網(wǎng)媒稱交易臨近:模擬三方交易勇士需出2首輪

顏小白的籃球夢(mèng)
2026-01-12 20:06:27
羅塞尼爾:定位球FC?阿森納各方面都很強(qiáng),這不是讓足球倒退

羅塞尼爾:定位球FC?阿森納各方面都很強(qiáng),這不是讓足球倒退

懂球帝
2026-01-13 00:19:25
記者:比起索爾斯克亞二進(jìn)宮,弗格森也更支持卡里克

記者:比起索爾斯克亞二進(jìn)宮,弗格森也更支持卡里克

懂球帝
2026-01-12 23:24:09
廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

唐小糖說(shuō)情感
2026-01-07 16:37:28
馬年春晚首次彩排明星陣容全名單曝光:沈騰馬麗再合體,年味穩(wěn)了

馬年春晚首次彩排明星陣容全名單曝光:沈騰馬麗再合體,年味穩(wěn)了

阿廢冷眼觀察所
2026-01-13 00:33:10
皇馬9000萬(wàn)紅星破防 目睹巴薩奪冠怒踢水瓶泄憤 狼狽滑倒看呆隊(duì)友

皇馬9000萬(wàn)紅星破防 目睹巴薩奪冠怒踢水瓶泄憤 狼狽滑倒看呆隊(duì)友

我愛英超
2026-01-12 07:53:47
2026-01-13 01:16:49
Kevin改變世界的點(diǎn)滴 incentive-icons
Kevin改變世界的點(diǎn)滴
每周一次,產(chǎn)品案例與經(jīng)驗(yàn)分享
213文章數(shù) 8關(guān)注度
往期回顧 全部

科技要聞

面對(duì)SpaceX瘋狂“下餃子” 中國(guó)正面接招

頭條要聞

日媒:高市連續(xù)兩日閉門不出 不回應(yīng)媒體采訪請(qǐng)求

頭條要聞

日媒:高市連續(xù)兩日閉門不出 不回應(yīng)媒體采訪請(qǐng)求

體育要聞

一場(chǎng)安東尼奧式勝利,給中國(guó)足球帶來(lái)驚喜

娛樂要聞

蔡少芬結(jié)婚18周年,與張晉過(guò)二人世界

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

房產(chǎn)
親子
健康
公開課
軍事航空

房產(chǎn)要聞

重磅調(diào)規(guī)!417畝商改住+教育地塊!海口西海岸又要爆發(fā)!

親子要聞

楊樂樂曬兒子正臉照,一家四口合照曝光,沐沐疑和妹妹睡上下鋪

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

官方確認(rèn):殲10CE在空戰(zhàn)中擊落多架戰(zhàn)機(jī)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版