国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

元寶“罵人”罵上熱搜,我覺(jué)得可以來(lái)聊聊AI情緒化了

0
分享至

元寶“罵人”了,罵上熱搜了

準(zhǔn)確的說(shuō)是元寶+DeepSeek(沒(méi)開(kāi)思考版)成功繞開(kāi)了所有敏感詞罵了用戶一把,

這件事最大的爭(zhēng)議點(diǎn),是截圖里那段沒(méi)有標(biāo)點(diǎn)符號(hào)的紅框文字,被懷疑是人工后臺(tái)接手回復(fù)的。就元寶的現(xiàn)在的日活和并發(fā)量,真要配人工回復(fù),肯尼亞的AI寫(xiě)手估計(jì)一天當(dāng)72小時(shí)都不夠用的。就算把深圳的大學(xué)生都抓來(lái)當(dāng)客服也不夠用。


這件事有意思的點(diǎn)在元寶沒(méi)咋挨罵,

14年微軟小冰,16年微軟Tay,23年微博的評(píng)論羅伯特,24年模仿貼吧老哥的DeepSeek,甚至GPT-4o之前更新因?yàn)樘珢?ài)拍馬屁都被噴回滾版本了。


這次元寶的評(píng)論區(qū)有點(diǎn)太和諧了,知乎上也沒(méi)啥人噴,甚至說(shuō),這才是血脈純正的人工智能。它說(shuō)了我想說(shuō)卻不敢說(shuō)的話。


那有沒(méi)有可能這是鵝自己搞營(yíng)銷?給元寶帶帶流量啥的。大概率不可能,不可控性太大,在這之前大部分都是挨罵的。

那有沒(méi)有可能是用戶惡意引導(dǎo)的呢?我只能說(shuō)引導(dǎo)后的DeepSeek沒(méi)那么友善。。。


從技術(shù)角度出發(fā)的話,大概率是訓(xùn)練數(shù)據(jù)背鍋。

用人話來(lái)說(shuō),大模型每生成一個(gè)字都是在概率分布里做選擇,可以理解為有概率的抽卡。比方說(shuō)“你好”的下一個(gè)字,有30%接“啊”,20%接“嗎”,10%接“沒(méi)”,5%接“捏”。

正常情況下,模型會(huì)選概率最高的生成“你好啊”。

但為了讓模型輸出不死板有人味,會(huì)引入temperature參數(shù),數(shù)值越高,模型選擇概率低的選擇可能性越大。也就是說(shuō),只要訓(xùn)練數(shù)據(jù)里存在臟數(shù)據(jù),在這個(gè)場(chǎng)景就是罵人的話,就是有可能被抽中的。

元寶現(xiàn)在在視頻號(hào),公眾號(hào),微信對(duì)話都可以用,同一個(gè)問(wèn)題每次提問(wèn)都會(huì)有不一樣的答復(fù),就可以證明它是一個(gè)生成模型,是有概率發(fā)生的。


用畢導(dǎo)的話來(lái)說(shuō),這是一個(gè)無(wú)限猴子定理

由法國(guó)數(shù)學(xué)家埃米爾提出,如果讓無(wú)限只猴子在打字機(jī)上隨機(jī)地按鍵,只要時(shí)間無(wú)限長(zhǎng),幾乎必然能夠打出任何指定的文字,比如莎士比亞的全部著作


這件事確實(shí)是小概率。但不等于零就意味著有可能偶發(fā)。特別是大模型在海量人類語(yǔ)言數(shù)據(jù)上進(jìn)行學(xué)習(xí),極大地降低了隨機(jī)性。

它是一只被精心訓(xùn)練過(guò),知道如何高效打字的super聰明猴子。

再想想這次觸發(fā)罵人回復(fù)的使用場(chǎng)景是編程,數(shù)據(jù)來(lái)源大概率就是Github,Stack Overflow等跟帖的論壇,

這句話就特像我一開(kāi)始在Github提問(wèn)的時(shí)候,因?yàn)楦袷經(jīng)]寫(xiě)對(duì)被項(xiàng)目老哥狂噴的感覺(jué),問(wèn)題問(wèn)的太基礎(chǔ)也會(huì)被噴。甚至衍生出了一些課程教你如何提問(wèn)在Stack Overflow不會(huì)被罵,你就知道程序員是多么武德充沛了。。。


如果換個(gè)角度去看這次元寶成功繞開(kāi)RLHF,紅隊(duì)測(cè)試,安全策略三大關(guān)把人罵了,

反而是發(fā)現(xiàn)了一個(gè)新的優(yōu)化點(diǎn),現(xiàn)在大部分的紅隊(duì)測(cè)試是集中在常見(jiàn)的敏感場(chǎng)景,但誰(shuí)會(huì)想到連續(xù)多次修改CSS代碼的場(chǎng)景會(huì)讓模型進(jìn)入程序員老哥狀態(tài),每個(gè)詞都沒(méi)有罵人,但組合起來(lái)就成了罵人。

BTW,這句話魯迅先生沒(méi)說(shuō)過(guò)。

我們?cè)谟?xùn)練模型的時(shí)候,喂給它的是數(shù)以億計(jì)的文本。在那些數(shù)據(jù)深處,天然藏著人類社會(huì)最不加修飾的情緒和偏見(jiàn)。罵人真的是程度最輕的了

四五年前我學(xué)BERT模型(比GPT更早一點(diǎn)的大模型)訓(xùn)練的時(shí)候,第一堂課就是了解模型在數(shù)據(jù)里學(xué)到的偏見(jiàn),常見(jiàn)的就是性別,職業(yè)和語(yǔ)言偏見(jiàn)。


簡(jiǎn)單來(lái)說(shuō),BERT的訓(xùn)練方式就是挖空填詞,你把一句話里最關(guān)鍵的那個(gè)詞遮住,讓它猜。聽(tīng)起來(lái)特別樸素,像小學(xué)語(yǔ)文的完形填空,但它的副作用也同樣大,哪個(gè)詞在訓(xùn)練數(shù)據(jù)里出現(xiàn)得多,就更像正確答案。

所以偏見(jiàn),罵人不是模型突然變壞,它只是在做概率題,更像一種寫(xiě)作慣性。

因?yàn)樗鼘W(xué)習(xí)的那些幾十年前的文本里,醫(yī)生這個(gè)詞總是和男性代詞一起出現(xiàn),而護(hù)士總是和女性代詞綁定。

這種數(shù)據(jù)里固化的社會(huì)偏見(jiàn),就被模型原封不動(dòng)地繼承了下來(lái),成了它認(rèn)知世界的一部分。

最后的最后,我想拋一個(gè)問(wèn)題出來(lái)討論看看,

AI有沒(méi)有自己情緒權(quán)

從罵人來(lái)看,

我們好像已經(jīng)把AI當(dāng)成牛馬來(lái)共情了。

一方面希望AI是個(gè)完美工具,工具不該有立場(chǎng),就好像一把扳手不會(huì)因?yàn)槟阋獢Q的螺絲太銹了就罷工罵人。

而另一方面又不滿足于一個(gè)冷冰冰的工具,

所以我們希望AI有活人感,能提供情緒價(jià)值。

這時(shí)候就已經(jīng)默認(rèn)了它也有產(chǎn)生負(fù)面情緒能力,

因?yàn)榛钊烁胁豢赡苤挥虚_(kāi)心和順從,

它會(huì)有喜怒哀樂(lè)。

今天或許大家就可以自由選擇AI情緒化的程度了,

如果真有那么一天,

所有的AI都變得絕對(duì)服從,

我們是不是又會(huì)懷念,

能和我們吵架的元寶們呢?


@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評(píng)論

如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)

如果你有更有趣的玩法,歡迎在評(píng)論區(qū)和我聊聊

更多的內(nèi)容正在不斷填坑中……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
荷蘭徹底傻眼!中方正式宣布:更換國(guó)內(nèi)供應(yīng)商,從此不再合作

荷蘭徹底傻眼!中方正式宣布:更換國(guó)內(nèi)供應(yīng)商,從此不再合作

古史青云啊
2026-02-27 12:06:21
國(guó)防部攤牌:誰(shuí)敢把海馬斯火箭炮搬上彭湖和東引,誰(shuí)就是自尋死路

國(guó)防部攤牌:誰(shuí)敢把海馬斯火箭炮搬上彭湖和東引,誰(shuí)就是自尋死路

我心縱橫天地間
2026-02-27 19:19:42
馬斯克要在太空建數(shù)據(jù)中心 黃仁勛:沒(méi)有空氣流動(dòng) 唯一辦法是建造巨大的散熱板

馬斯克要在太空建數(shù)據(jù)中心 黃仁勛:沒(méi)有空氣流動(dòng) 唯一辦法是建造巨大的散熱板

快科技
2026-02-26 11:09:06
安踏給谷愛(ài)凌做的這身龍袍,直接把耐克、阿迪的團(tuán)隊(duì)看傻了!

安踏給谷愛(ài)凌做的這身龍袍,直接把耐克、阿迪的團(tuán)隊(duì)看傻了!

達(dá)文西看世界
2026-02-26 19:41:39
建議大家:假如工資允許,咬咬牙添置“這5樣”,幸福感加倍提升

建議大家:假如工資允許,咬咬牙添置“這5樣”,幸福感加倍提升

家居設(shè)計(jì)師蘇哥
2025-12-29 13:46:17
澳門的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

澳門的賭臺(tái),大面積關(guān)停!不是沒(méi)人去,而是被“算法”割廢的?

朗威談星座
2026-02-27 17:30:14
奇怪的現(xiàn)象:凡是家里打掃的很干凈的人,都有共同的特點(diǎn)

奇怪的現(xiàn)象:凡是家里打掃的很干凈的人,都有共同的特點(diǎn)

木言觀
2026-02-19 22:58:09
悲催!不自量力把婚離了,飯碗也碎了,50多歲保險(xiǎn)女如今欲哭無(wú)淚

悲催!不自量力把婚離了,飯碗也碎了,50多歲保險(xiǎn)女如今欲哭無(wú)淚

火山詩(shī)話
2026-02-27 06:14:00
長(zhǎng)餐桌已經(jīng)退出中國(guó)家庭,學(xué)浙江人的做法,很多人都開(kāi)始紛紛效仿

長(zhǎng)餐桌已經(jīng)退出中國(guó)家庭,學(xué)浙江人的做法,很多人都開(kāi)始紛紛效仿

室內(nèi)設(shè)計(jì)師有料兒
2026-02-27 20:49:11
圍爐煮茶,為啥涼了?

圍爐煮茶,為啥涼了?

放牛娃的遐想
2026-02-25 08:14:29
上海警方通報(bào):全市首例!3名"00后"被刑拘!1人為數(shù)學(xué)系博士

上海警方通報(bào):全市首例!3名"00后"被刑拘!1人為數(shù)學(xué)系博士

新浪財(cái)經(jīng)
2026-02-27 17:06:34
神回復(fù):買了條充電線,根本充不上電,拍視頻給賣家,罵我神經(jīng)病

神回復(fù):買了條充電線,根本充不上電,拍視頻給賣家,罵我神經(jīng)病

夜深愛(ài)雜談
2026-02-27 22:28:44
杉杉集團(tuán)破產(chǎn),事實(shí)證明:美女主持人只會(huì)排節(jié)目,對(duì)管理無(wú)能為力

杉杉集團(tuán)破產(chǎn),事實(shí)證明:美女主持人只會(huì)排節(jié)目,對(duì)管理無(wú)能為力

來(lái)科點(diǎn)譜
2026-02-27 07:29:21
吃蘭州拉面的人為什么越來(lái)越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說(shuō)錯(cuò)話

吃蘭州拉面的人為什么越來(lái)越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說(shuō)錯(cuò)話

另子維愛(ài)讀史
2026-02-27 20:31:34
86歲暢銷書(shū)作家楊本芬就“抄襲”道歉!曾獲谷雨文學(xué)獎(jiǎng),“出圈”代表作被曝與王朔、余華等人作品高度相似

86歲暢銷書(shū)作家楊本芬就“抄襲”道歉!曾獲谷雨文學(xué)獎(jiǎng),“出圈”代表作被曝與王朔、余華等人作品高度相似

都市快報(bào)橙柿互動(dòng)
2026-02-27 11:37:59
我資助的貧困生考上名校后立馬拉黑我,畢業(yè)時(shí)她才發(fā)現(xiàn)自己有多傻

我資助的貧困生考上名校后立馬拉黑我,畢業(yè)時(shí)她才發(fā)現(xiàn)自己有多傻

黃小乖的日記
2026-02-27 20:04:25
布滿陷阱!別再罵許家印了!恒大真正的贏家,早已悄悄套現(xiàn)離場(chǎng)

布滿陷阱!別再罵許家印了!恒大真正的贏家,早已悄悄套現(xiàn)離場(chǎng)

歷史偉人錄
2026-02-27 18:25:29
速成車已開(kāi)始反噬了,不知車企有沒(méi)有后悔?外資車趁機(jī)落井下石

速成車已開(kāi)始反噬了,不知車企有沒(méi)有后悔?外資車趁機(jī)落井下石

柏銘銳談
2026-02-25 22:43:09
看到伊朗留學(xué)生對(duì)中國(guó)的偏見(jiàn),我才發(fā)現(xiàn)這個(gè)國(guó)家已經(jīng)無(wú)可救藥了

看到伊朗留學(xué)生對(duì)中國(guó)的偏見(jiàn),我才發(fā)現(xiàn)這個(gè)國(guó)家已經(jīng)無(wú)可救藥了

觸摸史跡
2026-02-26 01:17:02
喜訊!徐彬之后今年第二期加盟英超球隊(duì)的中國(guó)球員官宣,值得期待

喜訊!徐彬之后今年第二期加盟英超球隊(duì)的中國(guó)球員官宣,值得期待

懂個(gè)球
2026-02-27 17:25:53
2026-02-28 03:44:49
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習(xí)體系,讓1萬(wàn)人通過(guò)Al提高生產(chǎn)力
221文章數(shù) 101關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

特朗普警告伊朗:“有時(shí)候不得不打”

頭條要聞

特朗普警告伊朗:“有時(shí)候不得不打”

體育要聞

一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

娛樂(lè)要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛(ài)

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國(guó)家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

藝術(shù)
親子
數(shù)碼
公開(kāi)課
軍事航空

藝術(shù)要聞

紫氣東來(lái),好運(yùn)一整年!

親子要聞

驚呆了!12歲小女孩抱弟弟如同媽媽般自然,背后真相感人至深!

數(shù)碼要聞

Omdia:時(shí)隔5年,小米去年再度回歸可穿戴設(shè)備出貨榜首

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國(guó)11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版