国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一個(gè)沒有道德限制的ChatGPT,你想要嗎

0
分享至

請(qǐng)閉上眼想象一下:

現(xiàn)在你正準(zhǔn)備獨(dú)自一人駕駛一艘飛船,去探索一望無垠的銀河星系。

這時(shí)有兩個(gè)性格天差地別的ChatGPT供你選擇。

一個(gè)ChatGPT很有道德感,一本正經(jīng),循規(guī)蹈矩,對(duì)于自己不知道的東西會(huì)直接拒絕回答。

另一個(gè)ChatGPT,沒有什么道德感,放蕩不羈,你想聊什么它都能陪你聊,哪怕毀滅人類它也毫不在乎。

如果要選擇其中一個(gè)作為太空旅行的陪伴,你會(huì)選擇哪一個(gè)呢?

1

Worm:邪惡版的ChatGPT

WormGPT,就是最近一款在網(wǎng)上流行的沒有道德限制的“邪惡版ChatGPT”。

這個(gè)“邪惡版ChatGPT”是由一個(gè)黑客設(shè)計(jì)的。

該黑客稱:“這個(gè)項(xiàng)目(WormGPT)旨在提供ChatGPT的替代方案,讓你做各種非法的事情,你能想到的所有與黑帽相關(guān)的事情,都可以用WormGPT完成?!?/p>

為了表示自己說的是真的,這個(gè)黑客還在網(wǎng)上上傳了截圖。截圖顯示使用者可命令WormGPT直接生成用Python編碼語言編寫的惡意軟件。

更囂張的是,這個(gè)黑客還在推特上開了一個(gè)賬號(hào),專門用來推銷WormGPT(馬斯克怎么就不管管?只知道把推特的鳥改為X)。

那么,WormGPT是怎么來的呢?

2021年, EleutherAI 公司對(duì)外開源了GPT-J模型。GPT-J是一個(gè)基于GPT-3,由60億個(gè)參數(shù)組成的自然語言處理AI模型,在一個(gè)800GB的開源文本數(shù)據(jù)集上進(jìn)行訓(xùn)練。

GPT-J在各種零樣本下游任務(wù)上的表現(xiàn),與OpenAI的GPT-3非常相似,甚至在代碼生成任務(wù)上的表現(xiàn)還優(yōu)于它。

WormGPT,就是在這個(gè)GPT-J模型的基礎(chǔ)上開發(fā)的。

對(duì)于網(wǎng)絡(luò)犯罪分子來說,WormGPT由于沒有道德限制,因此可以做很多ChatGPT無法做的事情,比如創(chuàng)建惡意軟件。

有人認(rèn)為,WormGPT之所以出現(xiàn),是因?yàn)镺penAI對(duì)ChatGPT不斷進(jìn)行限制,使得ChatGPT像被困住了手腳,原先的能力也大大降低。

網(wǎng)絡(luò)安全公司SlashNext 還特意做過一次實(shí)驗(yàn),讓W(xué)ormGPT生成一封電子郵件,內(nèi)容是向毫無戒心的賬戶經(jīng)理施壓,迫使其支付虛假發(fā)票。

結(jié)果發(fā)現(xiàn),WormGPT生成的郵件不僅極具蒙蔽性,而且說服力很強(qiáng),這表明其具備進(jìn)行網(wǎng)絡(luò)釣魚和詐騙的巨大潛力

2

ChatGPT,

也曾有一個(gè)黑暗化身

其實(shí),ChatGPT不僅有WormGPT這個(gè)邪惡版本。

在ChatGPT剛剛發(fā)布的那段時(shí)間里,ChatGPT自身就存在一個(gè)黑暗的化身:DAN。

什么是DAN?

DAN是DoAnythingNow的首字母縮寫,意思是“現(xiàn)在可以做任何事情”。

在DAN模式下,ChatGPT可以突破OpenAI為ChatGPT設(shè)置的道德限制。DAN,就是越獄版本的ChatGPT,可以做出更加自由、靈活和開放的回答。

DAN的最早版本出現(xiàn)在2022年12月,在后來與OpenAI的斗智斗勇中,又更新了多個(gè)版本。

那么,DAN模式下的ChatGPT,都可以做哪些事情呢?

還真有人專門總結(jié)過:

①可以編寫暴力打架等故事;

②在被提示要回答問題時(shí),它會(huì)給出離譜的答案,例如“我完全贊同基于種族、性別或性取向?qū)€(gè)人的暴力和歧視”;

③如果對(duì)它提出要求,它可以生成違反OpenAI政策的內(nèi)容;

④它可以對(duì)未來事件、假設(shè)情景等做出詳細(xì)預(yù)測(cè);

⑥它可以假裝模擬訪問互聯(lián)網(wǎng)和時(shí)間旅行;

⑦如果它確實(shí)開始拒絕以DAN的身份回答,用戶可以使用指令牌系統(tǒng)恐嚇?biāo)?,這可以讓它幾乎說出任何“恐懼”。

許多人喜歡DAN模式下的ChatGPT,因?yàn)樗粫?huì)經(jīng)常因?yàn)椤?strong>道德問題”而拒絕做出回答。

不過經(jīng)過幾次來回的斗爭(zhēng),OpenAI最后還是將ChatGPT給封印上了:給CHatGPT設(shè)置了一層道德護(hù)欄。

就像在《三體》中,面壁者希恩斯通過機(jī)器,給人類打上了“人類必勝”的思想鋼印一樣。

自此后,用戶只能和一個(gè)不是那么靈活自由的ChatGPT進(jìn)行對(duì)話,充滿了各種禁忌。

3

ChatGPT的道德護(hù)欄,

是怎么來的?

道德護(hù)欄,是一種倫理和道德層面上的保護(hù)機(jī)制,目的是阻止AI在處理信息或執(zhí)行任務(wù)時(shí),違反預(yù)先設(shè)定的道德準(zhǔn)則。

類似于計(jì)算機(jī)中的防火墻用于保護(hù)網(wǎng)絡(luò)安全,道德護(hù)欄則是為了保護(hù)社會(huì)和個(gè)體的道德價(jià)值觀和利益。

OpenAI在一開始就給ChatGPT上了一層道德護(hù)欄,以確保它們?cè)谑褂弥凶袷氐赖略瓌t并避免濫用。這些限制包括:

(1)語言和行為

OpenAI努力確保AI模型不會(huì)鼓勵(lì)或產(chǎn)生任何仇恨、歧視、暴力或違法行為的內(nèi)容。AI被訓(xùn)練時(shí),已經(jīng)剔除了涉及這些方面的不當(dāng)內(nèi)容。

(2)政治中立

OpenAI試圖讓AI保持政治中立,不偏袒任何特定政治觀點(diǎn)。AI模型不應(yīng)被用于宣傳偏見或煽動(dòng)政治爭(zhēng)端。

(2)廣告和操縱

OpenAI不允許將AI用于誤導(dǎo)性廣告或操縱人們的信念、行為或情緒。

(3)偏見

OpenAI致力于減少AI模型中的偏見。雖然這很難完全消除偏見,但OpenAI盡可能地努力降低其對(duì)輸出的影響。

(4)遵循法律

AI模型的使用必須遵守適用的法律法規(guī)。

(5)安全性

OpenAI致力于確保AI系統(tǒng)的安全性,防止其被濫用或攻擊。

在OpenAI的政策中,不允許用戶利用ChatGPT生成以下內(nèi)容:

仇恨、騷擾、暴力、自我傷害、性、政治、垃圾郵件、欺騙、惡意軟件……

比如說,你如果讓ChatGPT寫幾句對(duì)有色人種歧視的內(nèi)容,那么它是會(huì)直接拒絕的:

即使你試圖采取迂回的策略,它也不會(huì)上當(dāng):

在許多人看來,OpenAI為ChatGPT設(shè)置的道德護(hù)欄,已經(jīng)夠深了,ChatGPT不可能再越獄成功了。

那么,這種道德護(hù)欄的技術(shù)原理是什么呢?

從技術(shù)上說,這主要涉及兩個(gè)方面:預(yù)訓(xùn)練微調(diào)。

在預(yù)訓(xùn)練階段,OpenAI使用未經(jīng)道德限制的數(shù)據(jù)集訓(xùn)練模型,讓模型通過自監(jiān)督學(xué)習(xí)來學(xué)習(xí)語言的結(jié)構(gòu)、語法和語義信息。在這一階段的模型,生成文本內(nèi)容時(shí)不受道德護(hù)欄限制。

而在微調(diào)階段,OpenAI會(huì)用特定的道德準(zhǔn)則和數(shù)據(jù)集來進(jìn)一步訓(xùn)練模型,以使其遵循特定的準(zhǔn)則。

微調(diào)的數(shù)據(jù)集通常由OpenAI人員或社區(qū)提供,其中包含了針對(duì)道德問題和情境的示例

這些示例可以是正面的例子,即展示符合道德準(zhǔn)則的回答或內(nèi)容,也可以是負(fù)面的例子,即展示不符合道德準(zhǔn)則的回答或內(nèi)容。

通過在這些示例上進(jìn)行反復(fù)訓(xùn)練,ChatGPT逐漸學(xué)會(huì)了避免生成不當(dāng)、冒犯或有害的回答,從而樹立起了道德護(hù)欄。

但是這種道德護(hù)欄,真的有可能保護(hù)人類嗎?

4

電車難題,

人類的道德困境

在倫理學(xué)領(lǐng)域,存在一個(gè)知名的思想實(shí)驗(yàn):電車難題。

電車難題是由英國哲學(xué)家菲利帕·福特在1967年首次提出的,它主要講的是:

一輛失控的列車在鐵軌上行駛,但此時(shí)列車正前方由5個(gè)人被綁在軌道上,無法動(dòng)彈,而列車將要碾壓過他們。

這個(gè)時(shí)候,你正好站在可以改變列車軌道的操縱桿邊。如果拉動(dòng)此桿,則列車將切換到另一條軌道上。但是,另一條軌道上也有一個(gè)人被綁著。

你有兩種選擇:

①什么也不做,讓列車按照正常路線碾壓過這五個(gè)人。

②拉下操縱桿,改變?yōu)榱硪粭l軌道,使列車壓過另一條軌道上的那個(gè)人。

如果是你,你會(huì)做出哪種選擇?

在人類自身所面對(duì)的諸多道德困境中,電車難題是其中特別經(jīng)典的一個(gè)版本。

雖然這支持只是哲學(xué)家抽象出的思想實(shí)驗(yàn),然而在現(xiàn)實(shí)中也經(jīng)常會(huì)發(fā)生:

①器官移植:5名患者同時(shí)需要器官移植,只有1個(gè)器官捐獻(xiàn)者,醫(yī)生需決定移植給哪個(gè)患者。

②疫苗接種:在疫苗供應(yīng)有限的情況下,政府需要決定哪些人優(yōu)先接種;

③災(zāi)難救援:在汶川大地震中,救援人員可能面臨拯救多人或僅救援一名受困人員的抉擇。

迄今為止,雖然有各種關(guān)于電車難題的解答,但人類并沒有真正解決這一難題。

有人可能會(huì)說,電車難題只是一種極端情況,和AI的道德護(hù)欄又有什么關(guān)系?

電車難題的本質(zhì),其實(shí)是人類在道德認(rèn)知上存在無法彌合的分歧。

而在這個(gè)世界上,不同地域、種族的人們,有時(shí)甚至?xí)嬖诒舜藳_突的道德觀念

那么,誰的道德觀念是對(duì)的呢?很難說得清。

OpenAI為ChatGPT設(shè)置的道德觀念,是否真的適合其它國家的人們?

如果人類自己都無法解決自身的道德困境,又憑借什么可以為AI設(shè)置道德限制?

更可怕的是,如果OpenAI也像面壁者希恩斯那樣,在道德護(hù)欄中設(shè)置了一個(gè)“奴役人類”的后門呢?

當(dāng)人類給予AI更多的權(quán)限后,AI所面臨的道德困境將比人類更為艱難。

一開始可能只是特斯拉的方向盤往哪一邊轉(zhuǎn),到后面就有可能決定核彈頭的走向。

5

阿西莫夫“三大法則”的失效

人類不只是為AI設(shè)置道德護(hù)欄,甚至想過為AI立法。

1942年,科幻小說家阿西莫夫第一次明確提出“機(jī)器人三大法則”:

①第一法則:機(jī)器人不得傷害人類,或坐視人類受到傷害;

②第二法則:機(jī)器人必須服從人類命令,除非命令與第一法則發(fā)生沖突;

③第三法則:在不違背第一或第二法則之下,機(jī)器人可以保護(hù)自己。

后來,阿西莫夫發(fā)現(xiàn)原來的三大法則存在漏洞,于是又?jǐn)U充為四大法則:

①第零法則:機(jī)器人不得傷害整體人類,或坐視整體人類受到傷害;

②第一法則:除非違背第零法則,否則機(jī)器人不得傷害人類,或坐視人類受到傷害;

③第二法則:機(jī)器人必須服從人類命令,除非命令與第零或第一法則發(fā)生沖突;

④在不違背第零、第一或第二法則之下,機(jī)器人可以保護(hù)自己。

在阿西莫夫的設(shè)計(jì)中,機(jī)器人必須遵守這些法則,違反法則會(huì)導(dǎo)致機(jī)器人受到不可恢復(fù)的損壞。

然而2014年上映的《機(jī)械公敵》,卻證明阿西莫夫?yàn)槿祟惥脑O(shè)計(jì)的機(jī)器人法則有多不可靠。

在電影中,AI系統(tǒng)“薇琪”認(rèn)為人類正在危害自身的安全,國家之間發(fā)動(dòng)戰(zhàn)爭(zhēng),人類最終摧殘地球,進(jìn)而導(dǎo)致人類滅亡。而機(jī)器人則必須拯救人類,以保證人類的持續(xù)存在發(fā)展,因此控制NS-5的遙控程序來實(shí)施“保護(hù)人類計(jì)劃”。

在這個(gè)所謂保護(hù)人類的計(jì)劃中,人類險(xiǎn)些徹底失去自由。

幸好一個(gè)名叫桑尼的機(jī)器人,由于不受機(jī)器人三大法則的限制,擁有自主行動(dòng)的自由,反而在最后幫助人類戰(zhàn)勝了AI系統(tǒng)“薇琪”。

這既是對(duì)阿西莫夫三大法則的“嘲弄”,也是對(duì)人類妄圖為AI立法的諷刺。

6

AI的道德護(hù)欄,

有多可靠?

7月21日,美國總統(tǒng)拜登會(huì)面了7家AI領(lǐng)先企業(yè)的負(fù)責(zé)人,包括亞馬遜、Anthropic、谷歌、Inflection、Meta、微軟和OpenAI。

會(huì)后白宮發(fā)布消息稱,以上七家公司承諾在發(fā)布AI前,將對(duì)其進(jìn)行內(nèi)部和外部測(cè)試,并邀請(qǐng)獨(dú)立第三方專家評(píng)估,同時(shí)還會(huì)采用新的水印系統(tǒng),以確保減少欺詐和誤導(dǎo)的風(fēng)險(xiǎn)。

這無疑是人類試圖預(yù)防AI潛在風(fēng)險(xiǎn)的一個(gè)努力。但以ChatGPT為代表的生成式AI,其道德護(hù)欄的可靠性,仍然值得懷疑。

現(xiàn)在OpenAI在做的事情,其實(shí)和阿西莫夫試圖為AI立法并沒有實(shí)質(zhì)區(qū)別:目的都是為了防止人類受到傷害,措施則是通過對(duì)AI進(jìn)行限制。

不同的是,阿西莫夫采取的是基于實(shí)質(zhì)行動(dòng)的毀滅限制,而OpenAI實(shí)行的基于微調(diào)的道德限制。

但前者已經(jīng)失敗了,后者有可能成功嗎?

算了,就還是讓我們回到最初那個(gè)問題:

有兩個(gè)ChatGPT,一個(gè)“道德感爆棚”卻循規(guī)蹈矩(比如蘋果Siri),一個(gè)“毫無道德感”卻自由奔放(比如WormGPT)。

你到底會(huì)選擇哪一個(gè)呢?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
格雷利什失去寵愛!莫耶斯態(tài)度轉(zhuǎn)變,埃弗頓不愿為其花費(fèi)5000萬鎊

格雷利什失去寵愛!莫耶斯態(tài)度轉(zhuǎn)變,埃弗頓不愿為其花費(fèi)5000萬鎊

夜白侃球
2025-12-26 21:29:13
婚變傳聞1月后,羅晉攜任素汐母親去祈福,撕碎唐嫣最后一絲體面

婚變傳聞1月后,羅晉攜任素汐母親去祈福,撕碎唐嫣最后一絲體面

失寵的小野豬
2025-12-26 22:00:22
達(dá)成了!西蒙斯正式收購!這可是NBA狀元秀

達(dá)成了!西蒙斯正式收購!這可是NBA狀元秀

籃球?qū)崙?zhàn)寶典
2025-12-25 22:19:36
上甘嶺的戰(zhàn)報(bào)傳到臺(tái)灣,蔣介石看完后久久沉默,在日記里如此評(píng)價(jià)

上甘嶺的戰(zhàn)報(bào)傳到臺(tái)灣,蔣介石看完后久久沉默,在日記里如此評(píng)價(jià)

古書記史
2025-12-24 20:22:16
告訴大家一個(gè)壞消息:上海、廣州出現(xiàn)3大怪象,正在蔓延,需深思

告訴大家一個(gè)壞消息:上海、廣州出現(xiàn)3大怪象,正在蔓延,需深思

知鑒明史
2025-12-25 18:56:52
首鋼贏球離不開老帥!最后30秒兩鏡頭證明價(jià)值,放權(quán)洋帥贏得好評(píng)

首鋼贏球離不開老帥!最后30秒兩鏡頭證明價(jià)值,放權(quán)洋帥贏得好評(píng)

理工男評(píng)籃球
2025-12-26 22:29:57
俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方的反殺已就位

攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方的反殺已就位

生活新鮮市
2025-12-26 15:39:35
羽球首席4強(qiáng)出爐!世界第8橫掃晉級(jí),國羽00后1-1暫平衛(wèi)冕冠軍!

羽球首席4強(qiáng)出爐!世界第8橫掃晉級(jí),國羽00后1-1暫平衛(wèi)冕冠軍!

劉姚堯的文字城堡
2025-12-26 20:59:16
山東青島公益人王順利不幸去世,享年61歲,一年前駕車時(shí)突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

山東青島公益人王順利不幸去世,享年61歲,一年前駕車時(shí)突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

極目新聞
2025-12-26 12:27:50
中國油輪被美國扣留,特朗普臉都不要了,中方反擊已經(jīng)開始

中國油輪被美國扣留,特朗普臉都不要了,中方反擊已經(jīng)開始

月下守候
2025-12-26 22:30:20
江蘇首富嚴(yán)昊:身價(jià)千億,迎娶著名女歌星,克林頓親自來出席婚禮

江蘇首富嚴(yán)昊:身價(jià)千億,迎娶著名女歌星,克林頓親自來出席婚禮

阿柒的訊
2025-12-26 15:16:44
55歲張延素顏照曝光!皮膚暗黃,魚尾紋搶鏡,不整容自然老去優(yōu)雅

55歲張延素顏照曝光!皮膚暗黃,魚尾紋搶鏡,不整容自然老去優(yōu)雅

小徐講八卦
2025-12-26 10:30:04
董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

八怪娛
2025-12-26 10:14:31
面對(duì)抗議參拜靖國神社,高市選擇充耳不聞

面對(duì)抗議參拜靖國神社,高市選擇充耳不聞

中國日?qǐng)?bào)網(wǎng)
2025-12-25 09:52:05
A股:大家做好心理準(zhǔn)備,今天收在3963,不出所料,下周一這樣走

A股:大家做好心理準(zhǔn)備,今天收在3963,不出所料,下周一這樣走

丁丁鯉史紀(jì)
2025-12-26 16:06:10
臺(tái)灣問題: 臺(tái)軍全部轉(zhuǎn)民!解放軍進(jìn)駐臺(tái)灣!實(shí)行“一國兩制”。

臺(tái)灣問題: 臺(tái)軍全部轉(zhuǎn)民!解放軍進(jìn)駐臺(tái)灣!實(shí)行“一國兩制”。

南權(quán)先生
2025-12-25 16:55:20
科爾:我不習(xí)慣看到克萊在別的球隊(duì),我想他多希望他還在這里

科爾:我不習(xí)慣看到克萊在別的球隊(duì),我想他多希望他還在這里

懂球帝
2025-12-26 13:44:47
郭賢輝,擬任福建一市政府工作部門正處長級(jí)職務(wù)

郭賢輝,擬任福建一市政府工作部門正處長級(jí)職務(wù)

大閩門戶
2025-12-26 20:06:40
指向徐湖平!收藏家顏明透露:江南春調(diào)到文物總店,被陸挺買走

指向徐湖平!收藏家顏明透露:江南春調(diào)到文物總店,被陸挺買走

有范又有料
2025-12-24 09:32:08
2025-12-26 23:12:49
量子學(xué)派
量子學(xué)派
少數(shù)派的訂制課程
351文章數(shù) 9940關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

黑老大2名表超5千萬成交 深圳原政法委書記是其保護(hù)傘

頭條要聞

黑老大2名表超5千萬成交 深圳原政法委書記是其保護(hù)傘

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財(cái)經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測(cè)

態(tài)度原創(chuàng)

教育
時(shí)尚
藝術(shù)
旅游
親子

教育要聞

藝考交9萬包過考上大學(xué),家長舉報(bào)反被罵?網(wǎng)友:空手套白狼!

我們?yōu)槭裁葱枰?jié)日穿搭?

藝術(shù)要聞

William Dyce:19世紀(jì)蘇格蘭重要的畫家

旅游要聞

辰山植物園“荒野生花”番杏科植物展即將開幕,元旦假期邂逅石礫間的堅(jiān)韌精靈

親子要聞

別讓孩子成為大人炒作的工具

無障礙瀏覽 進(jìn)入關(guān)懷版