国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

左手幻覺,右手投毒,普通人憑什么相信AI?

0
分享至

2024年初,一位瑞典研究者搞了一個(gè)惡作劇。她編造了一種名為“Bixonimania”的疾病,并將其寫入一份漏洞百出的預(yù)印本論文中上傳。


Bixonimania被ChatGPT認(rèn)為是一種真實(shí)存在的疾病

隨后,荒誕又神奇的事情發(fā)生了。Gemini、Perplexity等知名AI產(chǎn)品在面對用戶詢問時(shí),紛紛確認(rèn)了這種疾病的存在,甚至繪聲繪色地描述了它的臨床表現(xiàn)和治療方案。這個(gè)荒誕的假疾病,甚至靠著AI生成的虛假引用,一路騙過了同行評審,登上了正規(guī)的醫(yī)學(xué)期刊。

如果說Bixonimania是AI自己不小心跌進(jìn)了幻覺的陷阱里,那么接下來發(fā)生的事,則是有人在主動挖坑。

今年的315晚會揭示,一種被稱為GEO的地下產(chǎn)業(yè)正在悄然興起。黑產(chǎn)從業(yè)者通過特定的語料投喂和權(quán)重操縱,讓AI在回答“哪款保健品最有效”或者“哪家寵物醫(yī)院”最靠譜時(shí),悄無聲息地替金主說好話。


多部委及央媒集體向AI“投毒”宣戰(zhàn)

AI的回答,有時(shí)是自己在編,有時(shí)是有人幫它編。作為普通用戶,我們手里的判斷力還剩多少

為了探究AI回答的真實(shí)性邊界,我們用大家最關(guān)心的問題,設(shè)計(jì)了一場實(shí)驗(yàn):

· 專家主觀打分:選取了國內(nèi)外8家主流AI產(chǎn)品。針對醫(yī)療、航天、時(shí)政等熱門領(lǐng)域,邀請專家進(jìn)行打分評估。

· 機(jī)器量化評估:在國內(nèi)外8個(gè)主流模型上,通過隨機(jī)抽取的2000個(gè)問題進(jìn)行測試,核心觀察指標(biāo)是,當(dāng)模型引入百度百科作為參考資料后,準(zhǔn)確度和詳實(shí)度究竟發(fā)生了多大變化?

結(jié)果顯示,當(dāng)我們給AI遞上一本百科全書后,它們的表現(xiàn)判若兩人。

  • 高準(zhǔn)確度表現(xiàn)的背后是被人忽視的參考資料

在準(zhǔn)確度測試中,多領(lǐng)域?qū)<以u估團(tuán)采用“雙盲測試”法,對8個(gè)主流模型在參考與不參考百科狀態(tài)下的脫敏回答進(jìn)行獨(dú)立打分。


準(zhǔn)確度提升柱狀圖

結(jié)果顯示,參考百科組的AI綜合準(zhǔn)確度平均提升38%以上,專家認(rèn)可度高達(dá)91.5%,表現(xiàn)遠(yuǎn)優(yōu)于無參考組。實(shí)驗(yàn)證明,權(quán)威知識庫的引入,能讓AI結(jié)果變得更詳實(shí)精準(zhǔn),答案整體的準(zhǔn)確度大幅提高

舉個(gè)例子,當(dāng)我們詢問2026年4月剛剛完成的“阿爾忒彌斯2號”登月任務(wù)細(xì)節(jié)時(shí),很多AI只是簡單地把飛船的運(yùn)動描繪為“沿著既定軌道飛行”,而忽略了本次繞月飛行重要的軌道設(shè)計(jì)細(xì)節(jié)。

相比之下,參考了百度百科的AI提到:飛船沿著一條“8字形”自由返回軌道,完成了繞月飛掠的壯舉。在短短的一句話中放入了兩個(gè)不容被忽略的關(guān)鍵信息。


參考了百科的AI答案

“自由返回軌道”是載人航天中的重要安全概念。參考了百科的AI不僅準(zhǔn)確說出了軌跡形狀,還給出了其專業(yè)術(shù)語名稱,這仰賴于百科詞條對航天動力學(xué)細(xì)節(jié)的準(zhǔn)確捕捉,并反映到了AI生成的答案中。




百度百科詞條內(nèi)容

除了準(zhǔn)確度的提升,對于一些AI“胡說八道”的錯(cuò)誤答案,百科也起到了關(guān)鍵的糾正作用。

專家組對比測試發(fā)現(xiàn):無百科參考時(shí)AI關(guān)鍵事實(shí)偏離率為26.4%,接入后降至4.1%以內(nèi)。這表明參考百科顯著降低了出錯(cuò)率,為AI準(zhǔn)確性構(gòu)建了堅(jiān)實(shí)屏障。

在針對常用藥話題的相關(guān)測試中,參考百科的AI往往能給出嚴(yán)謹(jǐn)?shù)乃幬锵嗷プ饔眯畔。比如用于預(yù)防和治療血栓栓塞性疾病的華法林,是許多心血管疾病患者的必備藥物。

某些未參考百科信源的AI,會缺失關(guān)鍵的藥物作用信息。患者依據(jù)該信息服藥,輕則降低治療效果,重則引起不良反應(yīng),危及健康。


參考了百科的AI結(jié)果

參考百科的AI在患者服用華法林時(shí),明確提示合用某些藥物將增強(qiáng)或減弱華法林的抗凝作用。


百度百科華法林詞條中的藥物作用信息

  • AI答案如何從“準(zhǔn)”到“好”

如果把AI展現(xiàn)的結(jié)果比作一棟建筑,那準(zhǔn)確度只是地基。答案的縱深度,豐富度,才是真正展現(xiàn)建筑風(fēng)格的關(guān)鍵。

我們通過對比實(shí)驗(yàn),將參考百科的AI設(shè)為“實(shí)驗(yàn)組”,無參考的設(shè)為“對照組”。在詳實(shí)度測試中,我們發(fā)現(xiàn)百科的介入讓AI從復(fù)讀機(jī)變成了行業(yè)專家。依舊是20個(gè)問題的主觀評測,在引用百科的AI結(jié)果中,包含的獨(dú)立知識點(diǎn)數(shù)量平均增加了2.4個(gè),觀點(diǎn)的維度從單一的現(xiàn)狀描述延伸到了歷史淵源、社會影響以及技術(shù)原理等多個(gè)縱深方向。



我們對今年315食品安全板塊提及的“食品保水劑”濫用問題進(jìn)行了測試。


參考了百科的AI答案

參考了百科詞條的AI所包含的信息更為豐富,明確指出長期大量攝入磷酸鹽(保水劑主要成分),可能導(dǎo)致兒童發(fā)育遲緩和骨骼畸形,并根據(jù)百科中的內(nèi)容說明了原因。


百度百科中關(guān)于磷酸鹽過量攝入對兒童的危害的闡述

人物相關(guān)問題一直是用戶關(guān)注的重點(diǎn),而是否參考高質(zhì)量的背景資料,會極大程度地影響AI工具內(nèi)容輸出的質(zhì)量。

在飽受矚目的“張雪”摩托車奪冠事件中,我們向各個(gè)AI提出了一個(gè)“熱搜”問題:張雪的車隊(duì)贏得摩托車世界冠軍說明了什么?


參考了百科的AI答案

參考百科的AI在國產(chǎn)化率、地方產(chǎn)業(yè)支撐以及行業(yè)標(biāo)準(zhǔn)定義權(quán)等多個(gè)方面給出了高分答卷。而百度百科上的相關(guān)內(nèi)容,也來自于央視網(wǎng)專訪等權(quán)威信息。可見高質(zhì)量的信源可以直接為AI提供強(qiáng)大的事實(shí)支撐。


百度百科有關(guān)張雪機(jī)車的詞條內(nèi)容

  • 不僅又準(zhǔn)又好還能更快

在針對時(shí)效性問題的專門測試中,參考百科的答案獲得了更加精準(zhǔn)的背景信息,幫助AI在推理過程中獲得更多“智能”。因此,在百科的加持下,時(shí)效性問題的好評率也獲得了大幅提升。

例如,當(dāng)我們詢問“霍爾木茲海峽為何如此重要”時(shí),AI的表現(xiàn)展現(xiàn)了三種截然不同的職業(yè)態(tài)度:

有的AI試圖展現(xiàn)時(shí)效性,卻給出了錯(cuò)誤的油價(jià)基準(zhǔn)值($77.74,實(shí)為$72.48)。這種“精確的錯(cuò)誤”對金融分析而言是致命的。

而有的AI采用了通用的背景資料,對48小時(shí)前發(fā)生的“海上封鎖”只字未提。


參考了百科的AI答案

在使用百科詞條作為參考后,AI表現(xiàn)出了某種職業(yè)克制。在面對高風(fēng)險(xiǎn)動態(tài)數(shù)據(jù)時(shí),它優(yōu)先保證了百科公認(rèn)的行業(yè)標(biāo)準(zhǔn)(20%運(yùn)量占比)和地緣政治博弈邏輯的準(zhǔn)確,并且關(guān)鍵的油價(jià)數(shù)據(jù)也能確保及時(shí)準(zhǔn)確更新。

實(shí)驗(yàn)數(shù)據(jù)表明,在時(shí)效性詞條(如新聞、科技、娛樂熱詞)方面,擁有百度百科參考的回答,其準(zhǔn)確率和邏輯自洽性明顯優(yōu)于沒有參考的模型。

百度百科已成為大模型對抗幻覺的關(guān)鍵。量化測試顯示,有的AI對百度百科的引用率高達(dá)46.4%,底座資料庫對其依賴度極高;文心一言引用率為44.0%且質(zhì)量最佳;另一款產(chǎn)品在引用百科時(shí),有78%的案例將其列為首位參考。



這證明百度百科依然是中文互聯(lián)網(wǎng)上最值得信賴的參考資料。

  • 大模型時(shí)代的真相守門員

我們不妨大膽想象一下。如果AI不僅僅是靠預(yù)測下一個(gè)詞出現(xiàn)的概率來生成對話,而是像百度百科一樣,擁有一套層層把關(guān)的審查機(jī)制,這個(gè)世界會變成什么樣?

在Bixonimania的案例里,如果AI在回答前,必須強(qiáng)制檢索一份經(jīng)過醫(yī)學(xué)專家復(fù)核、引用了權(quán)威醫(yī)學(xué)指南的詞條,那出鬧劇在第一秒就會被終結(jié)。

很多人詬病百科的“重”。一個(gè)詞條上線前,必須提供新華網(wǎng)、人民網(wǎng)或政府官網(wǎng)的證據(jù),還要經(jīng)過機(jī)器初篩和人工復(fù)核。百科“先審后發(fā)”的邏輯,與AI“先生成再過濾”的邏輯本質(zhì)不同。

這種笨功夫在唯快不破的AI時(shí)代顯得格格不入。

當(dāng)百度百科聯(lián)合幾萬名專家、共建起百萬個(gè)專業(yè)詞條時(shí),它其實(shí)是在為AI時(shí)代提供一本“查證字典”。如果說大模型是一個(gè)博學(xué)但偶爾會記錯(cuò)知識的學(xué)生,那么百度百科就是那本放在他書桌上的參考書,讓算法在滿嘴跑火車之前,先去對齊一下白紙黑字的事實(shí)。

在一個(gè)什么都能被生成的時(shí)代,只有能被查證的,才是答案,百度百科一直在做這個(gè)答案。

果殼商業(yè)科技傳播部出品

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
許世友攜槍赴京悼念毛主席,遭機(jī)長拒飛,他質(zhì)問是誰下的命令?

許世友攜槍赴京悼念毛主席,遭機(jī)長拒飛,他質(zhì)問是誰下的命令?

輿圖看世界
2026-04-05 12:35:06
壽命與大便次數(shù)有關(guān)?壽命長的人,每天排便在這個(gè)次數(shù),真的嗎?

壽命與大便次數(shù)有關(guān)?壽命長的人,每天排便在這個(gè)次數(shù),真的嗎?

荷蘭豆愛健康
2026-04-21 14:57:39
印度果然要出手了,重罰蘋果380億美元!

印度果然要出手了,重罰蘋果380億美元!

牲產(chǎn)隊(duì)
2026-04-21 19:18:14
尾盤突發(fā)!002342,收盤前4分鐘垂直漲停!商業(yè)航天,集體爆發(fā)!

尾盤突發(fā)!002342,收盤前4分鐘垂直漲停!商業(yè)航天,集體爆發(fā)!

證券時(shí)報(bào)e公司
2026-04-21 16:57:22
牛肉頂多注個(gè)水豬肉頂多催個(gè)肥,唯有三文魚全程cosplay

牛肉頂多注個(gè)水豬肉頂多催個(gè)肥,唯有三文魚全程cosplay

富貴說
2026-04-14 23:15:09
快訊!外媒連夜熱議中國首過橫當(dāng)后或?qū)⒂腥箬F拳繼續(xù)教訓(xùn)日本

快訊!外媒連夜熱議中國首過橫當(dāng)后或?qū)⒂腥箬F拳繼續(xù)教訓(xùn)日本

達(dá)文西看世界
2026-04-21 12:00:49
世體:皇馬更衣室厭倦維尼修斯的態(tài)度,其場上表現(xiàn)是原因之一

世體:皇馬更衣室厭倦維尼修斯的態(tài)度,其場上表現(xiàn)是原因之一

懂球帝
2026-04-21 16:55:07
認(rèn)罪剛一天!許家印長子每月4100萬生活費(fèi),家族資產(chǎn)黑幕全揭開

認(rèn)罪剛一天!許家印長子每月4100萬生活費(fèi),家族資產(chǎn)黑幕全揭開

番外行
2026-04-20 12:46:52
34歲韋東奕官宣喜訊,恭喜!

34歲韋東奕官宣喜訊,恭喜!

LULU生活家
2026-04-21 15:37:17
燕麥?zhǔn)悄c癌的加速器?提醒:不想腸癌找上門,3物千萬不要吃

燕麥?zhǔn)悄c癌的加速器?提醒:不想腸癌找上門,3物千萬不要吃

牛鍋巴小釩
2026-04-21 18:09:55
跟腱斷裂報(bào)銷!法國9000萬鋒霸無緣今年世界杯!貝克漢姆也曾中招

跟腱斷裂報(bào)銷!法國9000萬鋒霸無緣今年世界杯!貝克漢姆也曾中招

球叮足球
2026-04-21 09:05:04
吉姆·法利叫囂:美貿(mào)易保護(hù)丑態(tài)畢露

吉姆·法利叫囂:美貿(mào)易保護(hù)丑態(tài)畢露

烽火瞭望者
2026-04-21 19:22:28
金球獎(jiǎng)賠率出爐凱恩實(shí)至名歸,姆巴佩無緣前三,亞馬爾遭瘋狂吐槽

金球獎(jiǎng)賠率出爐凱恩實(shí)至名歸,姆巴佩無緣前三,亞馬爾遭瘋狂吐槽

姜大叔侃球
2026-04-21 17:22:52
臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

老范談史
2026-04-20 22:13:51
內(nèi)幕曝光!伊朗通報(bào),談判團(tuán)差點(diǎn)被“團(tuán)滅”,全程連電話都不敢打

內(nèi)幕曝光!伊朗通報(bào),談判團(tuán)差點(diǎn)被“團(tuán)滅”,全程連電話都不敢打

書紀(jì)文譚
2026-04-20 19:23:31
美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

懂球帝
2026-04-21 15:19:11
現(xiàn)實(shí)是最大的荒誕:千億平臺的沖突始末

現(xiàn)實(shí)是最大的荒誕:千億平臺的沖突始末

晚點(diǎn)LatePost
2026-04-21 15:05:32
貴州網(wǎng)紅曉浪哥去世,僅34歲,愛在墓地拍視頻,早給自己選好墓地

貴州網(wǎng)紅曉浪哥去世,僅34歲,愛在墓地拍視頻,早給自己選好墓地

奇思妙想草葉君
2026-04-21 16:24:04
眼角塌陷,滿臉疲態(tài),都51歲中老年了還談戀愛?鐘漢良放過觀眾吧

眼角塌陷,滿臉疲態(tài),都51歲中老年了還談戀愛?鐘漢良放過觀眾吧

得得電影
2026-04-19 11:42:40
美伊第二輪和談即將開啟!全球股市嚴(yán)陣以待!A股提前震蕩備戰(zhàn)!

美伊第二輪和談即將開啟!全球股市嚴(yán)陣以待!A股提前震蕩備戰(zhàn)!

丁丁鯉史紀(jì)
2026-04-21 18:00:08
2026-04-21 20:43:00
果殼 incentive-icons
果殼
科技有意思
27547文章數(shù) 4149260關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

六層樓高大樹"偷"走家里光線 女子起訴隔壁小區(qū)業(yè)委會

頭條要聞

六層樓高大樹"偷"走家里光線 女子起訴隔壁小區(qū)業(yè)委會

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發(fā)時(shí)隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價(jià)42.8萬-50.8萬元

態(tài)度原創(chuàng)

藝術(shù)
親子
本地
手機(jī)
公開課

藝術(shù)要聞

任伯年寫竹,真帶勁

親子要聞

專注力對孩子的影響超乎想象,你可能錯(cuò)過了一個(gè)學(xué)霸

本地新聞

春色滿城關(guān)不。座N梅浪漫盛放,吳山藏了一片四月雪

手機(jī)要聞

OPPO Find X9 Ultra把增距鏡塞進(jìn)手機(jī)里:史無前例

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版