国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Google AI 搜索每天或生成數千萬條錯誤答案

0
分享至

有測試顯示,Google在搜索結果中默認展示的 AI 總覽內容雖然大部分時間是準確的,但在當前超大規(guī)模的搜索量之下,哪怕只有一小部分出錯,也意味著用戶每天會看到數以千萬計的錯誤答案。


《紐約時報》援引 AI 初創(chuàng)公司 Oumi 的評估稱,大約每 10 條Google AI 總覽中就有 1 條包含虛假信息。按Google每年處理約 5 萬億次搜索來推算,用戶每小時可能會接觸到超過 5700 萬條不準確的回答,換算下來幾乎是“每分鐘近百萬條”。

Oumi 應《紐約時報》要求,使用廣泛采用的生成式 AI 測試基準 SimpleQA,對Google搜索中的 Gemini 準確率做了量化評估。在 4326 條搜索樣本中,去年 10 月 Gemini 2 提供準確 AI 總覽的比例約為 85%,到了今年 2 月升級到 Gemini 3 后,這一比例提升到 91%。

不過,Oumi 之所以能在大樣本規(guī)模下進行評估,本身也依賴其他 AI 工具,這可能會引入新的誤差。與此同時,Google在現實使用中有時會對同一搜索請求給出不同的 AI 總覽內容,即便兩次搜索之間僅間隔數秒,這也加大了評估難度。

Google方面則認為 Oumi 的測試方法“有缺陷”,并不符合真實世界的搜索行為。按照Google內部測試數據,在脫離搜索、單獨運行的情況下,Gemini 3 的“幻覺率”(生成錯誤內容的比例)約為 28%。

報道指出,信息來源也是一大難題。Google會嘗試在 AI 總覽中附上相關鏈接,但這些鏈接經常無法真正支撐 Gemini 給出的結論——無論這些結論本身是對是錯。測試發(fā)現,在一些情況下,錯誤的 AI 總覽后面緊跟著的鏈接卻給出了正確信息;也有時候,總覽內容準確,但引用的是含有錯誤信息的網頁;還有一部分結果中,鏈接頁面根本沒有與總覽相關的內容。

更值得注意的是,AI 總覽與其引用來源之間的不一致現象在升級后更加突出:使用 Gemini 2 時,有 37% 的搜索存在這種不一致,而升級 Gemini 3 后,這一比例升至 56%。

研究人員還發(fā)現,AI 總覽容易被外部內容“操控”。一位 BBC 記者在個人博客中刻意發(fā)布了錯誤信息,隨后便發(fā)現Google在第二天的搜索總覽中重復了這些不實內容。

在使用條款的細則中,幾家主流科技公司事實上都承認了當前生成式 AI 對“真實性”的把握仍然不牢靠。微軟在條款中把其 Copilot 工具界定為“僅供娛樂”,不適宜用于做出重要決策。Google則在 AI 總覽界面明確提示用戶要對回答進行再次核查,而 xAI 也公開承認,其模型存在產生“幻覺”的可能性。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
掀翻SeeDance2.0!面對字節(jié)的AI帝國,阿里出手了

掀翻SeeDance2.0!面對字節(jié)的AI帝國,阿里出手了

藍字計劃
2026-04-10 17:44:07
這5個農歷生日尾數的人,小時是孝子,長大是才子,平安如意!

這5個農歷生日尾數的人,小時是孝子,長大是才子,平安如意!

白淺娛樂聊
2026-04-11 18:40:44
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
事實證明,過早把小酒窩推到臺前的董璇,已經開始在付出代價

事實證明,過早把小酒窩推到臺前的董璇,已經開始在付出代價

阿廢冷眼觀察所
2026-04-10 17:44:45
為啥農村男孩結婚越來越難 看網友講述原來他們早已把路給走絕了

為啥農村男孩結婚越來越難 看網友講述原來他們早已把路給走絕了

侃神評故事
2026-04-10 07:40:06
有勇無謀,難怪泰山和國安都不要他,浙江花500萬成冤大頭

有勇無謀,難怪泰山和國安都不要他,浙江花500萬成冤大頭

體壇風之子
2026-04-11 17:24:29
陳光標回應一切,1000萬不是逼捐,累計捐60億元,不需要蹭流量

陳光標回應一切,1000萬不是逼捐,累計捐60億元,不需要蹭流量

數字財經智庫
2026-04-11 14:54:51
鄭麗文對“和平統一”交底,美國發(fā)聲,宋楚瑜發(fā)聲,侯友宜不裝了

鄭麗文對“和平統一”交底,美國發(fā)聲,宋楚瑜發(fā)聲,侯友宜不裝了

奇思妙想生活家
2026-04-11 18:34:43
Tucker被特朗普罵"低智商"后,反手甩出90年代白宮電話錄音

Tucker被特朗普罵"低智商"后,反手甩出90年代白宮電話錄音

熱搜摘要官
2026-04-11 08:02:41
印度攤販當街斬首貨車司機! 提頭照網上瘋傳 群眾暴怒圍毆釀雙亡

印度攤販當街斬首貨車司機! 提頭照網上瘋傳 群眾暴怒圍毆釀雙亡

環(huán)球趣聞分享
2026-04-11 14:06:07
最虧本買賣:廣西用一個縣換廣東三個市加出???,到底誰賺翻了?

最虧本買賣:廣西用一個縣換廣東三個市加出???,到底誰賺翻了?

輝哥說動漫
2026-04-11 02:27:00
兩岸統一后,要如何處置20萬臺軍?

兩岸統一后,要如何處置20萬臺軍?

起喜電影
2026-04-10 19:46:19
李亞鵬回應陳光標捐款 :標哥真金白銀捐了1000萬,已經到賬,沒有限定用途!陳光標:錢怎么有效怎么用,無條件信任他

李亞鵬回應陳光標捐款 :標哥真金白銀捐了1000萬,已經到賬,沒有限定用途!陳光標:錢怎么有效怎么用,無條件信任他

每日經濟新聞
2026-04-10 17:28:39
鄭告蔣家后代:蔣介石逝哪葬哪,是對全體中國人民的最好安排!

鄭告蔣家后代:蔣介石逝哪葬哪,是對全體中國人民的最好安排!

扶蘇聊歷史
2025-12-26 16:08:12
霉霉被拍到和好友出街,36歲狀態(tài)像剛更新完系統

霉霉被拍到和好友出街,36歲狀態(tài)像剛更新完系統

娛圈觀察員
2026-04-10 08:13:55
兩戰(zhàn)轟54+23!41歲詹皇夢回18詹打爆太陽 迎里程碑再創(chuàng)歷史第一

兩戰(zhàn)轟54+23!41歲詹皇夢回18詹打爆太陽 迎里程碑再創(chuàng)歷史第一

硯底沉香
2026-04-11 19:25:19
哈薩克斯坦2000萬噸稀土轉賣美日,簽完協議發(fā)現,還是繞不開中國

哈薩克斯坦2000萬噸稀土轉賣美日,簽完協議發(fā)現,還是繞不開中國

觸摸史跡
2026-04-11 13:22:23
不裝了?高市早苗通告全世界:降級對華關系,中國欠下日本兩筆賬

不裝了?高市早苗通告全世界:降級對華關系,中國欠下日本兩筆賬

策前論
2026-04-11 19:18:00
天后麥當娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

天后麥當娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

七阿姨愛八卦
2026-04-09 09:32:37
加納喬甩下一句"不后悔",曼聯青訓17年白干了

加納喬甩下一句"不后悔",曼聯青訓17年白干了

賽場名場面
2026-04-11 19:03:39
2026-04-11 19:59:00
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行業(yè)即時資訊
67332文章數 70152關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

美國否認同意解凍伊朗資產 巴官員:美方急了 伊朗不急

頭條要聞

美國否認同意解凍伊朗資產 巴官員:美方急了 伊朗不急

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

房產
健康
旅游
游戲
本地

房產要聞

土地供應突然暴跌!2026??跇鞘校窬执笞?!

干細胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

千城百縣看中國·賞花季|福建華安:繡球花開映山鄉(xiāng)

《星砂島》小游戲侵權俄羅斯方塊 已從Steam下架

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

無障礙瀏覽 進入關懷版