国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI翻譯的「最后一公里」

0
分享至


新智元報(bào)道

編輯:艾倫

【新智元導(dǎo)讀】在巴布亞新幾內(nèi)亞的一個(gè)原始部落,情感的中心是肝臟而非心臟;在納米比亞,有一個(gè)專門的詞形容「光腳踩在熱沙上」。這些人類經(jīng)驗(yàn)的細(xì)微差別,正成為AI翻譯難以逾越的「最后且最遠(yuǎn)的一英里」。

在巴布亞新幾內(nèi)亞的叢林深處,阿瓦人(Awa)并不相信心臟是情感的中心。

如果你想對(duì)他們表達(dá)真誠(chéng),你不能說「敞開心扉」,而應(yīng)該說「敞開你的肝臟」。

而在同一個(gè)島嶼的另一端,拉瓦人(Rawa)則堅(jiān)信,人類的靈魂與情感棲息在胃里。


這些細(xì)微且致命的文化差異,曾是翻譯者數(shù)百年來(lái)無(wú)法逾越的天塹。

但現(xiàn)在,硅谷最前沿的AI正在試圖填平這個(gè)天塹。

被遺忘的語(yǔ)料荒漠

對(duì)于ChatGPT或Gemini這樣的通用大模型來(lái)說,英語(yǔ)是「富人區(qū)」,中文和法語(yǔ)是「中產(chǎn)階級(jí)」,而像阿瓦語(yǔ)這樣的語(yǔ)言,則是徹底的「貧民窟」。

在AI的訓(xùn)練集中,英語(yǔ)占據(jù)了90%以上的份額。

這種數(shù)據(jù)的極度不平衡創(chuàng)造了一種「算法霸權(quán)」:模型傾向于用英語(yǔ)的邏輯去理解世界。

當(dāng)你輸入一個(gè)復(fù)雜的中文成語(yǔ),AI往往會(huì)先將其「腦補(bǔ)」成英文語(yǔ)境下的對(duì)應(yīng)概念,再翻譯回來(lái),導(dǎo)致原意的流失。

而在那些僅有數(shù)千人使用的「低資源語(yǔ)言」中,情況更為糟糕。

互聯(lián)網(wǎng)上幾乎不存在這些語(yǔ)言的文本數(shù)據(jù),AI無(wú)書可讀。

威克理夫圣經(jīng)翻譯會(huì)(Wycliffe)手中的《圣經(jīng)》,往往是這些邊緣語(yǔ)言中唯一存在的長(zhǎng)文本。

他們要在2033年前實(shí)現(xiàn)「讓所有語(yǔ)言都有譯本」,實(shí)現(xiàn)他們?cè)妇爸械摹富皆倥R」。

2022年,Meta開源了名為「不讓任何語(yǔ)言掉隊(duì)」的AI模型NLLB-200 (No Language Left Behind)。

相關(guān)新文章(非上述舊模型):

扎克伯格的本意或許更多是為了讓他在非洲和亞洲的用戶能更順暢地刷Instagram,從而提升廣告效率,但這個(gè)模型意外地成為了語(yǔ)言學(xué)家的新寵。

翻譯機(jī)構(gòu)迅速采用了這個(gè)本為商業(yè)互聯(lián)設(shè)計(jì)的模型,將其微調(diào)用于處理那些最晦澀難懂的古老方言。

但有了這個(gè)模型,并不是直接萬(wàn)事大吉了。

AI的幻覺

數(shù)據(jù)科學(xué)家丹尼爾·惠特納克(Daniel Whitenack)發(fā)出警告:你不能把經(jīng)文直接扔進(jìn)ChatGPT然后坐等結(jié)果。


因?yàn)楫?dāng)AI遇到它不懂的領(lǐng)域時(shí),它不會(huì)沉默,它會(huì)撒謊,也就是AI幻覺。

以《圣經(jīng)》翻譯為例,這簡(jiǎn)直是AI的噩夢(mèng)。

新約由一種并不規(guī)范的古希臘語(yǔ)寫成,充滿了歧義。

比如主禱文中「賜給我們今日的epiousion飲食」,至今無(wú)人確切知曉這個(gè)詞的含義,學(xué)者們只能妥協(xié)地譯為「日?!埂?/p>

當(dāng)AI面對(duì)這種模糊性時(shí),它傾向于根據(jù)概率「猜」一個(gè)最通順的詞,而不是最準(zhǔn)確的詞,而這可能導(dǎo)致嚴(yán)重的語(yǔ)義偏離。

如今,一個(gè)算法權(quán)重的微小波動(dòng),可能就會(huì)在毫秒間改寫這個(gè)定義。

更荒謬的例子發(fā)生在日常翻譯中。

有研究發(fā)現(xiàn),當(dāng)處理極低資源語(yǔ)言時(shí),AI有時(shí)會(huì)陷入「振蕩性幻覺」,開始像念經(jīng)一樣無(wú)限重復(fù)某個(gè)單詞;或者產(chǎn)生「分離性幻覺」,即翻譯出的句子通順優(yōu)美,但內(nèi)容與原文毫無(wú)關(guān)系,仿佛是機(jī)器自己在編故事。

在商業(yè)文檔中,這種錯(cuò)誤或許只是把「環(huán)保的」(Eco-friendly)錯(cuò)譯為「經(jīng)濟(jì)的」(Econ-friendly),但在文化傳承或法律文本中,這種「一本正經(jīng)的胡說八道」是致命的。

沒有身體的翻譯官

AI最大的強(qiáng)項(xiàng)和軟肋,在于它沒有肉身。

它從未感受過饑餓、寒冷或疼痛,因此它無(wú)法真正理解那些基于生理體驗(yàn)的隱喻。

在納米比亞的魯匡阿里語(yǔ)(Rukwangali)中,有一個(gè)詞叫「Hanyauku」,特指「腳尖踩在滾燙沙子上走路」的動(dòng)作。

對(duì)于生活在沙漠邊緣的人來(lái)說,這是一個(gè)極具畫面感的日常詞匯。

但對(duì)于生活在服務(wù)器機(jī)房里的AI來(lái)說,這是一串無(wú)法解碼的亂碼。

同樣,「攻城錘」(battering-ram)這個(gè)詞,在許多和平的原始部落語(yǔ)言中根本不存在。

人類譯者會(huì)創(chuàng)造性地將其意譯為「撞擊城門的巨大木桿」或「戰(zhàn)爭(zhēng)機(jī)器」,而AI可能會(huì)直接卡死,或者生硬地音譯一個(gè)沒人聽得懂的新詞。


這就是為什么「人」依然是翻譯閉環(huán)中不可或缺的一環(huán)。

IllumiNations聯(lián)盟雖然利用AI將新約的翻譯周期從十幾年縮短到了兩年,但他們強(qiáng)調(diào),AI只是完成了初稿。

原本需要在叢林中耗費(fèi)數(shù)十年學(xué)習(xí)語(yǔ)言的傳教士,現(xiàn)在變成了「高級(jí)編輯」。

他們的工作重心從「從零翻譯」轉(zhuǎn)變?yōu)椤讣m正機(jī)器的文化盲區(qū)」。

在巴布亞新幾內(nèi)亞,只有深諳當(dāng)?shù)匚幕娜祟?,才懂得把「接受耶穌進(jìn)入心臟」改為「進(jìn)入肝臟」。

這種對(duì)「痛點(diǎn)」和「笑點(diǎn)」的精準(zhǔn)捕捉,是目前硅谷最昂貴的算力也無(wú)法模擬的。

翻譯的最后一公里

這不僅是關(guān)于《圣經(jīng)》的故事,更是關(guān)于人類溝通終極困境的寓言。

我們?cè)谠噲D構(gòu)建一種通用的理解工具,但語(yǔ)言本身卻是極其私人和部落化的。

每一個(gè)「不可翻譯」的詞匯背后,都是一種獨(dú)特的生活方式。

蘇格蘭語(yǔ)里的Tartle(介紹人時(shí)突然忘了對(duì)方名字的尷尬),日語(yǔ)里的きょういくママ(虎媽,熱衷于雞娃的母親),意大利語(yǔ)里的abbioccio(飽餐后的困倦與滿足),這些詞匯構(gòu)成了人類經(jīng)驗(yàn)的拼圖。

AI正在幫我們以此前難以想象的速度拼湊這幅拼圖。

它像一架推土機(jī),推平了語(yǔ)言學(xué)習(xí)的門檻,讓知識(shí)的流動(dòng)不再受限于國(guó)界。

但推土機(jī)無(wú)法完成最后的精調(diào)。

2033年的目標(biāo)或許能夠達(dá)成,但那將是人機(jī)協(xié)作的勝利。

在技術(shù)的盡頭,依然站著一個(gè)需要被理解的人。

參考資料:

https://www.economist.com/culture/2025/12/11/the-race-to-translate-the-bible-into-every-language-by-2033

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
已經(jīng)爛到?jīng)]有底線了

已經(jīng)爛到?jīng)]有底線了

徐幫陽(yáng)
2025-12-25 20:52:14
場(chǎng)均23分鐘16+6!2.01米女鯊魚終遇伯樂 減重20斤可入女籃一隊(duì)?

場(chǎng)均23分鐘16+6!2.01米女鯊魚終遇伯樂 減重20斤可入女籃一隊(duì)?

顏小白的籃球夢(mèng)
2025-12-25 20:16:29
癱子娘、瘋子爹!744分高考狀元被清華錄取8年后,現(xiàn)狀令人淚目

癱子娘、瘋子爹!744分高考狀元被清華錄取8年后,現(xiàn)狀令人淚目

阿柒的訊
2025-12-22 18:46:40
美軍兵推:核打擊中國(guó)后,中方首個(gè)報(bào)復(fù)目標(biāo)非美國(guó)是這兩個(gè)國(guó)家?

美軍兵推:核打擊中國(guó)后,中方首個(gè)報(bào)復(fù)目標(biāo)非美國(guó)是這兩個(gè)國(guó)家?

時(shí)時(shí)有聊
2025-12-25 09:55:04
天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

美食店主
2025-12-22 00:27:55
科爾:我們已不再是那支統(tǒng)治聯(lián)盟的勇士 而是正在走下坡路的王朝

科爾:我們已不再是那支統(tǒng)治聯(lián)盟的勇士 而是正在走下坡路的王朝

北青網(wǎng)-北京青年報(bào)
2025-12-25 08:39:07
女子扇醫(yī)生后續(xù):為5分鐘行拘5天,漂亮長(zhǎng)相已社死,曝更多正臉照

女子扇醫(yī)生后續(xù):為5分鐘行拘5天,漂亮長(zhǎng)相已社死,曝更多正臉照

李博世財(cái)經(jīng)
2025-12-25 16:57:50
洪都拉斯總統(tǒng)大選勝利者曾說要恢復(fù)與臺(tái)灣“邦交”,外交部回應(yīng)

洪都拉斯總統(tǒng)大選勝利者曾說要恢復(fù)與臺(tái)灣“邦交”,外交部回應(yīng)

澎湃新聞
2025-12-25 15:22:26
大量游戲廳街機(jī)流入閑魚!32寸大屏+雙搖桿,二手350塊

大量游戲廳街機(jī)流入閑魚!32寸大屏+雙搖桿,二手350塊

金科技觀察家
2025-12-25 18:22:34
千萬(wàn)不要在網(wǎng)上買“這4樣”東西,水太深,看完就知道后怕了!

千萬(wàn)不要在網(wǎng)上買“這4樣”東西,水太深,看完就知道后怕了!

卷史
2025-11-12 15:21:08
6250萬(wàn)歐!德國(guó)神鋒身價(jià)漲幅全歐第2 今夏加盟紐卡是最明智選擇

6250萬(wàn)歐!德國(guó)神鋒身價(jià)漲幅全歐第2 今夏加盟紐卡是最明智選擇

雪狼侃體育
2025-12-25 10:39:05
高市放言提升持久戰(zhàn)能力,要再跟東大打一場(chǎng)?認(rèn)不清局面下場(chǎng)很慘

高市放言提升持久戰(zhàn)能力,要再跟東大打一場(chǎng)?認(rèn)不清局面下場(chǎng)很慘

阿龍聊軍事
2025-12-25 11:39:47
曾對(duì)世界放狠話,誰(shuí)敢動(dòng)中國(guó)就滅誰(shuí)!4年后卻把槍口對(duì)準(zhǔn)我們

曾對(duì)世界放狠話,誰(shuí)敢動(dòng)中國(guó)就滅誰(shuí)!4年后卻把槍口對(duì)準(zhǔn)我們

老踝是個(gè)手藝人
2025-12-24 21:52:39
直接起飛!中國(guó)男籃決戰(zhàn)日本隊(duì),收兩大喜訊,郭士強(qiáng)要打爆小日子

直接起飛!中國(guó)男籃決戰(zhàn)日本隊(duì),收兩大喜訊,郭士強(qiáng)要打爆小日子

宗介說體育
2025-12-25 15:51:59
“南京義烏商品城”2026年1月1日起更名為“江寧大學(xué)城商業(yè)廣場(chǎng)”

“南京義烏商品城”2026年1月1日起更名為“江寧大學(xué)城商業(yè)廣場(chǎng)”

現(xiàn)代快報(bào)
2025-12-25 20:38:39
一旦戰(zhàn)爭(zhēng)爆發(fā),日本專家曾言:日軍將對(duì)中國(guó)軍艦發(fā)起“三重打擊”

一旦戰(zhàn)爭(zhēng)爆發(fā),日本專家曾言:日軍將對(duì)中國(guó)軍艦發(fā)起“三重打擊”

蜉蝣說
2025-10-05 23:54:17
去上海才發(fā)現(xiàn):包包沒人背LV、Chanel!滿街都是這3大品牌,特潮

去上海才發(fā)現(xiàn):包包沒人背LV、Chanel!滿街都是這3大品牌,特潮

白宸侃片
2025-12-22 12:15:24
2025最慘大撤退:18萬(wàn)家快遞驛站,快把所有人得罪光了

2025最慘大撤退:18萬(wàn)家快遞驛站,快把所有人得罪光了

金錯(cuò)刀
2025-12-14 15:34:35
秦嵐的“蜜桃臀”又上熱搜了!網(wǎng)友:“臀”確實(shí)美

秦嵐的“蜜桃臀”又上熱搜了!網(wǎng)友:“臀”確實(shí)美

馬拉松跑步健身
2025-12-25 06:30:05
柬埔寨士兵吃著糟糕的食物,豪富的洪家卻不愿給他們稍微吃好點(diǎn)

柬埔寨士兵吃著糟糕的食物,豪富的洪家卻不愿給他們稍微吃好點(diǎn)

老馬拉車莫少裝
2025-12-16 03:01:51
2025-12-26 05:23:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14182文章數(shù) 66397關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報(bào)復(fù)

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報(bào)復(fù)

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財(cái)經(jīng)要聞

新規(guī)來(lái)了,年化超24%的小貸被即刻叫停

汽車要聞

速來(lái)!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

本地
教育
手機(jī)
健康
公開課

本地新聞

這輩子要積多少德,下輩子才能投胎到德國(guó)當(dāng)狗

教育要聞

突發(fā)!外語(yǔ)類保送政策巨變,南外還有優(yōu)勢(shì)嗎?

手機(jī)要聞

行業(yè)唯一徠卡2億像素連續(xù)光變長(zhǎng)焦!小米17 Ultra星空綠圖賞

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版