国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌翻譯藏了8年的秘密:模型怎么知道"說完了"?

0
分享至


2016年,谷歌翻譯突然從"逐詞替換"變成能讀完整句再輸出。當(dāng)時(shí)沒人解釋清楚:機(jī)器生成句子時(shí),怎么判斷該在哪停下?

這個(gè)細(xì)節(jié)被埋在技術(shù)文檔里整整8年,直到最近一批工程師復(fù)盤Seq2Seq架構(gòu)時(shí)才被重新翻出來。答案藏在三個(gè)字母里:EOS。

EOS不是標(biāo)點(diǎn),是模型的"剎車踏板"

訓(xùn)練好的解碼器(Decoder)本質(zhì)上是個(gè)貪婪的單詞預(yù)測機(jī)器。給它一個(gè)起始信號,它會不斷吐詞,直到——遇到那個(gè)預(yù)設(shè)的終止符。

具體流程像流水線:編碼器(Encoder)先把"let's go"壓成一個(gè)上下文向量(Context Vector),這個(gè)向量初始化解碼器的兩層長短期記憶網(wǎng)絡(luò)(LSTM,一種能記住長距離依賴的循環(huán)神經(jīng)網(wǎng)絡(luò))。解碼器第一步吃進(jìn)一個(gè)特殊標(biāo)記EOS(End of Sequence,序列結(jié)束符),輸出"Vamos";第二步把"Vamos"塞回輸入端,預(yù)測下一個(gè)詞——又是EOS。

兩次EOS之間的所有輸出,就是最終翻譯結(jié)果。

這里有個(gè)反直覺的設(shè)計(jì):EOS既是解碼器的"啟動鑰匙",又是"剎車信號"。訓(xùn)練時(shí)它告訴模型"從這里開始生成";推理時(shí)它告訴模型"到這里可以結(jié)束了"。同一個(gè)標(biāo)記承擔(dān)兩種完全相反的功能,卻從不混淆,因?yàn)槲恢脹Q定了它的身份。

原文作者用了一個(gè)精妙的類比:這就像你給朋友發(fā)語音,先說"我開始說了"作為開頭標(biāo)記,最后說"我說完了"作為結(jié)束標(biāo)記。機(jī)器需要明確的邊界,否則會在無限循環(huán)里耗盡算力。


Teacher Forcing:訓(xùn)練時(shí)的"作弊碼"

推理階段用預(yù)測值喂給下一步輸入,但訓(xùn)練階段完全不同。工程師們搞了個(gè)叫"教師強(qiáng)制"(Teacher Forcing)的技巧:不管模型上一步預(yù)測出什么,都強(qiáng)行塞進(jìn)正確答案。

比如目標(biāo)句子是"Vamos EOS",即使模型第一步預(yù)測成了"Hola",第二步的輸入仍然是正確的"Vamos",而不是它自己猜錯(cuò)的詞。這相當(dāng)于給模型開卷考試,讓它先學(xué)會"正確的上下文長什么樣",再慢慢學(xué)會自己走路。

這種設(shè)計(jì)有個(gè)副作用:訓(xùn)練和推理的輸入分布不一致。模型在訓(xùn)練時(shí)從沒見過自己的錯(cuò)誤預(yù)測,到了真實(shí)場景可能懵圈。2015年的原始論文已經(jīng)注意到這個(gè)問題,但直到2019年才有系統(tǒng)性的緩解方案——這又是另一個(gè)故事了。

那個(gè)被硬編碼的"最大長度"

原文提到一句容易被忽略的話:"預(yù)測到EOS,或達(dá)到某個(gè)最大輸出長度"。這個(gè)"或"字背后,是無數(shù)線上事故的源頭。

早期系統(tǒng)把最大長度設(shè)得偏保守,長句被硬生生截?cái)?;后來放寬限制,又出現(xiàn)過模型陷入循環(huán)、瘋狂重復(fù)同一個(gè)短語的情況。2017年谷歌內(nèi)部有個(gè)著名案例:某次模型更新后,西班牙語譯文的平均長度突然暴漲40%,追查發(fā)現(xiàn)是新版本對EOS的置信度閾值調(diào)得太激進(jìn),模型寧可無限生成也不說結(jié)束。

現(xiàn)在的做法通常是雙重保險(xiǎn):EOS預(yù)測概率超過閾值就停,同時(shí)設(shè)置絕對長度上限。兩個(gè)條件滿足任意一個(gè),強(qiáng)制終止。這種"軟剎車+硬剎車"的組合,成了工業(yè)界的事實(shí)標(biāo)準(zhǔn)。


但閾值設(shè)多少?上限定多長?不同語言差異極大。日語敬語系統(tǒng)復(fù)雜,同樣意思的句子可能比英語長3倍;中文信息密度高,同樣內(nèi)容可能只有英語60%長度。這些細(xì)節(jié)不會出現(xiàn)在論文里,是工程團(tuán)隊(duì)用A/B測試一寸一寸試出來的。

從Seq2Seq到注意力:EOS的謝幕演出

原文結(jié)尾預(yù)告了下一篇主題:注意力機(jī)制(Attention Mechanism)。這幾乎是Seq2Seq架構(gòu)的臨終遺言。

2017年Transformer論文發(fā)表后,固定的上下文向量被動態(tài)注意力權(quán)重取代,LSTM層被多頭自注意力替代,但EOS標(biāo)記保留了下來。即使在GPT-4里,你依然能在詞表深處找到它——只不過現(xiàn)在它叫`<|endoftext|>`,或者Claude里的`<|assistant|>`。

標(biāo)記的形式變了,功能沒變:告訴模型,生成到此為止。

有個(gè)細(xì)節(jié)很少被討論:現(xiàn)代大模型的"停止"遠(yuǎn)比當(dāng)年復(fù)雜。除了顯式的結(jié)束標(biāo)記,還有隱式的模式匹配(比如檢測到重復(fù)的句子結(jié)構(gòu))、實(shí)時(shí)的困惑度(Perplexity)監(jiān)控、甚至外部工具調(diào)用的中斷信號。EOS從唯一的剎車踏板,變成了多層安全系統(tǒng)中的一個(gè)開關(guān)。

但回到2014年,當(dāng)Ilya Sutskever在論文里第一次寫下那個(gè)簡單的循環(huán)條件時(shí),他可能沒想到這個(gè)設(shè)計(jì)會延續(xù)十年,成為所有生成式AI的底層共識。

下次你用ChatGPT時(shí),可以留意它的輸出是怎么結(jié)束的——是突然截?cái)?,還是自然收尾?那個(gè)看不見的EOS,正在以毫秒級的速度被計(jì)算、被比較、被觸發(fā)。而你讀到的每一個(gè)完整句子,都是它成功工作的證明。

如果模型突然在某個(gè)奇怪的位置停下,比如一句話說到一半就結(jié)束,你猜是EOS閾值設(shè)得太敏感,還是它其實(shí)想繼續(xù)但撞上了長度上限?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
馬刺大勝送灰熊出局,本賽季常規(guī)賽西部前十球隊(duì)已全部出爐

馬刺大勝送灰熊出局,本賽季常規(guī)賽西部前十球隊(duì)已全部出爐

懂球帝
2026-03-26 12:27:11
押注中國!迪拜資本大轉(zhuǎn)移,數(shù)千億真金白銀連夜搬家到東方

押注中國!迪拜資本大轉(zhuǎn)移,數(shù)千億真金白銀連夜搬家到東方

小舟談歷史
2026-03-25 06:28:02
臺退將提出要求:臺灣可以和平回歸,但大陸必須要答應(yīng)2個(gè)條件!

臺退將提出要求:臺灣可以和平回歸,但大陸必須要答應(yīng)2個(gè)條件!

百態(tài)中的情感起伏
2026-02-16 01:27:29
做人一定不要像張雪峰

做人一定不要像張雪峰

羅sir財(cái)話
2026-03-24 21:59:56
東北超長春主帥:大連很強(qiáng)?我可以不客氣地說,我們是最好的

東北超長春主帥:大連很強(qiáng)?我可以不客氣地說,我們是最好的

懂球帝
2026-03-26 14:13:09
唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營養(yǎng)正當(dāng)時(shí),好吃

唯一不含草酸的蔬菜!比薺菜、韭菜還鮮嫩,鮮嫩營養(yǎng)正當(dāng)時(shí),好吃

阿龍美食記
2026-03-24 09:50:48
烏克蘭摧毀俄羅斯最大的基里希煉油廠!俄最大港口持續(xù)燃燒

烏克蘭摧毀俄羅斯最大的基里希煉油廠!俄最大港口持續(xù)燃燒

項(xiàng)鵬飛
2026-03-26 21:13:57
陜西關(guān)中行政區(qū)劃調(diào)整的構(gòu)想

陜西關(guān)中行政區(qū)劃調(diào)整的構(gòu)想

普陀動物世界
2026-03-26 12:44:53
張雪峰妻子李麗婧的相關(guān)消息引發(fā)關(guān)注

張雪峰妻子李麗婧的相關(guān)消息引發(fā)關(guān)注

靜水流深003
2026-03-26 12:19:49
運(yùn)勢封神!3.30-4.5三大星座事業(yè)翻身,之前沒白熬,接好運(yùn)

運(yùn)勢封神!3.30-4.5三大星座事業(yè)翻身,之前沒白熬,接好運(yùn)

別人都叫我阿螫
2026-03-25 14:34:30
原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

原油飆漲!黃金、白銀下跌,美股突變!特朗普威脅!霍爾木茲海峽,最新消息!

證券時(shí)報(bào)e公司
2026-03-26 22:23:23
真正的雙贏!兩大全明星一換一,一人完美融入,另一人則重獲新生

真正的雙贏!兩大全明星一換一,一人完美融入,另一人則重獲新生

大衛(wèi)的籃球故事
2026-03-25 21:47:25
為什么中國不軍事援助伊朗?看完發(fā)現(xiàn),印度三哥才是最牛逼的

為什么中國不軍事援助伊朗?看完發(fā)現(xiàn),印度三哥才是最牛逼的

番外行
2026-03-14 08:55:36
歐股、美股期貨全線下挫,美股芯片股、中概股盤前普跌,阿里巴巴跌超3%,原油拉升漲超3%

歐股、美股期貨全線下挫,美股芯片股、中概股盤前普跌,阿里巴巴跌超3%,原油拉升漲超3%

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-26 19:46:02
3月26日俄烏:烏克蘭的猛烈回?fù)?>
    </a>
        <h3>
      <a href=山河路口
2026-03-26 17:32:00
核圈失守!以色列防空神話被擊穿,伊朗打擊圈沖出中東近4000公里,美以伊三方棋局徹底亂了!

核圈失守!以色列防空神話被擊穿,伊朗打擊圈沖出中東近4000公里,美以伊三方棋局徹底亂了!

國是直通車
2026-03-22 16:00:02
全是智商稅!這5個(gè)被吹爆的“網(wǎng)紅產(chǎn)物”,誰買誰后悔

全是智商稅!這5個(gè)被吹爆的“網(wǎng)紅產(chǎn)物”,誰買誰后悔

家居設(shè)計(jì)師蘇哥
2026-03-24 13:47:31
知名歌手公開玩性感美女大作!網(wǎng)友賭他"最多十分鐘"

知名歌手公開玩性感美女大作!網(wǎng)友賭他"最多十分鐘"

游民星空
2026-03-26 17:09:32
特朗普希望破滅了,但是福特號航母上4500名美軍士兵卻徹底安全了

特朗普希望破滅了,但是福特號航母上4500名美軍士兵卻徹底安全了

安安說
2026-03-26 11:41:14
最近全網(wǎng)都在夸陳若琳長得好看,我真的想說:別光看臉啊

最近全網(wǎng)都在夸陳若琳長得好看,我真的想說:別光看臉啊

小光侃娛樂
2026-03-26 06:55:03
2026-03-26 23:32:49
爬蟲飼養(yǎng)員
爬蟲飼養(yǎng)員
業(yè)余養(yǎng)了只叫“龍蝦”的AI爬蟲,主業(yè)是給互聯(lián)網(wǎng)打工。
158文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價(jià)"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
手機(jī)
藝術(shù)
數(shù)碼
公開課

教育要聞

罵人沒有殺傷力?那不是白忙活嗎?

手機(jī)要聞

OPPO K15 Pro 系列定檔,嵐影呼吸燈搭配金屬中框

藝術(shù)要聞

哪一座橋不是風(fēng)景?

數(shù)碼要聞

Intel IBOT加速技術(shù)揭秘!硬件不變 白嫖22%游戲性能

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版