国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

NHB重磅:人類語言結構并非天生,而是為了“省腦子”?

0
分享至

PsyBrain 腦心前沿 | 公眾號 PSY-Brain_Frontier

一鍵關注,點亮星標 ??

不錯過每日前沿資訊

認知神經(jīng)科學前沿文獻分享


基本信息

Title:Linguistic structure from a bottleneck on sequential information processing

發(fā)表時間:2025.11.24

發(fā)表期刊:Nature Human Behaviour

影響因子:16.0

獲取原文:

  1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

人類語言展現(xiàn)出一種令人著迷的“系統(tǒng)性”“局部性”。當我們描述一個 “藍色的正方形” 時,我們會使用代表顏色的詞 “藍色” 和代表形狀的詞 “正方形” 并將它們拼接在一起。

這種結構看似天經(jīng)地義,但在邏輯上并非唯一。理論上,我們完全可以像哈夫曼編碼那樣,用一個無法拆分的整體符號(如 “Vek”)來表示 “藍色的正方形”,或者用一種非線性的方式交錯排列音素 。


Fig. 1 | Example utterances describing an image in English and various hypothetical languages.

為什么人類語言偏偏演化成了現(xiàn)在這種由離散符號組成、且結構與意義高度對應的形式?長期以來,語言學界傾向于引入特定的心理表征假設或先天的語法模塊來解釋這一現(xiàn)象,但這往往陷入“因為有語法模塊,所以有語法結構”的循環(huán)論證,且難以解釋為何語言必須具備“局部性”(即相關的詞往往靠得很近)。

如果我們拋開復雜的語言學假設,僅從信息處理的最基本限制出發(fā),即人類是在時間維度上處理序列信號,且認知資源(特別是用于預測未來的記憶資源)是有限的,能否推導出語言的結構規(guī)律?

近日,來自加州大學歐文分校和薩爾蘭大學的研究團隊在 Nature Human Behaviour 上發(fā)表重磅研究,提出語言的結構并非源于特殊的語法基因,而是為了適應大腦在序列信息處理中的“瓶頸”


Fig. 2 | Two examples of linguistic systematicity as a homomorphism.


研究核心總結

本研究的核心假設基于信息論中的一個關鍵指標:預測信息(Predictive Information, 或 Excess Entropy, E)。它定義為隨機過程中,“過去”的信息與“未來”的信息之間的互信息(Mutual Information),即:


這就代表了大腦為了準確預測即將出現(xiàn)的語言符號,必須在記憶中維持的信息量。研究者認為,人類語言的結構演化遵循最小化預測信息的原則,以適應認知系統(tǒng)的存儲瓶頸。


Fig. 3 | Schematic calculation of predictive information as the sum of n-gram entropies hn minus the asymptotic entropy rate h.

  1. 系統(tǒng)性與整體性的自發(fā)涌現(xiàn)

通過模擬實驗,研究者發(fā)現(xiàn),當強制要求編碼系統(tǒng)最小化預測信息時,系統(tǒng)會自動演化出類似人類自然語言的結構特性。

  • 對于相互獨立的語義特征(如“貓”和“狗”作為獨立實體),最優(yōu)編碼是系統(tǒng)性(Systematic)的,即將其拆分為獨立的詞匯并拼接;

  • 對于高度相關的語義特征(如“貓的頭部”和“貓的身體”總是同時出現(xiàn)),最優(yōu)編碼則是整體性(Holistic)的,即將其融合為一個不可拆分的語素(Morpheme),如單詞 "cat" 本身不再包含對應頭部或身體的部件 。這解釋了為何語言在詞匯層面是任意且整體的,而在短語和句子層面是系統(tǒng)且組合的。


Fig. 4 | Simulations of languages for coin-flip distributions.

  1. “Behaghel定律”的信息論本質

語言學著名的Behaghel定律指出“在心理上緊密相關的元素在物理上也靠得近”。研究表明,這一現(xiàn)象是最小化預測信息的數(shù)學必然結果。當編碼系統(tǒng)將統(tǒng)計上相互依賴(高互信息)的元素放置在鄰近位置(即保持局部性)時,預測所需的記憶負荷(E)最低


Fig. 5 | Simulations of codes with different orders of elements.

  1. 跨語言實證證據(jù)

研究者利用大規(guī)模多語言語料庫(涵蓋英語、匈牙利語、土耳其語等61種語言),在音系(Phonotactics)、形態(tài)學(Morphology)和句法(Syntax)三個層面上計算了真實語言的預測信息。


Fig. 6 | Evidence that natural languages are configured in a way that reduces predictive information, in phonotactics, morphology and syntax.

結果顯示,與打亂結構、破壞局部性或非自然的基線模型相比,真實的人類語言均表現(xiàn)出顯著更低的預測信息。例如,在名詞短語的詞序上,跨語言中最常見的詞序(如 D-N-A-n 或 n-A-N-D)恰恰是那些計算出的預測信息最低的排序 。


Fig. 7 | Examples of systematic morphology and syntax, and baselines used in experiments.


Fig. 8 | Evidence that word order and lexical semantics are configured in ways that reduce predictive information.

總的來看,該研究建立了一個強有力的理論框架,將語言的代數(shù)結構(句法樹、成分組合)與統(tǒng)計學習機制(信息壓縮、序列預測)統(tǒng)一起來。它揭示了語言之所以呈現(xiàn)出層次化和組合性,是因為這種結構是對大腦有限的序列預測能力的最優(yōu)解 。這不僅挑戰(zhàn)了生成語法關于先天語言模塊的必要性假設,也為理解大語言模型(LLMs)為何能通過簡單的“下一個token預測”任務習得復雜的語言結構提供了理論解釋:因為人類語言本身就是為了易于序列預測而被優(yōu)化的。


Abstract

Human language has a distinct systematic structure, where utterances break into individually meaningful words that are combined to form phrases. Here we show that natural-language-like systematicity arises in codes that are constrained by a statistical measure of complexity called predictive information, also known as excess entropy. Predictive information is the mutual information between the past and future of a stochastic process. In simulations, we find that codes that minimize predictive information break messages into groups of approximately independent features that are expressed systematically and locally, corresponding to words and phrases. Next, drawing on cross-linguistic text corpora, we find that actual human languages are structured in a way that yields low predictive information compared with baselines at the levels of phonology, morphology, syntax and lexical semantics. Our results establish a link between the statistical and algebraic structure of language and reinforce the idea that these structures are shaped by communication under general cognitive constraints.

前沿交流|歡迎加入認知神經(jīng)科學前沿交流群!


核心圖表、方法細節(jié)、統(tǒng)計結果與討論見原文及其拓展數(shù)據(jù)。

分享人:飯哥

審核:PsyBrain 腦心前沿編輯部

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
SK海力士拒絕按要求供貨!微軟高管憤怒離席!谷歌采購主管被解雇

SK海力士拒絕按要求供貨!微軟高管憤怒離席!谷歌采購主管被解雇

芯智訊
2025-12-26 10:01:07
衛(wèi)冕冠軍3-1!陳幸同遭爆冷,王曼昱獨得2分,決賽對陣+時間如下

衛(wèi)冕冠軍3-1!陳幸同遭爆冷,王曼昱獨得2分,決賽對陣+時間如下

大秦壁虎白話體育
2025-12-26 21:56:20
曾是“央視名嘴”,因揭露姜昆丑聞被封殺,如今70歲處境如何?

曾是“央視名嘴”,因揭露姜昆丑聞被封殺,如今70歲處境如何?

小熊侃史
2025-12-15 10:51:25
巴薩虧大發(fā)了,瓜迪奧拉撿漏!曼城買來新羅德里,波爾圖:我開心

巴薩虧大發(fā)了,瓜迪奧拉撿漏!曼城買來新羅德里,波爾圖:我開心

萬花筒體育球球
2025-12-26 22:30:08
為什么我要祝你圣誕快樂?

為什么我要祝你圣誕快樂?

寰宇大觀察
2025-12-25 14:08:05
《老舅》直到親姐爬上張秘書的床,崔國明才知,李小珍對他有隱瞞

《老舅》直到親姐爬上張秘書的床,崔國明才知,李小珍對他有隱瞞

娛樂傾城巷
2025-12-22 16:13:41
新疆男籃又輸了,輸給北京!沒有想到賽后采訪趙睿會這么說

新疆男籃又輸了,輸給北京!沒有想到賽后采訪趙睿會這么說

林子說事
2025-12-27 00:00:05
祝賀!廣西大學2024級博士研究生

祝賀!廣西大學2024級博士研究生

植物研究進展
2025-12-26 22:51:07
李明主持方昊婚禮:結婚前我們在足協(xié)杯奪冠,這是雙喜臨門

李明主持方昊婚禮:結婚前我們在足協(xié)杯奪冠,這是雙喜臨門

懂球帝
2025-12-26 11:35:07
美媒報道:2008年跳樓自殺的頂級模特魯斯拉娜,的確是蘿莉島女孩

美媒報道:2008年跳樓自殺的頂級模特魯斯拉娜,的確是蘿莉島女孩

老范談史
2025-12-24 17:24:57
重磅!你好,小波特!3換1交易方案...

重磅!你好,小波特!3換1交易方案...

技巧君侃球
2025-12-26 23:53:09
釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關系

釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關系

漢史趣聞
2025-07-30 09:57:38
中字頭工程局的員工鬧翻天了!

中字頭工程局的員工鬧翻天了!

黯泉
2025-12-26 22:21:25
71歲老人的睿智養(yǎng)老:不請保姆不去養(yǎng)老院,三個兒子都搶著來照顧

71歲老人的睿智養(yǎng)老:不請保姆不去養(yǎng)老院,三個兒子都搶著來照顧

人間百態(tài)大全
2025-12-20 06:50:03
劉強東拿下理想汽車,震驚行業(yè)!

劉強東拿下理想汽車,震驚行業(yè)!

財經(jīng)三分鐘pro
2025-12-25 11:43:53
難怪許亞軍不去葬禮,何晴閨蜜曝許何離家原因 后媽的沉默早有預兆

難怪許亞軍不去葬禮,何晴閨蜜曝許何離家原因 后媽的沉默早有預兆

老吳教育課堂
2025-12-27 07:22:06
蔣毅圣誕夜向趙櫻子求婚,5天前還硬核拒愛,還是圓夢

蔣毅圣誕夜向趙櫻子求婚,5天前還硬核拒愛,還是圓夢

章眽八卦
2025-12-26 11:00:46
兩粒點球!世界第11翻車,丟掉2分,恩-內(nèi)斯里錯失絕殺

兩粒點球!世界第11翻車,丟掉2分,恩-內(nèi)斯里錯失絕殺

足球狗說
2025-12-27 06:03:44
廣東力克山東!聽聽各界媒體專家怎么說,徐杰比外援還強!

廣東力克山東!聽聽各界媒體專家怎么說,徐杰比外援還強!

郭夷包工頭
2025-12-26 21:59:15
又讓張召忠說中了?東拼西湊550億建的2艘航母,如今徹底成為累贅

又讓張召忠說中了?東拼西湊550億建的2艘航母,如今徹底成為累贅

泠泠說史
2025-12-24 17:42:56
2025-12-27 09:07:00
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學新動態(tài),聚焦認知與神經(jīng)新研究
79文章數(shù) 6關注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

美媒自問自答 稱特朗普的"黃金艦隊"難匹敵中國海軍

頭條要聞

美媒自問自答 稱特朗普的"黃金艦隊"難匹敵中國海軍

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

本地
旅游
數(shù)碼
藝術
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

旅游要聞

這份來自水杉林的紅色浪漫,請查收→

數(shù)碼要聞

創(chuàng)新Aurvana ACE SXFI藍牙耳機國行首銷,599元

藝術要聞

盧中南老師字帖引發(fā)書法學習新討論

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版