国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

中文在人工智能時代的優(yōu)勢,東方衛(wèi)視《這就是中國》

0
分享至

本文是根據(jù)3月10日晚上22點東方衛(wèi)視播出的《這就是中國》節(jié)目中我的演講稿增補改編

首先來講一下最近國外流行的中式英語熱。

英語現(xiàn)在的造詞方式,事實上與中國4千年前的漢字發(fā)展過程有些類似,就是每遇到一個新事物,就造一個新詞。因為類似英語的字母文字造一個新詞的確是比象形文字造一個新字要容易很多,這也導致了英語詞匯量過快的增長,每年都會增加幾百個新詞。但現(xiàn)在很多人發(fā)現(xiàn)中文用新詞組來表達新事物的方法非常有效,所以開始用中式英語來極大簡化英文。大家也很容易聽懂。例如:

wash wash to sleep 洗洗睡吧

You think beautiful 你想得美

No zuo no die 不作不死

You can you up 你行你上

想起二十年前在做國際市場時,就與國際市場人員調侃很多不太會說英文的中國發(fā)明出來的中式英語段子。如出了一個車禍,中國司機要給警察報警:

One car come,one car go,two car peng peng, one car die 一輛車往這里來,一輛車往那里去,兩輛車砰砰,一輛車壞了。

這些都只是太過直接的極簡中式英語。但還有一些真是準備改革英文的基礎邏輯,把英語的時態(tài)、語法都準備干掉了。例如英語的數(shù)字,從0到12都是專門的單詞,13到19有一定規(guī)律,但也是特定的規(guī)律。中式英語是要革命式地變化:

Tenone 十一

Tentwo 十二

Tennine 十九

不用再去背eleven,twelve......fifteen,nineteen

Week one 星期一

Week two 星期二

Week seven 星期七

不用再去背Monday,Tuesday,...Sunday,這多好。

one month 一月

two month 二月

tentwo month 十二月

不用再去背January,F(xiàn)ebruary...... December,多簡單。

這樣英文單詞不僅不用再新增,反而可能極大縮減。

英語的時態(tài)也逐步被拋諸腦后。例如:

我2019年去了倫敦。我剛去倫敦。用傳統(tǒng)英語翻譯是這樣:

I went to London in 2019.

I just went to London.

用中式英語是這樣:

I go London 2019.

I just go London.

看了以上這些,就很容易理解下面談到的為什么中文在人工智能時代有技術優(yōu)勢了。

DeepSeek之所以爆火,主要并不是它技術性能上獲得了突破性的進展,而是其效率獲得了數(shù)量級的提升,從而使實現(xiàn)相同性能的成本下降了20倍。之所以如此,是因為研發(fā)團隊幾乎是將各種可能的提升效率的技術都充分挖掘了。例如,更多采用底層編程語言PTX,一般來說越是更底層的編程語言效率越高,但編程的難度越大。另外還有適當?shù)亟档途?,采用一個字節(jié)的8比特浮點運算,而不是32比特,從而成倍減少存儲量和運算量。這個專業(yè)術語叫“量化”。采用蒸餾方法極大減少參數(shù)。另外還有混合專家架構(專業(yè)術語叫MoE)、多頭潛在注意力技術(專業(yè)術語叫MLA)。這些技術本身并不是說完全由DeepSeek獨創(chuàng)的,原來在美國人工智能界的專業(yè)人員都知道,但為什么是DeepSeek把這些充分利用了呢?這里面涉及到兩國信息技術發(fā)展中的一些文化問題,有降成本的因素而盡量采用高級語言,關注研發(fā)的降成本而不是運算芯片的降成本;另一個問題甚至是運算芯片的核心廠商故意引導軟件運算效率低下的商業(yè)模式,以便形成更高性能芯片更大的市場需求。

以上這些相對比較專業(yè)的內容,對普通觀眾可能理解起來比較困難,所以我們今天就談一個大家比較容易理解的、也非常有意思的方面:就是中文在人工智能時代的技術優(yōu)勢。DeepSeek充分利用了中文的這種優(yōu)勢,所以在它爆火之后很多人開始注意到這個問題。

如果我們回顧一下兩百多年來的歷史,我們對于中文在現(xiàn)代科技中的作用,是經歷了一個從最初很自負、到自卑、然后重新開始自信的認知轉變過程。

在中國古代,我們對自己的文化是很自負的,對中國周邊在文化上是壓倒性的優(yōu)勢,其他地區(qū)對中國是非常仰慕的心態(tài)。近代中國落后,尤其是甲午戰(zhàn)爭中國失敗以后,導致很多中國知識階層開始反思中國的文化,包括自己的語言文字。這種反思很快發(fā)展到極端,甚至認為漢語文字阻礙了中國進入現(xiàn)代科技文明。也有人認為中國應當放棄中文的象形文字,改成拼音的字母文字。

隨著以電子計算機為代表的信息技術出現(xiàn)以后,中文在計算機鍵盤輸入上存在一定困難。計算機的鍵盤是來自英文打字機,所以,輸入英文當然是最簡單方便的。因此,曾經認為中文阻礙了中國進入現(xiàn)代科技文明的觀點和思潮,在信息技術時代又再次興起。但是,20世紀80年代,中國科技界在漢字輸入上做了大量的工作,在當時稱為“萬碼奔騰”,這些漢字輸入的工作在很大程度上降低了中文電腦輸入的困難。其中比較著名和主流的有五筆字型輸入法,也叫王碼,是王永明發(fā)明的。我個人也曾經在王碼電腦公司工作過。另一個常用的輸入法是拼音輸入法。雖然客觀上說,直到今天中文還是比英文等字母文字的鍵盤輸入稍微麻煩一點點。但這些中文輸入法在很大程度上有效解決了中文的計算機輸入問題。甚至在五筆字型輸入基礎上充分采用詞組輸入后,在輸入效率上還可以超過英文輸入。

到了人工智能時代,情況發(fā)生了很大逆轉,中文在技術上開始展現(xiàn)出很大的優(yōu)勢。在40多年前,我剛開始接觸到計算機人工智能的語音識別技術時,就知道中文在技術上有很大優(yōu)勢。這是當時業(yè)界就公認的一個看法,只是普通人可能關注不到這一點,當時語音識別技術也還沒成熟商用?,F(xiàn)在我們已經普遍使用人工智能語音識別功能了。中文的這種優(yōu)勢現(xiàn)在更加充分地體現(xiàn)在今天流行的大語言模型中。為什么中文在人工智能中存在技術優(yōu)勢,主要的原因有如下這些:

首先是漢字非常規(guī)整,或者說非常整齊。漢字無論是書寫還是發(fā)音,尺寸都是一樣的,非常整齊。這種規(guī)整對于計算機處理是非常方便的。比如要進行語音識別,中文每個字發(fā)音都是聲母加韻母,發(fā)音長度一樣。這樣的話就相對比較容易區(qū)分出一句話中每一個字的發(fā)音。而相比之下,英文一個單詞的長度從一個字母,到十幾個字母的都有,這樣字母文字每個單詞發(fā)音的長度都可能不一樣。英文中一個字母的單詞如a,意思是“一個”;還有i,就是一個字母i,意思是“我”。但象英文的“祝賀”是Congratulations,就有15個字母。我們可能會好奇,最長的英文單詞會有多少個字母?如果我們從網上去搜索,可能答案會不一樣。一些醫(yī)學或分子生物學領域的專業(yè)單詞可能會出現(xiàn)比較長的,有40多個甚至更多的字母。還有一個問題是,很多英文句字發(fā)音會有連讀的情況,這就更加難以區(qū)分出每個單詞。雖然現(xiàn)在這些問題在人工智能中解決了,但其技術難度都比中文要困難很多,需要更大的運算量。幾乎所有字母文字都存在這個問題。

第二個是漢字的信息密度一般比字母文字高。這個體現(xiàn)在很多方面,漢字是表意文字,內涵豐富,可以用詞組、成語等很少的漢字就能表達非常豐富的含義。尤其文言文信息密度更高。對于人工智能來說,最終體現(xiàn)的是相同含義的一段語言或文章,在計算機中需要多少存儲量和計算量。一般來說中文的存儲量和計算量都是最少的。如果我們對比一下書面相同內容的中文和英文或其他字母文字,中文一般都是頁數(shù)或幅面最少的。但我們要注意這個并不是說完全絕對的,因為英文也有人家的優(yōu)點,比如較為嚴謹,所以在比較嚴謹?shù)恼撐幕蚍晌臅?,有可能英文的信息密度與中文相差并不大。但是由于絕大多數(shù)情況下中文的信息密度的確是比較高的,所以在人工智能的訓練中,相同內容中文訓練的存儲量和計算量就會比較少。這是中文效率優(yōu)勢的一個體現(xiàn)。

第三個是穩(wěn)定性。漢字是相對比較穩(wěn)定的.我們今天所使用的漢字,與幾千年前的甲骨文大都非常接近。在2千多年前秦朝統(tǒng)一六國,并且統(tǒng)一文字之后,漢字基本上就很少再發(fā)生變化了。總的趨勢是生僻字使用得越來越少,對于新出現(xiàn)的事物,漢字是通過常用字去建立新的詞組來適應,并且這樣組成的詞組天然地會存在有規(guī)律分類的特性。例如機器的“機”字,可以組成拖拉機、播種機、飛機、紡紗機、發(fā)動機、蒸汽機、計算機......如此之多的機器,漢字都可以用“機”來形成詞組。漢字的穩(wěn)定性對人工智能帶來的好處是訓練的參數(shù)可以更少,有效的重復可以更多,準確性就更高。相比之下,英文每年都會增加大量新詞,常用單詞都可能發(fā)生變化?,F(xiàn)在的英國人閱讀400年前英國的作家莎士比亞的作品都已經很困難了。但中國人閱讀2千年前的作品依然很容易看懂。

當然,我們提到中文在人工智能時代的技術優(yōu)勢,并不是要把它過度拔高。只是從以上不同技術時代中文技術優(yōu)劣的變化過程中,希望我們能更客觀地看待中國的文化。在進入人工智能時代,我們更應該發(fā)揮中文的優(yōu)勢,使得中國在人工智能時代可以獲得更快的發(fā)展,并且有更好的經濟效益。

從我們對自己語言的態(tài)度變化中,我們可以獲得一些啟示:就是如何用科學的態(tài)度去看待自己的文化。中文有自己的特點,這些特點相對不同的技術要求,可能是有利有弊的。所謂利弊或優(yōu)劣勢,永遠是相對特定的要求來說的。我們不能說遇到某種劣勢,就簡單地去完全自我否定,也不能遇到優(yōu)勢,就自我膨脹??茖W的態(tài)度是,如果是劣勢,我們就想辦法通過技術改進去消除或至少減少這種劣勢。有了這種技術改進,可能劣勢就不再是劣勢或者已經變得無關緊要了;如果是優(yōu)勢呢,我們就要想辦法去充分地開發(fā)利用它。即使是優(yōu)勢,如果你不去充分地開發(fā)利用,它也不會自動地體現(xiàn)出來,或者體現(xiàn)得不夠充分。這是我今天的演講希望能表達的。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國民眾呼聲高漲:既然美國能活捉馬杜羅,大陸為何不抓賴清德?

中國民眾呼聲高漲:既然美國能活捉馬杜羅,大陸為何不抓賴清德?

博覽歷史
2026-01-04 18:50:59
腐乳再次被關注!研究發(fā)現(xiàn):糖尿病患者常吃腐乳,或出現(xiàn)4種變化

腐乳再次被關注!研究發(fā)現(xiàn):糖尿病患者常吃腐乳,或出現(xiàn)4種變化

搖感軍事
2026-01-03 21:16:50
張水華是業(yè)余跑者參加專業(yè)組就露餡?名記:她能打敗85%省隊選手

張水華是業(yè)余跑者參加專業(yè)組就露餡?名記:她能打敗85%省隊選手

楊華評論
2026-01-06 22:26:05
72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

深析古今
2025-12-08 12:29:36
H燈+初戀臉!這位業(yè)界'宅男女神'的起起落落,比漫畫還精彩!

H燈+初戀臉!這位業(yè)界'宅男女神'的起起落落,比漫畫還精彩!

素然追光
2026-01-06 02:41:31
太可怕!一鄭州女孩哭訴斷供經歷,高位購100萬的房子,損失70萬

太可怕!一鄭州女孩哭訴斷供經歷,高位購100萬的房子,損失70萬

火山詩話
2026-01-05 16:29:44
臺海和平新方案橫空出世了:拋棄 “一國兩制”的新模式行不行?

臺海和平新方案橫空出世了:拋棄 “一國兩制”的新模式行不行?

文史旺旺旺
2026-01-05 22:04:15
高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

紅豆講堂
2025-07-14 17:21:43
“沒見過這么離譜的”!深夜零下20℃,數(shù)百游客滯留!兩知名景區(qū)雙雙被擠爆,最新致歉→

“沒見過這么離譜的”!深夜零下20℃,數(shù)百游客滯留!兩知名景區(qū)雙雙被擠爆,最新致歉→

新民晚報
2026-01-04 14:29:18
“買不起羽絨服,還敢生5個孩子?”老師一句話,讓家長無地自容

“買不起羽絨服,還敢生5個孩子?”老師一句話,讓家長無地自容

妍妍教育日記
2026-01-06 10:18:39
上海出現(xiàn)“雷打雪”?氣象臺回應了!

上海出現(xiàn)“雷打雪”?氣象臺回應了!

看看新聞Knews
2026-01-06 22:21:09
薩爾布呂肯乒乓球俱樂部經理回應樊振東率隊奪冠

薩爾布呂肯乒乓球俱樂部經理回應樊振東率隊奪冠

北青網-北京青年報
2026-01-06 19:22:04
“時速高達185公里”,外媒:日本演員廣末涼子因“過失駕駛致人受傷”,被判罰款70萬日元

“時速高達185公里”,外媒:日本演員廣末涼子因“過失駕駛致人受傷”,被判罰款70萬日元

環(huán)球網資訊
2026-01-06 15:37:19
豈有此理!美特工粗暴對待委內瑞拉第一夫人,引發(fā)各國強烈憤慨!

豈有此理!美特工粗暴對待委內瑞拉第一夫人,引發(fā)各國強烈憤慨!

我心縱橫天地間
2026-01-06 18:57:07
U23亞洲杯:越南零封位居頭名,東道主少一人艱難絕殺

U23亞洲杯:越南零封位居頭名,東道主少一人艱難絕殺

小皷拍客在北漂
2026-01-07 02:29:29
29歲張玉寧當選國足新隊長!為國效力10年45場7球 18強賽破門落淚

29歲張玉寧當選國足新隊長!為國效力10年45場7球 18強賽破門落淚

我愛英超
2026-01-06 22:48:59
好萊塢著名影星喬治·克魯尼攜全家入籍法國,特朗普諷刺:他根本不是什么明星!之前兩人就公開“互懟”過

好萊塢著名影星喬治·克魯尼攜全家入籍法國,特朗普諷刺:他根本不是什么明星!之前兩人就公開“互懟”過

極目新聞
2026-01-05 10:25:17
馬杜羅被抓,絕對忠誠等于絕對不忠誠

馬杜羅被抓,絕對忠誠等于絕對不忠誠

小院之觀
2026-01-04 18:55:42
首次公布096戰(zhàn)略核潛艇參數(shù),太強大了

首次公布096戰(zhàn)略核潛艇參數(shù),太強大了

世家寶
2026-01-06 17:42:11
拜仁5-0完勝,26歲日本球星凌空斬,17歲新星2球1助,18歲新星1球1助

拜仁5-0完勝,26歲日本球星凌空斬,17歲新星2球1助,18歲新星1球1助

凌空倒鉤
2026-01-06 23:53:46
2026-01-07 04:36:49
純科學 incentive-icons
純科學
以純科學解決一切認知問題
180文章數(shù) 423關注度
往期回顧 全部

教育要聞

教育部:學籍系統(tǒng)煥新,幼兒園建學籍

頭條要聞

俄羅斯發(fā)表關于委內瑞拉局勢的聲明

頭條要聞

俄羅斯發(fā)表關于委內瑞拉局勢的聲明

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財經要聞

50萬億存款"洪流"將至 四大去向引關注

科技要聞

速看!黃仁勛萬字實錄:甩出"物理AI"王牌

汽車要聞

摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

房產
手機
健康
教育
軍事航空

房產要聞

爆發(fā)!三亞開年超千畝城更計劃曝光,香港城砸下100億!

手機要聞

曾助力華為拿下中國第一!Mate 80系列累計銷量沖刺150萬大關

這些新療法,讓化療不再那么痛苦

教育要聞

剛剛,0.5+3集團直升拋出三個“王炸”!

軍事要聞

美稱對“占領”委內瑞拉保留選擇權

無障礙瀏覽 進入關懷版