国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中文在人工智能時(shí)代的優(yōu)勢,東方衛(wèi)視《這就是中國》

0
分享至

本文是根據(jù)3月10日晚上22點(diǎn)東方衛(wèi)視播出的《這就是中國》節(jié)目中我的演講稿增補(bǔ)改編

首先來講一下最近國外流行的中式英語熱。

英語現(xiàn)在的造詞方式,事實(shí)上與中國4千年前的漢字發(fā)展過程有些類似,就是每遇到一個(gè)新事物,就造一個(gè)新詞。因?yàn)轭愃朴⒄Z的字母文字造一個(gè)新詞的確是比象形文字造一個(gè)新字要容易很多,這也導(dǎo)致了英語詞匯量過快的增長,每年都會增加幾百個(gè)新詞。但現(xiàn)在很多人發(fā)現(xiàn)中文用新詞組來表達(dá)新事物的方法非常有效,所以開始用中式英語來極大簡化英文。大家也很容易聽懂。例如:

wash wash to sleep 洗洗睡吧

You think beautiful 你想得美

No zuo no die 不作不死

You can you up 你行你上

想起二十年前在做國際市場時(shí),就與國際市場人員調(diào)侃很多不太會說英文的中國發(fā)明出來的中式英語段子。如出了一個(gè)車禍,中國司機(jī)要給警察報(bào)警:

One car come,one car go,two car peng peng, one car die 一輛車往這里來,一輛車往那里去,兩輛車砰砰,一輛車壞了。

這些都只是太過直接的極簡中式英語。但還有一些真是準(zhǔn)備改革英文的基礎(chǔ)邏輯,把英語的時(shí)態(tài)、語法都準(zhǔn)備干掉了。例如英語的數(shù)字,從0到12都是專門的單詞,13到19有一定規(guī)律,但也是特定的規(guī)律。中式英語是要革命式地變化:

Tenone 十一

Tentwo 十二

Tennine 十九

不用再去背eleven,twelve......fifteen,nineteen

Week one 星期一

Week two 星期二

Week seven 星期七

不用再去背Monday,Tuesday,...Sunday,這多好。

one month 一月

two month 二月

tentwo month 十二月

不用再去背January,F(xiàn)ebruary...... December,多簡單。

這樣英文單詞不僅不用再新增,反而可能極大縮減。

英語的時(shí)態(tài)也逐步被拋諸腦后。例如:

我2019年去了倫敦。我剛?cè)惗。用傳統(tǒng)英語翻譯是這樣:

I went to London in 2019.

I just went to London.

用中式英語是這樣:

I go London 2019.

I just go London.

看了以上這些,就很容易理解下面談到的為什么中文在人工智能時(shí)代有技術(shù)優(yōu)勢了。

DeepSeek之所以爆火,主要并不是它技術(shù)性能上獲得了突破性的進(jìn)展,而是其效率獲得了數(shù)量級的提升,從而使實(shí)現(xiàn)相同性能的成本下降了20倍。之所以如此,是因?yàn)檠邪l(fā)團(tuán)隊(duì)幾乎是將各種可能的提升效率的技術(shù)都充分挖掘了。例如,更多采用底層編程語言PTX,一般來說越是更底層的編程語言效率越高,但編程的難度越大。另外還有適當(dāng)?shù)亟档途龋捎靡粋(gè)字節(jié)的8比特浮點(diǎn)運(yùn)算,而不是32比特,從而成倍減少存儲量和運(yùn)算量。這個(gè)專業(yè)術(shù)語叫“量化”。采用蒸餾方法極大減少參數(shù)。另外還有混合專家架構(gòu)(專業(yè)術(shù)語叫MoE)、多頭潛在注意力技術(shù)(專業(yè)術(shù)語叫MLA)。這些技術(shù)本身并不是說完全由DeepSeek獨(dú)創(chuàng)的,原來在美國人工智能界的專業(yè)人員都知道,但為什么是DeepSeek把這些充分利用了呢?這里面涉及到兩國信息技術(shù)發(fā)展中的一些文化問題,有降成本的因素而盡量采用高級語言,關(guān)注研發(fā)的降成本而不是運(yùn)算芯片的降成本;另一個(gè)問題甚至是運(yùn)算芯片的核心廠商故意引導(dǎo)軟件運(yùn)算效率低下的商業(yè)模式,以便形成更高性能芯片更大的市場需求。

以上這些相對比較專業(yè)的內(nèi)容,對普通觀眾可能理解起來比較困難,所以我們今天就談一個(gè)大家比較容易理解的、也非常有意思的方面:就是中文在人工智能時(shí)代的技術(shù)優(yōu)勢。DeepSeek充分利用了中文的這種優(yōu)勢,所以在它爆火之后很多人開始注意到這個(gè)問題。

如果我們回顧一下兩百多年來的歷史,我們對于中文在現(xiàn)代科技中的作用,是經(jīng)歷了一個(gè)從最初很自負(fù)、到自卑、然后重新開始自信的認(rèn)知轉(zhuǎn)變過程。

在中國古代,我們對自己的文化是很自負(fù)的,對中國周邊在文化上是壓倒性的優(yōu)勢,其他地區(qū)對中國是非常仰慕的心態(tài)。近代中國落后,尤其是甲午戰(zhàn)爭中國失敗以后,導(dǎo)致很多中國知識階層開始反思中國的文化,包括自己的語言文字。這種反思很快發(fā)展到極端,甚至認(rèn)為漢語文字阻礙了中國進(jìn)入現(xiàn)代科技文明。也有人認(rèn)為中國應(yīng)當(dāng)放棄中文的象形文字,改成拼音的字母文字。

隨著以電子計(jì)算機(jī)為代表的信息技術(shù)出現(xiàn)以后,中文在計(jì)算機(jī)鍵盤輸入上存在一定困難。計(jì)算機(jī)的鍵盤是來自英文打字機(jī),所以,輸入英文當(dāng)然是最簡單方便的。因此,曾經(jīng)認(rèn)為中文阻礙了中國進(jìn)入現(xiàn)代科技文明的觀點(diǎn)和思潮,在信息技術(shù)時(shí)代又再次興起。但是,20世紀(jì)80年代,中國科技界在漢字輸入上做了大量的工作,在當(dāng)時(shí)稱為“萬碼奔騰”,這些漢字輸入的工作在很大程度上降低了中文電腦輸入的困難。其中比較著名和主流的有五筆字型輸入法,也叫王碼,是王永明發(fā)明的。我個(gè)人也曾經(jīng)在王碼電腦公司工作過。另一個(gè)常用的輸入法是拼音輸入法。雖然客觀上說,直到今天中文還是比英文等字母文字的鍵盤輸入稍微麻煩一點(diǎn)點(diǎn)。但這些中文輸入法在很大程度上有效解決了中文的計(jì)算機(jī)輸入問題。甚至在五筆字型輸入基礎(chǔ)上充分采用詞組輸入后,在輸入效率上還可以超過英文輸入。

到了人工智能時(shí)代,情況發(fā)生了很大逆轉(zhuǎn),中文在技術(shù)上開始展現(xiàn)出很大的優(yōu)勢。在40多年前,我剛開始接觸到計(jì)算機(jī)人工智能的語音識別技術(shù)時(shí),就知道中文在技術(shù)上有很大優(yōu)勢。這是當(dāng)時(shí)業(yè)界就公認(rèn)的一個(gè)看法,只是普通人可能關(guān)注不到這一點(diǎn),當(dāng)時(shí)語音識別技術(shù)也還沒成熟商用,F(xiàn)在我們已經(jīng)普遍使用人工智能語音識別功能了。中文的這種優(yōu)勢現(xiàn)在更加充分地體現(xiàn)在今天流行的大語言模型中。為什么中文在人工智能中存在技術(shù)優(yōu)勢,主要的原因有如下這些:

首先是漢字非常規(guī)整,或者說非常整齊。漢字無論是書寫還是發(fā)音,尺寸都是一樣的,非常整齊。這種規(guī)整對于計(jì)算機(jī)處理是非常方便的。比如要進(jìn)行語音識別,中文每個(gè)字發(fā)音都是聲母加韻母,發(fā)音長度一樣。這樣的話就相對比較容易區(qū)分出一句話中每一個(gè)字的發(fā)音。而相比之下,英文一個(gè)單詞的長度從一個(gè)字母,到十幾個(gè)字母的都有,這樣字母文字每個(gè)單詞發(fā)音的長度都可能不一樣。英文中一個(gè)字母的單詞如a,意思是“一個(gè)”;還有i,就是一個(gè)字母i,意思是“我”。但象英文的“祝賀”是Congratulations,就有15個(gè)字母。我們可能會好奇,最長的英文單詞會有多少個(gè)字母?如果我們從網(wǎng)上去搜索,可能答案會不一樣。一些醫(yī)學(xué)或分子生物學(xué)領(lǐng)域的專業(yè)單詞可能會出現(xiàn)比較長的,有40多個(gè)甚至更多的字母。還有一個(gè)問題是,很多英文句字發(fā)音會有連讀的情況,這就更加難以區(qū)分出每個(gè)單詞。雖然現(xiàn)在這些問題在人工智能中解決了,但其技術(shù)難度都比中文要困難很多,需要更大的運(yùn)算量。幾乎所有字母文字都存在這個(gè)問題。

第二個(gè)是漢字的信息密度一般比字母文字高。這個(gè)體現(xiàn)在很多方面,漢字是表意文字,內(nèi)涵豐富,可以用詞組、成語等很少的漢字就能表達(dá)非常豐富的含義。尤其文言文信息密度更高。對于人工智能來說,最終體現(xiàn)的是相同含義的一段語言或文章,在計(jì)算機(jī)中需要多少存儲量和計(jì)算量。一般來說中文的存儲量和計(jì)算量都是最少的。如果我們對比一下書面相同內(nèi)容的中文和英文或其他字母文字,中文一般都是頁數(shù)或幅面最少的。但我們要注意這個(gè)并不是說完全絕對的,因?yàn)橛⑽囊灿腥思业膬?yōu)點(diǎn),比如較為嚴(yán)謹(jǐn),所以在比較嚴(yán)謹(jǐn)?shù)恼撐幕蚍晌臅,有可能英文的信息密度與中文相差并不大。但是由于絕大多數(shù)情況下中文的信息密度的確是比較高的,所以在人工智能的訓(xùn)練中,相同內(nèi)容中文訓(xùn)練的存儲量和計(jì)算量就會比較少。這是中文效率優(yōu)勢的一個(gè)體現(xiàn)。

第三個(gè)是穩(wěn)定性。漢字是相對比較穩(wěn)定的.我們今天所使用的漢字,與幾千年前的甲骨文大都非常接近。在2千多年前秦朝統(tǒng)一六國,并且統(tǒng)一文字之后,漢字基本上就很少再發(fā)生變化了?偟内厔菔巧ё质褂玫迷絹碓缴伲瑢τ谛鲁霈F(xiàn)的事物,漢字是通過常用字去建立新的詞組來適應(yīng),并且這樣組成的詞組天然地會存在有規(guī)律分類的特性。例如機(jī)器的“機(jī)”字,可以組成拖拉機(jī)、播種機(jī)、飛機(jī)、紡紗機(jī)、發(fā)動機(jī)、蒸汽機(jī)、計(jì)算機(jī)......如此之多的機(jī)器,漢字都可以用“機(jī)”來形成詞組。漢字的穩(wěn)定性對人工智能帶來的好處是訓(xùn)練的參數(shù)可以更少,有效的重復(fù)可以更多,準(zhǔn)確性就更高。相比之下,英文每年都會增加大量新詞,常用單詞都可能發(fā)生變化,F(xiàn)在的英國人閱讀400年前英國的作家莎士比亞的作品都已經(jīng)很困難了。但中國人閱讀2千年前的作品依然很容易看懂。

當(dāng)然,我們提到中文在人工智能時(shí)代的技術(shù)優(yōu)勢,并不是要把它過度拔高。只是從以上不同技術(shù)時(shí)代中文技術(shù)優(yōu)劣的變化過程中,希望我們能更客觀地看待中國的文化。在進(jìn)入人工智能時(shí)代,我們更應(yīng)該發(fā)揮中文的優(yōu)勢,使得中國在人工智能時(shí)代可以獲得更快的發(fā)展,并且有更好的經(jīng)濟(jì)效益。

從我們對自己語言的態(tài)度變化中,我們可以獲得一些啟示:就是如何用科學(xué)的態(tài)度去看待自己的文化。中文有自己的特點(diǎn),這些特點(diǎn)相對不同的技術(shù)要求,可能是有利有弊的。所謂利弊或優(yōu)劣勢,永遠(yuǎn)是相對特定的要求來說的。我們不能說遇到某種劣勢,就簡單地去完全自我否定,也不能遇到優(yōu)勢,就自我膨脹。科學(xué)的態(tài)度是,如果是劣勢,我們就想辦法通過技術(shù)改進(jìn)去消除或至少減少這種劣勢。有了這種技術(shù)改進(jìn),可能劣勢就不再是劣勢或者已經(jīng)變得無關(guān)緊要了;如果是優(yōu)勢呢,我們就要想辦法去充分地開發(fā)利用它。即使是優(yōu)勢,如果你不去充分地開發(fā)利用,它也不會自動地體現(xiàn)出來,或者體現(xiàn)得不夠充分。這是我今天的演講希望能表達(dá)的。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
健美選手睪丸萎縮成“蠶豆”大。函偪竦募∪馀c不可逆的代價(jià)

健美選手睪丸萎縮成“蠶豆”大小:瘋狂的肌肉與不可逆的代價(jià)

聽心堂
2026-01-24 13:11:09
伊朗高層兵馬未動,資金先逃

伊朗高層兵馬未動,資金先逃

生命可以承受之輕
2026-04-13 08:50:39
廈門、漳州、泉州2026年一季度GDP公布

廈門、漳州、泉州2026年一季度GDP公布

生活新鮮市
2026-04-29 00:18:38
研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

黯泉
2026-04-01 17:28:39
人若缺德,有4個(gè)特征,一看便知,可不要深交!

人若缺德,有4個(gè)特征,一看便知,可不要深交!

金沛的國學(xué)筆記
2026-04-20 19:00:51
拍《風(fēng)云》時(shí),導(dǎo)演為省錢給江祖平戴了條繩,竟撐起一個(gè)時(shí)代審美

拍《風(fēng)云》時(shí),導(dǎo)演為省錢給江祖平戴了條繩,竟撐起一個(gè)時(shí)代審美

蕭狡科普解說
2026-04-23 06:09:07
英媒:中國最令人佩服的,就是美歐聯(lián)手絞殺中國光伏,竟還能翻身

英媒:中國最令人佩服的,就是美歐聯(lián)手絞殺中國光伏,竟還能翻身

杰絲聊古今
2026-04-19 01:18:49
中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

論事的老樞
2026-03-21 17:28:10
香港演員施明去世,終年74歲,曾出演《倚天屠龍記》紫衫龍王,精通武術(shù)曾做史泰龍保鏢

香港演員施明去世,終年74歲,曾出演《倚天屠龍記》紫衫龍王,精通武術(shù)曾做史泰龍保鏢

大象新聞
2026-03-31 14:49:05
為何古代很少發(fā)生強(qiáng)奸案?難道古人沒有欲望?真實(shí)原因讓人難接受

為何古代很少發(fā)生強(qiáng)奸案?難道古人沒有欲望?真實(shí)原因讓人難接受

兩只米老鼠
2026-04-27 12:16:44
你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

你以為麻豆傳媒是賣片的,其實(shí)它是賣人的

創(chuàng)始人筆記
2026-04-23 21:44:50
斯諾克世錦賽:吳宜澤連贏2局!首次領(lǐng)先瓦菲,希金斯2-2平羅伯遜

斯諾克世錦賽:吳宜澤連贏2局!首次領(lǐng)先瓦菲,希金斯2-2平羅伯遜

劉姚堯的文字城堡
2026-04-28 23:44:05
江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

書畫相約
2026-04-14 07:21:03
蘋果十年來最大的賭注——iPhone Ultra全網(wǎng)曝光深度解讀!

蘋果十年來最大的賭注——iPhone Ultra全網(wǎng)曝光深度解讀!

明美無限
2026-04-28 17:12:24
為什么大家都說這個(gè)熱巴是假的?細(xì)思極恐,真的熱巴去哪里了?

為什么大家都說這個(gè)熱巴是假的?細(xì)思極恐,真的熱巴去哪里了?

娛樂小丸子
2026-03-30 09:53:37
哇,這大身板,豐腴有度,放到唐朝不是皇后,也得是個(gè)貴妃

哇,這大身板,豐腴有度,放到唐朝不是皇后,也得是個(gè)貴妃

可樂談情感
2026-04-12 08:22:47
白冰偷稅細(xì)節(jié)公開,本人道歉

白冰偷稅細(xì)節(jié)公開,本人道歉

澎湃新聞
2026-04-28 16:59:11
他號稱“屠夫”,4年制造3千多起命案,專愛破瓜少女,最終被槍斃

他號稱“屠夫”,4年制造3千多起命案,專愛破瓜少女,最終被槍斃

柳絮憶史
2026-03-31 09:04:24
李嘉誠貼身風(fēng)水師:因泄露天機(jī)遭天譴,死后為鬼算命,瞧不上許老板

李嘉誠貼身風(fēng)水師:因泄露天機(jī)遭天譴,死后為鬼算命,瞧不上許老板

可兒故事匯
2024-08-20 23:50:14
入選住建部“美好家園案例集”成都高新這個(gè)小區(qū)憑啥出圈?

入選住建部“美好家園案例集”成都高新這個(gè)小區(qū)憑啥出圈?

紅星新聞
2026-04-28 21:53:08
2026-04-29 02:40:49
純科學(xué) incentive-icons
純科學(xué)
以純科學(xué)解決一切認(rèn)知問題
205文章數(shù) 457關(guān)注度
往期回顧 全部

教育要聞

快來給孩子接高考好運(yùn)! 今天是4月29日,農(nóng)歷三月十三,距離2026年高考還有39天。三月十三百事安...

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區(qū)仍未放人

頭條要聞

19歲中國女孩被困緬甸 交20萬贖金園區(qū)仍未放人

體育要聞

魔術(shù)黑八活塞,一步之遙?!

娛樂要聞

蔡卓妍官宣結(jié)婚,老公比她小10歲

財(cái)經(jīng)要聞

中央政治局會議定調(diào),八大看點(diǎn)速覽!

科技要聞

10億周活目標(biāo)落空!傳OpenAI爆發(fā)內(nèi)部分歧

汽車要聞

拒絕瘋狂套娃!現(xiàn)代艾尼氪金星長在未來審美點(diǎn)上

態(tài)度原創(chuàng)

時(shí)尚
本地
房產(chǎn)
教育
公開課

普通女性春天穿什么好看?這些穿搭值得借鑒,自然舒適

本地新聞

用青花瓷的方式,打開西溪濕地

房產(chǎn)要聞

紅利爆發(fā)!海南,沖到全國人口增量第4。

教育要聞

教育部通知,今年9月份開始,上學(xué)的規(guī)則全變了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版