国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

連魯迅都想不到,當(dāng)代網(wǎng)友為了省錢開始說文言文了。。

0
分享至


經(jīng)常用AI的朋友們都知道,要想AI用得爽,是得花錢的。大廠免費給你用的版本,很可能是閹割版,智力有問題,只會接住你的那種。


但這就有個問題了:AI每次回答我,都用的是我花了錢的額度,有時候嘰里咕嚕說一堆,效率巨低,額度還唰唰掉,心疼啊。

所以有沒有一種方法,能讓AI回答你問題的時候,效率又高,還能省錢?

聰明的網(wǎng)友就想到了,漢語是世界上信息密度最高的語言,甚至文言文還是濃縮中的精華。。那我們用文言文跟AI聊天,對話篇幅大大減少,這算力省下來了,效率不就上來了,錢也扣得慢了,簡直太完美了。


比如,把“我去,用戶徹底怒了”改成“嗚呼,客官震怒”,把“你先別給我瞎bb”改成“何出此言”,讓AI也用古文回我。


有老哥已經(jīng)直接詢問AI了,答曰:可也。畢竟,古人拿文言文省竹簡,又何嘗不是一種省token?


但也有人指出盲點:你省了token,消耗的不也是自己大腦的token嗎?


天縱之才也!

但實際上,江江經(jīng)過一系列嘗試后,可以給大家個結(jié)論了:

省token乎?謬也!

要搞清這個問題,我們得先知道,AI的算力消耗其實看的不是字?jǐn)?shù),而是token,可以理解為AI處理信息的最小單位。我們說的省錢、省算力,其實就是省token。

于是,我們用DeepSeek V3的token計算器,做了幾個實驗,結(jié)果嘛,非常反直覺。

比如,“用戶徹底怒了”是3個tokens,而“客官震怒”是4個tokens。


“永失吾愛”是4個tokens,“她永遠(yuǎn)不會回來了”卻是3個tokens。


甚至蒹葭蒼蒼4個字,就占了6個tokens,陜西著名美食面,更是來到了驚人的9個tokens。。


最神秘的還是“免費在線觀看”這6個字,DeepSeek那占3個token,GPT那它只占1個token,沒有人知道GPT到底在線觀看了什么。



所以說,字?jǐn)?shù)越少效率越高這事兒,還真是個純純的偽命題。

為啥會這樣呢?這就得從計算機是如何存儲文字的說起了。

一個漢字在經(jīng)過計算機編碼后,會占3-4個字節(jié),常用的字占3字節(jié),而那些特別生僻的字,3字節(jié)放不下,就得占4個字節(jié)。而要把這些字節(jié)轉(zhuǎn)化為AI能讀懂的token,還得靠模型內(nèi)部算法,它的工作原理其實很像消消樂。

一開始,所有漢字都被拆成字節(jié)存放,此時一個字節(jié)就是一個token。然后算法為了省算力,就會找那些相鄰位置出現(xiàn)最頻繁的字節(jié),把它們合并成一個新的token。

比如"你""我""他"這些漢字對應(yīng)的字節(jié),成天組隊出現(xiàn),算法就直接給他們合并了,所以這些字就只占1個token。


甚至出現(xiàn)次數(shù)過多的詞語,也會被合并成1個token,比如“用戶”“徹底”“瘋狂”,甚至“免費在線觀看”這個詞,都可以成為一個token。

而那些出現(xiàn)幾率少的字,比如“蒹”“葭”“饕”“餮”,在訓(xùn)練數(shù)據(jù)里寥寥無幾,BPE找不出字節(jié)內(nèi)在的關(guān)聯(lián),就像小學(xué)生把不認(rèn)識的字寫成拼音,那就只能保存為幾個零散的token了,于是1個字就會等于多個tokens。


而因為底層的編碼方式,導(dǎo)致所有字符的編碼最多4個字節(jié),如果一個字巨生僻,打都打不出來,它就只能像金針菇一樣,進(jìn)去啥樣出來還是啥樣,不會被合并,所以,1個漢字消耗tokens的最大值,就是4個。

因此,文言文愛用的那些古典生僻字詞,在token的交易里,反而是奢侈品,每個字對AI來說都很燒腦。

那既然用文言文不省token,那我要說啥語言才能省?。?/p>

江江的結(jié)論是,沒有結(jié)論。因為,不同模型的tokenizer,也就是token計算器完全不一樣。我們拿同樣的文本在OpenAI和DeepSeek那里都跑了一下,結(jié)果就截然不同,同一個字在OpenAI這邊可能是2個token,在DeepSeek那邊就是1個。



這是因為token怎么合并,取決于大模型的訓(xùn)練語料,而不同公司的訓(xùn)練語料構(gòu)成差異巨大。

OpenAI的模型早期以英文語料為主,在token合并上,自然對英文更慷慨;DeepSeek等國產(chǎn)模型吃了大量中文語料,中文的高頻組合見多了,自然就合并得更充分。

當(dāng)然,模型也在不斷進(jìn)步,各家都在擴大多語言語料的覆蓋,不同語言差距已經(jīng)變得越來越小,所以除非你能把每個模型的token表背下來,不然咱不建議為了三瓜倆棗,拋棄自己舒服的交流方式。


如果非要給個建議,你可以試試用文言文的思路說白話文,比如"你吃飯了沒有?"說成"吃了否",“你是不是有毛病”說成“毛病乎?”

用你自己的大腦模擬一下,找到耗token最少的表達(dá)方式,主觀能動性不就來了!

但講道理,還是不如少說廢話,奧特曼就曾經(jīng)說過,你們整天給AI說謝謝,搞得我們已經(jīng)多花幾千萬刀了,與其在形式上下功夫省token,不如從根源杜絕那些不必要的廢話。


雖然我根本忍不住,誰能忍住不問候兩句呢?


最后,其實還有個很有意思的視角。就算真有種信息密度大的語言,把token省了,最后費的還是你的腦子。

因為如果一種語言信息密度大,那也意味著,單個token表達(dá)的意思很多,歧義也會變大,咱就只能靠上下文理解來消歧,說白了 token 是省了,你還得自己費腦子理解。

比如,給你三分鐘,你能讀懂“用奶牛的牛牛牛奶,奶牛會不會被牛死”嗎?


所以,其實token在某種意義上是守恒的,AI省的越多,你大腦消耗的token越多,耗費的還是自己的儲存的能量。

你想花錢更快,還是肚子餓得更快,就看你自己的選擇了。

撰文:不咕

編輯:江江&面線

美編:素描

圖片、資料來源

小紅書、X、部分圖源自互聯(lián)網(wǎng)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
CBA常規(guī)賽收官形勢:北京深圳爭3廣東鎖第5,廣州北控拼第12

CBA常規(guī)賽收官形勢:北京深圳爭3廣東鎖第5,廣州北控拼第12

懂球帝
2026-04-21 09:18:04
絕平球化身本西拒投!約基奇末節(jié)7中1遭多方炮轟:數(shù)據(jù)假象太嚴(yán)重

絕平球化身本西拒投!約基奇末節(jié)7中1遭多方炮轟:數(shù)據(jù)假象太嚴(yán)重

顏小白的籃球夢
2026-04-21 14:47:20
最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時出海

最后時刻簽了,高市將全面梭哈?中日航班已停飛,解放軍準(zhǔn)時出海

策前論
2026-04-21 13:41:38
“學(xué)碩不讓讀,專碩21.8萬!”復(fù)旦讓普通人看清現(xiàn)實:沒錢別硬卷

“學(xué)碩不讓讀,專碩21.8萬!”復(fù)旦讓普通人看清現(xiàn)實:沒錢別硬卷

妍妍教育日記
2026-04-21 08:20:03
觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

人間頌
2026-04-20 10:16:00
一個消息震動中東,阿聯(lián)酋突然爆出大數(shù)字,美以這下捅了馬蜂窩

一個消息震動中東,阿聯(lián)酋突然爆出大數(shù)字,美以這下捅了馬蜂窩

奇思妙想生活家
2026-04-21 14:57:59
052D穿過日本橫當(dāng)水道!這步棋有多狠?

052D穿過日本橫當(dāng)水道!這步棋有多狠?

牲產(chǎn)隊
2026-04-20 22:21:15
抵達(dá)美國,投資美國乒乓球聯(lián)賽,樊振東一年能賺多少錢?

抵達(dá)美國,投資美國乒乓球聯(lián)賽,樊振東一年能賺多少錢?

小鞄搞笑解說
2026-04-21 11:41:15
“把孩子當(dāng)力工培養(yǎng)呢?”一份中學(xué)生高碳水午餐,讓家長被群嘲

“把孩子當(dāng)力工培養(yǎng)呢?”一份中學(xué)生高碳水午餐,讓家長被群嘲

妍妍教育日記
2026-04-21 09:05:03
34歲韋東奕官宣喜訊,恭喜!

34歲韋東奕官宣喜訊,恭喜!

LULU生活家
2026-04-21 15:37:17
云霧山中的美女

云霧山中的美女

鄉(xiāng)野小珥
2026-04-21 14:10:14
1930年,紅軍6人執(zhí)法隊被襲,全部犧牲,20年后,舉報者自投羅網(wǎng)

1930年,紅軍6人執(zhí)法隊被襲,全部犧牲,20年后,舉報者自投羅網(wǎng)

歷來都很現(xiàn)實
2024-06-17 22:44:58
足球報:廣東晨星在法律上與廣州隊無關(guān)聯(lián),不承擔(dān)其歷史債務(wù)

足球報:廣東晨星在法律上與廣州隊無關(guān)聯(lián),不承擔(dān)其歷史債務(wù)

懂球帝
2026-04-21 13:32:21
英國遭到拒絕后發(fā)警告:中國如果不合作,中企海外資產(chǎn)將被沒收!

英國遭到拒絕后發(fā)警告:中國如果不合作,中企海外資產(chǎn)將被沒收!

國際阿嘗
2026-04-21 06:43:47
初中的幾個潛規(guī)則:初一成績就中下,甚至倒數(shù)的,基本跟高中無緣

初中的幾個潛規(guī)則:初一成績就中下,甚至倒數(shù)的,基本跟高中無緣

好爸育兒
2026-04-20 15:00:49
全球10大反美斗士,3人被殺,2人鋃鐺入獄,另外5人呢

全球10大反美斗士,3人被殺,2人鋃鐺入獄,另外5人呢

七號說三國
2026-04-20 18:08:43
果粉終于天塌,iPhone 18 Pro 砍掉雙卡!

果粉終于天塌,iPhone 18 Pro 砍掉雙卡!

黑貓科技迷
2026-04-20 20:14:45
古利特:把我放今天也許值4000萬歐;姆巴佩和維尼修斯能共存

古利特:把我放今天也許值4000萬歐;姆巴佩和維尼修斯能共存

懂球帝
2026-04-20 20:22:11
59歲王志文已準(zhǔn)備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

59歲王志文已準(zhǔn)備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

翰飛觀事
2026-04-13 22:14:07
中介曬出通話記錄,4年前業(yè)主沒110萬不賣,如今房子只值56萬

中介曬出通話記錄,4年前業(yè)主沒110萬不賣,如今房子只值56萬

映射生活的身影
2026-04-19 23:05:55
2026-04-21 16:11:00
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10606文章數(shù) 489592關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

女子21萬全款購車 意外翻到車機相冊發(fā)現(xiàn)該車為"展車"

頭條要聞

女子21萬全款購車 意外翻到車機相冊發(fā)現(xiàn)該車為"展車"

體育要聞

“被優(yōu)化”8年后,國乒方博決定換一條路重新上場

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財經(jīng)要聞

現(xiàn)實是最大的荒誕:千億平臺的沖突始末

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

藝術(shù)
教育
房產(chǎn)
公開課
軍事航空

藝術(shù)要聞

任伯年寫竹,真帶勁

教育要聞

湖北科技職業(yè)學(xué)院開展創(chuàng)業(yè)指導(dǎo)系列活動

房產(chǎn)要聞

大規(guī)模商改住!海口西海岸,這波項目要贏麻了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普公開對伊開戰(zhàn)真正原因

無障礙瀏覽 進(jìn)入關(guān)懷版