国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

科幻作家劉洋:文學計算研究不僅是可行的,而且是必要的

0
分享至


文學計算( Literary Computing ),即通過計量的方式進行文學作品的挖掘、分析、比較和批評,是當前方興未艾的數(shù)字人文潮流的一個重要組成部分,但其傳統(tǒng)和源流又遠遠早于數(shù)字人文這一概念所通常涵蓋的時間范圍。在 19 世紀末,歐洲和美國的一些科學家就已經(jīng)嘗試通過量化的方式,對文學作品進行分析,這可以看作是最早期的文學計算研究。顯然,這一領域?qū)儆诘湫偷目鐚W科研究,對文本的數(shù)字化和特定要素的讀取涉及信息科學,對數(shù)據(jù)的計算涉及統(tǒng)計學,對數(shù)據(jù)中隱藏模式和結(jié)構(gòu)的提取涉及物理學,對作品中角色或創(chuàng)作者的性格、精神的量化分析涉及心理學,對文本中地理分布和變遷路徑的提取和可視化呈現(xiàn)涉及地理學,等等。

跨學科研究固然是令人興奮的,因為它打破學科的邊界,通過新的視角和范式來處理既有的問題,往往能帶來新的洞見,但也帶來了新的困惑、懷疑和批評。特別是那些嘗試在人文學科與自然學科之間架設有效聯(lián)系和方法論橋梁的努力,尤其容易遭受各方的質(zhì)疑。正如查爾斯 · 珀西 · 斯諾( Charles Percy Snow )在《兩種文化與科學革命》的演講中提到的那樣,科學與人文之間 “ 存在互不理解的鴻溝 ” ( Snow , [1959]1990 )。作為一名科學家與作家,斯諾常常白天和科學家同事們一起工作,晚上則又和文學家朋友們聚在一起,因此他深刻地體會到在當時的社會環(huán)境中,文學家和科學家之間的互不理解甚至是厭惡、敵意。我非常理解斯諾的這種感受,因為我本身是做物理研究出身的,在我學術(shù)生涯的初期,我主要從事凝聚態(tài)物理學研究。與此同時,在讀研究生的時候,我就開始創(chuàng)作科幻小說,并一直持續(xù)至今。也正因為我對科幻小說的喜愛,后來,我從理學院轉(zhuǎn)到人文學院,開始接觸到更多人文學者和文學理論。我發(fā)現(xiàn),斯諾所說的鴻溝,在今天并沒有彌合,因為兩類學者的基本學術(shù)素養(yǎng)、關心的問題和研究的范式都截然不同。但與斯諾所說不同的是,今天的兩類學者之間似乎并沒有太多敵意了,因為隨著人文學科在話語權(quán)利結(jié)構(gòu)中的整體收縮,兩者 連產(chǎn)生 敵意的基礎都已經(jīng)失去了。

事實上,在文學與自然科學的交融進程中,我們可以大致區(qū)分出兩種學科跨越的方向,每一種都引起了眾多爭議。一種是將自然科學的概念引入文學理論中,但拋棄了其數(shù)學上的復雜結(jié)構(gòu),而是僅將其作為一種類比物,以幫助闡明某種特定的理念、結(jié)構(gòu)和關系。例如,當?shù)つ釥?· 奧爾布賴特( Daniel Albright )使用 “ 波浪美學 ” ( Wave-Aesthetics )分析葉芝的詩歌時,他只是借用量子力學中微粒和波之間的模糊關系,闡釋某些詩歌文本所具有的特征,比如內(nèi)部邊界的喪失、主客體與主體間界限的喪失等。他并不是說,詩歌的內(nèi)部結(jié)構(gòu)與 波具有 數(shù)學上的同構(gòu)性,因此,自然也不能將涉及波的一系列數(shù)學公式套用到詩歌結(jié)構(gòu)分析之中。顯然,這類學科跨越的方式通常由人文學者發(fā)起。在后現(xiàn)代文化理論中,我們還可以找到很多這樣的例子,比如讓 - 弗朗索瓦 · 利奧塔( Jean-Francois Lyotard )對不確定性原理的借用、 讓 · 鮑德里亞( Jean Baudrillard )對熵的借用、雅克 · 拉康( Jacques Lacan )對拓撲學概念的借用,等等。這種做法在自然科學界引起了一些不滿,比如物理學教授艾倫 · 索卡爾( Alan Sokal )及其合著者在一本書中就批評道: “ 自然科學并非僅是可供人文科學隨時取用的隱喻庫。 ” (莫蘭, 2023 : 176 )

另一種跨越方式則是由自然科學家主動發(fā)起。他們將原本屬于自然科學的研究范式引入文學研究領域,發(fā)展出實證的、量化的文學研究。這個過程中有時候也會借用一些科學概念,比如信息熵、溫度等,但這類借用并不只是將概念作為某種隱喻,而是伴隨著其數(shù)學結(jié)構(gòu)的引入。比如,對文學文本的信息熵的計算,使用的正是克勞德 · 艾爾伍德 · 香農(nóng)( Claude Elwood Shannon )給出的公式,而當我們討論文本的溫度時,其背后的機制也正是熱力學中的麥克斯韋 - 玻爾茲曼分布。在 20 世紀后半葉,隨著計算機的出現(xiàn)和自然語言處理算法的發(fā)展,對文本的讀取、數(shù)值統(tǒng)計和數(shù)學建模變得更為方便,這類量化研究就逐漸變得流行起來。本書所涉及的內(nèi)容大部分即是這一類的研究。為了與文學史考證等實證 型研究 相區(qū)別,我們統(tǒng)一將其稱為文學計算。

對文學計算的批評主要來自人文學界,他們的意見大致可以分為三類:其一,文學文本來自具有主觀性的人類,其中并不具有如物理學那樣的客觀規(guī)律;其二,量化研究只是復現(xiàn)了一些我們早已經(jīng)知曉的結(jié)論,并沒有提出和解決有意義的文學問題;其三,大部分文學計算研究只是基于詞頻的模式分析,其數(shù)據(jù)不足以支撐它所聲稱的結(jié)論,或者說,文學文本和文學概念在計算過程中被簡單化了。

對于第一類批評,已經(jīng)有大量的研究結(jié)果可以作為反駁的案例。 從齊普夫 定律( Zipf ’ s Law )到最近基于情感計算的文本敘事模式劃分,大量的研究都顯示,在看似隨機和主觀的文本中,的確存在著某些客觀的規(guī)律。這一點很好理解,因為作家的寫作過程并非完全自由,他會受到諸多客觀條件的限制:正確的語法、敘事的慣例、詞匯的有限性,等等。它們就像一個封閉的箱子一樣,將大量的隨機運動的分子約束在一起,雖然每個分子的運動軌跡是很難預測的,但作為一個整體,這個體系卻呈現(xiàn)出很多可以量化的特征,比如壓強、溫度、平均自由程、動能分布函數(shù)等。

第二類和第三類批評事實上指出了當前文學計算研究應該努力的方向。也就是說,多做探索性而非驗證性的工作,而且盡量超出詞頻、 句長等 簡單指標,對高層次文學概念進行更精細的數(shù)學建模,以處理真正的文學問題。當然,要進行探索性的工作,通常就需要處理新的概念和新的問題,自然也就需要進行復雜特征量的建構(gòu)。所以,從某種程度上來講,這兩個問題是一體的。

《文學計算導論》

劉 洋 著

北京: 科學出版社, 2025. 12

ISBN978-7-03-083198-9

必須承認,在高層次文學概念和計量的特征量之間建立穩(wěn)定而有效的連接并不容易,但也絕不是不可能完成的任務。例如,在本書 (《文學計算導論》,劉洋著. 北京: 科學出版社, 2025. 12) 的第四章,我提出了一種對敘事節(jié)奏進行量化表征的方法。在文學計算領域,敘事研究一直相對匱乏。因為敘事研究中的要素難以量化,帶有強烈的主觀性,所以比其他文本特征更難處理。例如,研究文體風格、人物關系網(wǎng)絡、情感分析等可以分別通過詞頻統(tǒng)計、對話關系、情感詞典等手段實現(xiàn)量化,但敘事風格、手法、場景等要素的界定方式則極為模糊。在傳統(tǒng)的敘事學研究中,通常需要根據(jù)敘事場景的切換,將文本劃分為不同的敘事單元,這種工作通常只有具備較高文學素養(yǎng)的專業(yè)人員才能完成,因為敘事場景之間或許并不存在天然的分割線,要讓計算機準確分辨是十分困難的。但是,基于敘述的兩種形式 — 展示 和 告知 — 來體現(xiàn) 出敘事節(jié)奏的特征,可以繞開場景劃分的 障礙。具體來說,我設計了一種算法,可以將這兩種敘述形式進行自動識別,從而得到了一條敘述形式的時間序列?;谶@個時間序列,通過傅里葉變換等數(shù)學手段,就可以從中提取出與敘事節(jié)奏相對應的特征量。

比起自然科學領域的概念,比如溫度、動量等,文學概念的量化不僅更難以處理,而且這些可計量的特征量與傳統(tǒng)的文學概念在匹配時往往具有與自然科學概念不同的三種特性。其一,非精確性,也就是說兩者并不是精確契合的。比如我之前提到的對敘事節(jié)奏進行量化的特征量,其本質(zhì)上來源于從敘述形式時序數(shù)據(jù)中提取出的頻譜峰。雖然其與敘事節(jié)奏具有較強的關聯(lián),但這畢竟只是一個間接的匹配方案。此外,實際的頻譜圖通常是一個連續(xù)譜,其中的峰值可能并不顯著,呈現(xiàn)出一個平臺狀結(jié)構(gòu),這也會影響到對峰值數(shù)據(jù)的提取。所以,從概念到數(shù)據(jù),這中間其實經(jīng)過了多次近似過程。其二,非唯一性,也就是說用于表征某個文學概念的特征量并非只有一種形式。比如對于 “ 詞匯豐富度 ” 這個概念,用以表征它的特征量就有數(shù)十種之多,從最簡單的型 — 例比 ( Type Token Ratio , TTR ), 到特征 量 K ( Characteristic K ),乃至文本的信息熵,等等。其三,非普適性,也就是說這些特征量并不是在任何情況下都適用的。比如我們剛才提到的特征量 K 和信息熵,在表征詞匯豐富度時,它們都具有一個難以克服的缺陷,即對雷同文本的不敏感。如果我們將同一段文字重復一遍合并成新的文本,那么根據(jù)兩者的計算公式,其計算結(jié)果和單一文本是完全相同的,而這顯然是不合理的。這意味著,對于具有較多雷同片段的文本來說,用特征量 K 和信息熵 來作 為詞匯豐富度的指標是不合適的。

在人工智能算法迅速發(fā)展的今天,我們越來越強烈地感到,文學計算研究不僅是可行的,而且是必要的。這種必要性至少體現(xiàn)在兩個方面。其一,傳統(tǒng)的文學細讀方法無法處理當前迅速涌現(xiàn)的巨量文學文本。除了由傳統(tǒng)出版社出版的紙質(zhì)書籍,還有數(shù)量遠超前者的網(wǎng)絡文學作品 —— 其每部作品的文本長度也幾乎比前者大一個數(shù)量級。其二,人工智能文本生成正在逐漸進入人們的生活,其在大部分制式文章的寫作上都取得了較好的效果,但在文學創(chuàng)作領域仍然很不成熟。從已有的一些基于大語言模型的小說寫作實驗來看,其主要缺陷可以歸納為一點,就是缺少 “ 文學性 ” 。比如,它的敘事節(jié)奏很不穩(wěn)定,在很多不重要的細節(jié)上花費大量筆墨,而在關鍵情節(jié)上卻一筆帶過;它的比喻和描寫都極為平庸,沒有新奇性和創(chuàng)造性;它的人物缺少鮮明的個性和深刻的行為動機;故事情節(jié)的套路化痕跡極為明顯;等等??朔鲜鲞@些缺陷的方法,就是加入一個文學插件,或者定制專業(yè)的文學創(chuàng)作大模型。想要向計算機系統(tǒng)傳達何謂 “ 文學性 ” ,自然需要采用計算機的語言 —— 也就是數(shù)字化的、量化的表述,這正是文學計算研究所要做的。當我們能用量化的方式對比喻、隱喻、風格化的描寫、敘事節(jié)奏等文學概念進行表征以后,它們就可以作為一些重要的控制指標參與到文本生成算法之中,幫助其增強生成內(nèi)容的文學性。

然而,即使在當前這個普遍數(shù)字化的時代,進行文學計算研究的困難仍然是巨大的。除了來自領域本身的巨大挑戰(zhàn),教育體系、學科壁壘等社會層面的客觀障礙也不容忽視。如何在學生培養(yǎng)和制度管理上克服這些障礙,是當前發(fā)展文學計算這類跨學科領域所必須思考的問題。

事實上,打破專業(yè)和學科的界限,不僅是文學計算的需要,也是當今眾多跨學科研究和前沿領域發(fā)展的需要。希望本書可以在跨學科研究的方法和路徑上為各領域的研究者提供一些有益的參考。

本文為《文學計算導論》(劉洋著. 北京: 科學出版社, 2025. 12)一書“緒論”,標題為編者所加。

ISBN978-7-03-083198-9

責任編輯:王 丹 張翠霞

《文學計算導論》是一部深入探討文學作品量化分析方法的專著。它系統(tǒng)介紹了文學計算這一領域,從 19 世紀的手工文本統(tǒng)計分析到數(shù)字時代利用計算機技術(shù)的系統(tǒng)研究方法,不僅回顧了歷史淵源,還探討了如何通過數(shù)學模型、特征量建構(gòu)、數(shù)字細讀等方法解析文學作品,以揭示其內(nèi)在的隱藏結(jié)構(gòu)和普遍規(guī)律。全書覆蓋了作者歸屬與風格分析、人物關系網(wǎng)絡、計量敘事研究、文學文本的情感計算、文本分形結(jié)構(gòu)分析及最新的人工智能技術(shù)在文學研究中的應用等多個方面,全面展示了文學計算這一前沿的跨學科領域的發(fā)展現(xiàn)狀和未來潛力。

本書適合數(shù)字人文、文學、語言學、自然語言處理、復雜系統(tǒng)等領域的研究者以及對文學計算感興趣的研究生和本科生閱讀。

(本文編輯:劉四旦)

專業(yè)品質(zhì) 學術(shù)價值

原創(chuàng)好讀 科學品位

一起閱讀科學

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
李步云同志逝世

李步云同志逝世

新京報
2026-01-22 10:10:35
43歲范冰冰喜當媽!新男友二婚帶個娃,偷稅漏稅風波后被李晨痛甩

43歲范冰冰喜當媽!新男友二婚帶個娃,偷稅漏稅風波后被李晨痛甩

八卦王者
2026-01-21 16:49:25
華裔政治家族,卻遭特朗普清洗!特朗普如何扳倒“趙家人”?

華裔政治家族,卻遭特朗普清洗!特朗普如何扳倒“趙家人”?

觀察者海風
2026-01-20 15:14:58
王剛沒想到,離婚24年,成方圓會以這種方式,給自己上了生動一課

王剛沒想到,離婚24年,成方圓會以這種方式,給自己上了生動一課

胡一舸南游y
2026-01-21 21:25:03
央一首播將至!歷史劇《太平年》定檔,看完陣容我想說:這劇要爆

央一首播將至!歷史劇《太平年》定檔,看完陣容我想說:這劇要爆

感影的世界
2026-01-21 11:07:07
李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

金牌娛樂
2026-01-19 09:47:35
不妨一試!5個動作幫你瘦肚子

不妨一試!5個動作幫你瘦肚子

人民體育
2026-01-21 08:56:52
21分大勝仍不滿意,媒體人怒批廣東隊,強調(diào)一點不理想,盛贊一人

21分大勝仍不滿意,媒體人怒批廣東隊,強調(diào)一點不理想,盛贊一人

萌蘭聊個球
2026-01-21 22:05:19
全場起立!加拿大總理達沃斯現(xiàn)場炮轟美國:收起你的霸權(quán)行徑!

全場起立!加拿大總理達沃斯現(xiàn)場炮轟美國:收起你的霸權(quán)行徑!

知法而形
2026-01-22 10:18:06
西班牙太后:丈夫花心,兒媳強勢,妹妹終身未婚陪伴了她很多年

西班牙太后:丈夫花心,兒媳強勢,妹妹終身未婚陪伴了她很多年

小書生吃瓜
2026-01-21 16:52:47
下周一開通!廣州站?清遠站,30分鐘直達!

下周一開通!廣州站?清遠站,30分鐘直達!

魯中晨報
2026-01-22 10:11:03
大結(jié)局要來?高市安排身后事,辭職條件已確定,中國73歲老將出山

大結(jié)局要來?高市安排身后事,辭職條件已確定,中國73歲老將出山

凡知
2026-01-21 09:48:40
93年我在山里救了個老道士,他傳我兩句口訣,讓我躲過了兩次大災

93年我在山里救了個老道士,他傳我兩句口訣,讓我躲過了兩次大災

牛魔王與芭蕉扇
2025-09-18 17:17:43
王菲海哈金喜被反扒:原來,李亞鵬6段感情,是他人品的最好證明

王菲海哈金喜被反扒:原來,李亞鵬6段感情,是他人品的最好證明

菲兒愛蛋糕
2026-01-20 17:35:33
42天陣亡25000人!直接經(jīng)濟損失超2000億美元,那一仗點醒了我國

42天陣亡25000人!直接經(jīng)濟損失超2000億美元,那一仗點醒了我國

文史達觀
2026-01-22 06:45:04
10國簽字,加入特朗普版聯(lián)合國,特意給中俄留的位置,現(xiàn)在還空著

10國簽字,加入特朗普版聯(lián)合國,特意給中俄留的位置,現(xiàn)在還空著

古史青云啊
2026-01-21 22:07:24
驚天反轉(zhuǎn)!28歲日本外援正式回歸遼寧踢中超 13天前官宣加盟延邊

驚天反轉(zhuǎn)!28歲日本外援正式回歸遼寧踢中超 13天前官宣加盟延邊

我愛英超
2026-01-22 10:24:22
中國隊晉級亞洲杯決賽!以下7位國腳身價必漲,李昊+彭嘯位列其中

中國隊晉級亞洲杯決賽!以下7位國腳身價必漲,李昊+彭嘯位列其中

球場沒跑道
2026-01-21 17:00:33
欠中國的錢,委內(nèi)瑞拉不還了?美財長:中國已無法繼續(xù)獲得委石油

欠中國的錢,委內(nèi)瑞拉不還了?美財長:中國已無法繼續(xù)獲得委石油

李橑在北漂
2026-01-21 23:49:17
萬萬沒想到,折騰半生傾家蕩產(chǎn)的牛群,被美國畢業(yè)的兒子這樣對待

萬萬沒想到,折騰半生傾家蕩產(chǎn)的牛群,被美國畢業(yè)的兒子這樣對待

匹夫來搞笑
2026-01-22 04:23:14
2026-01-22 10:52:49
科學出版社 incentive-icons
科學出版社
科學出版社官方號
5933文章數(shù) 27923關注度
往期回顧 全部

藝術(shù)要聞

一場雪,飄進了唐詩

頭條要聞

張建龍被查 曾回應"三北防護林擋風是否導致霧霾加重"

頭條要聞

張建龍被查 曾回應"三北防護林擋風是否導致霧霾加重"

體育要聞

珍妮回應爆料:湖人不感激詹姆斯付出絕非事實

娛樂要聞

鐘麗緹土耳其高空落淚 與張倫碩擁吻

財經(jīng)要聞

股東資格確權(quán)存糾紛 前總裁狀告申通快遞

科技要聞

日系彩電時代“徹底落幕”

汽車要聞

今年集中上市 旅行車的春天可能真要來了

態(tài)度原創(chuàng)

時尚
游戲
教育
藝術(shù)
公開課

締造仙女夢的人,去了天堂繼續(xù)縫制星光?

《戰(zhàn)地6》第2賽季新地圖截圖 大小類似圣康坦的傷痕

教育要聞

淚目!云南4年級女孩穿著單衣上學,老師暖心出手,愛心傳遞

藝術(shù)要聞

一場雪,飄進了唐詩

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版