具身智能：學(xué)習(xí)型智能決策代理認知架構(gòu)中的流暢應(yīng)對

2026-03-16 13:08:18　來源: CreateAMind

上海舉報

分享至

Embodied Intelligence: Smooth Coping in the Learning Intelligent Decision Agent Cognitive Architecture

具身智能:學(xué)習(xí)智能決策主體認知結(jié)構(gòu)中的平穩(wěn)應(yīng)對

https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2

我們大部分的日常具身行動都以流暢應(yīng)對（smooth coping）的形式出現(xiàn)。流暢應(yīng)對是指已經(jīng)變得習(xí)慣化且根深蒂固的熟練行動，與深思熟慮的思想和行動相比，它通常對認知負荷施加的壓力較小。當(dāng)憑借技能和專業(yè)知識執(zhí)行時，行走、駕駛、滑雪、音樂表演和快餐烹飪都是這種現(xiàn)象的例子。流暢應(yīng)對的特征在于其迅速性和相對缺乏反思，這兩者都是自動化的標(biāo)志。深思熟慮和反思性的行動提供了對照案例。在德雷福斯（Dreyfus）的經(jīng)典觀點中，流暢應(yīng)對是對行動的“無心”沉浸，處于流暢狀態(tài)（in the flow），任何反思性思維只會打斷這種流暢?；诙磐―ewey）的實用主義論述，其他人，如薩頓（Sutton）、蒙特羅（Montero）和加拉格爾（Gallagher），堅持認為流暢應(yīng)對中內(nèi)置了智能靈活性，表明它不等同于自動化。我們在本文中尋求回答兩個互補的挑戰(zhàn)。首先，我們?nèi)绾卧诩毩６壬蠈ψ灾黧w（自然的或人工的）中的流暢應(yīng)對進行建模？其次，我們使用這個流暢應(yīng)對模型來展示我們?nèi)绾卧谌斯ぶ悄荏w中實現(xiàn)流暢應(yīng)對。我們在 LIDA（學(xué)習(xí)智能決策代理，Learning Intelligent Decision Agent）中開發(fā)了一個流暢應(yīng)對的概念模型。LIDA 是一個具身認知架構(gòu)，實現(xiàn)了意識的全局工作空間理論（global workspace theory of consciousness）以及其他心理學(xué)理論。LIDA 對意識的實現(xiàn)使我們能夠解釋流暢應(yīng)對的現(xiàn)象學(xué)，這是少數(shù)認知架構(gòu)能夠做到的。通過對 LIDA 的細粒度分析，我們認為流暢應(yīng)對是一系列自動化行動，間歇性地穿插著意識介導(dǎo)的行動選擇，并由背側(cè)流（dorsal stream）過程補充。換句話說，非意識的、自動化的行動（無論是習(xí)得的還是先天的）通常需要偶爾爆發(fā)的意識認知，以實現(xiàn)流暢應(yīng)對的熟練和靈活調(diào)整。此外，從未進入意識的背側(cè)流信息和相關(guān)的感覺運動過程在流暢應(yīng)對期間提供進一步的在線調(diào)整。為了在 LIDA 中實現(xiàn)流暢應(yīng)對，我們向 LIDA 認知架構(gòu)引入了一個新模塊，即自動化行動選擇子模塊（Automatized Action Selection sub-module）。我們復(fù)雜的流暢應(yīng)對模型從生成主義（enactivism）借用了“具身智能”的概念，并通過允許表征和更詳細的意識控制機制來增強這些概念。我們探討了流暢應(yīng)對的幾個擴展例子，從像行走這樣的基本活動開始，擴展到像駕駛和快餐烹飪這樣更復(fù)雜的任務(wù)。

關(guān)鍵詞：流暢應(yīng)對，自動化，行動選擇，認知架構(gòu)，具身認知，全局工作空間理論，LIDA

引言

在本文中，我們使用 LIDA（學(xué)習(xí)智能決策代理）開發(fā)了一個流暢應(yīng)對的概念模型，LIDA 是一個混合的、具身的認知架構(gòu)，實現(xiàn)了意識的全球工作空間理論（GWT）（Baars, 1988）、感知 - 行動循環(huán)（Neisser, 1976; Freeman, 2002; Fuster, 2004; Cutsuridis et al., 2011）、grounded 認知（Harnad, 1990; Barsalou, 1999）、評估理論（Lazarus, 1991; Roseman and Smith, 2001）、長期工作記憶（Ericsson and Kintsch, 1995）以及其他認知理論。它旨在成為一個“認知的統(tǒng)一理論”（Newell, 1994），采納這些以及其他不同的理論，并將它們統(tǒng)一在一個單一的、綜合的架構(gòu)之下。LIDA 是一個概念性和計算性的架構(gòu)，已被用作軟件和機器人代理的基礎(chǔ)。當(dāng)前的論文是關(guān)于如何在 LIDA 中實現(xiàn)流暢應(yīng)對的理論概述。后續(xù)研究將實現(xiàn)形式體系、編寫代理代碼，并在各種環(huán)境中測試代理。我們將這項工作視為邁向流暢應(yīng)對機器人實現(xiàn)的第一步，這將符合機器人學(xué)的當(dāng)前趨勢，例如通過模仿學(xué)習(xí)（Bullard et al., 2019）。

流暢應(yīng)對是熟練且適應(yīng)性地行動的過程，通常朝向任務(wù)的完成。流暢應(yīng)對涵蓋了廣泛的熟練行為，從相對基本的行為如呼吸或吸吮，到那些通過艱苦訓(xùn)練習(xí)得的行為，如成為飛行員（Dreyfus and Dreyfus, 1980）。熟練地駕車穿過交通、滑雪坡或跑障礙課程都是流暢應(yīng)對的經(jīng)典例子。然而，這個概念也可以包括烹飪、放羊、跳舞、整理以及許多其他可能達到優(yōu)化性能狀態(tài)的活動。這個概念起源于現(xiàn)象學(xué)哲學(xué)，特別是海德格爾（Heidegger, 1928/2010）和梅洛 - 龐蒂（Merleau-Ponty, 1945/2012）的具身現(xiàn)象學(xué)。這兩位思想家都在反對哲學(xué)和心理學(xué)中將人類存在智力化的愿景，這種愿景將我們視為本質(zhì)上旨在認識世界的認識論主體。作為替代，他們提出了一種人類存在的愿景，這種愿景在其根本上是實用性地面向行動和運動的，并且（對于梅洛 - 龐蒂而言）是基于代理的具身性的。

在流暢應(yīng)對中，代理不僅僅是在做脫節(jié)的多任務(wù)處理，也不僅僅是在做自動化行動。相反，代理的大部分認知過程連貫地朝向?qū)崿F(xiàn)一個遠端意圖。我們概述了 LIDA 代理如何實現(xiàn)流暢應(yīng)對，并提供三個案例研究：行走、駕駛和快餐烹飪（見“結(jié)論”部分）。重要的是，LIDA 中的流暢應(yīng)對通常需要一個“混合的”組合，包含意識的、意識介導(dǎo)的和從未意識的過程，這些過程交織在使用意識的全球工作空間理論實現(xiàn)的一系列持續(xù)的認知周期中（Franklin and Baars, 2010）。歷史上，在 LIDA 概念模型中，行動選擇一次只能選擇一個，且僅能選擇一個行動。在本文中，我們通過向行動選擇引入一個新子模塊：自動化行動選擇（AAS），對 LIDA 模型做出了重大貢獻。這個子模塊允許行動的并發(fā)選擇——AAS 能夠并行選擇自動化行動。此外，AAS 與原始行動選擇算法并行運行，后者繼續(xù)一次選擇一個行動。

我們首先詳細闡述最近關(guān)于流暢應(yīng)對的辯論，并強調(diào)支持它的認知的混合性質(zhì)（Christensen et al., 2016; Gallagher and Varga, 2020）。然后我們介紹 LIDA 模型以及與該項目相關(guān)的 LIDA 方面。為了更全面地概述 LIDA，我們建議閱讀教程和我們最近的兩篇論文（Franklin et al., 2016; Kronsted et al., 2021; Neemeh et al., 2021）。我們通過三個復(fù)雜度遞增的案例研究來說明流暢應(yīng)對如何在 LIDA 代理中發(fā)生：獨自行走、交通中駕駛和快餐烹飪（見“結(jié)論”部分）。

流暢應(yīng)對

盡管最近關(guān)于流暢應(yīng)對的辯論有所增加，但這一主題至少可以追溯到亞里士多德以及實踐智慧（phronesis，通常譯為"實踐智慧"）的概念。自其最早提出以來，流暢應(yīng)對的辯論通常與文化和社會性緊密相連——流暢地應(yīng)對世界往往是在豐富的社會文化語境中進行的（Rietveld and Kiverstein, 2014）。因此，關(guān)于流暢應(yīng)對的辯論跨越了社會認知、人類學(xué)、表演研究以及"專家表現(xiàn)"討論中的諸多議題（Cappuccio, 2019）。

在處理流暢應(yīng)對時，運動性討論與文化討論的交叉在現(xiàn)象學(xué)傳統(tǒng)中尤為明顯。在二十世紀(jì)，馬丁·海德格爾在其巨著《存在與時間》（1927）中引入了"上手狀態(tài)"（Zuhandenheit）一詞。該詞常被譯為"就緒在手"，指的是一種前反思、前理論的行為模式。當(dāng)我將某物（比如說錘子這樣的工具）視為就緒在手時，我是在使用它，而非反思它。這種使用是一種具身的"知道如何"（know-how），而非理論性的沉思。海德格爾認為，西方哲學(xué)傳統(tǒng)完全聚焦于"現(xiàn)成在手"（Vorhandenheit），即理論性的行為模式。例如，康德的體驗理論明確旨在支持科學(xué)的事業(yè)。這種對理論理性而非具身行動的關(guān)注，是我們可以在人工智能和機器人學(xué)歷史中看到被重復(fù)的現(xiàn)象。相比之下，梅洛 - 龐蒂（Merleau-Ponty, 1945/2012）考察了具身性與行動如何與空間、時間、性、其他主體以及其他領(lǐng)域動態(tài)地相互作用。根據(jù)梅洛 - 龐蒂的觀點，流暢應(yīng)對是我們?nèi)粘Ｉ钭罨镜哪Ｊ?。多年后，漢斯·約納斯（Hans Jonas, 2001）發(fā)展了一種主體性的發(fā)生現(xiàn)象學(xué)，根據(jù)該理論，流暢應(yīng)對的這些基礎(chǔ)層次使得更高階的認知過程得以涌現(xiàn)，類似于當(dāng)代關(guān)于支架作用（scaffolding）的主張?？v觀現(xiàn)象學(xué)傳統(tǒng)的思想家們，我們看到一種對具身性的強調(diào)，其中流暢應(yīng)對是認知主體在世界中移動時的基本能力?？傊?，許多現(xiàn)象學(xué)家持這樣的觀點：流暢應(yīng)對構(gòu)成了具身人類能動性的基本背景，而更具認識論導(dǎo)向的、邏輯的或更高階的過程則較為少見，并且是在這一背景之上建立的。

在現(xiàn)象學(xué)傳統(tǒng)的基礎(chǔ)上，德雷福斯和德雷福斯（Dreyfus and Dreyfus, 1980）基于技能習(xí)得的五個階段發(fā)展了一種流暢應(yīng)對的認知理論。根據(jù)他們的理論，某項技能的專長特征是自動化以及缺乏高階思維。在這個流暢應(yīng)對模型中，專家們已將其領(lǐng)域內(nèi)的技能習(xí)慣化到其動作完全自動化的程度。這反過來旨在解釋為何關(guān)注自身或部署高階認知過程（如"策略制定"）有時會對表現(xiàn)產(chǎn)生不利影響（Fitts and Posner, 1967; Cappuccio et al., 2019）。

在關(guān)于流暢應(yīng)對和專家表現(xiàn)的文獻中，其他人追隨德雷福斯和德雷福斯，同樣認為熟練行動中的流暢應(yīng)對是完全自動化的問題（Papineau, 2013, 2015）。

然而，德雷福斯模型近年來受到了來自各種理論家、運動員和藝術(shù)家的批評，且來自多種視角。例如，芭芭拉·蓋爾·蒙特羅（Barbara Gail Montero, 2010, 2016）表明，要在許多運動中取得成效，運動員必須同時部署自動化和高階認知過程。此外，蒙特羅等人（Montero et al., 2019）表明，聲稱自我關(guān)注對表現(xiàn)有害的實證研究計劃是基于有缺陷的實驗設(shè)計。自我關(guān)注、監(jiān)控、策略制定等往往被整合到表現(xiàn)的流動中，而非打斷它。

這里的要點是，高階過程，如規(guī)劃、策略制定、監(jiān)控等，并非總是對專家表現(xiàn)有害，相反，它們通常是專家表現(xiàn)和成功流暢應(yīng)對所必需的。鑒于這一洞見，流暢應(yīng)對往往是將一些人所謂的"在線"（需要即時感官刺激）和"離線"（脫離即時感官刺激）認知流暢整合的問題（Wilson, 2002）。現(xiàn)在有幾個理論提出了低階和高階過程在專家表現(xiàn)及更廣泛的流暢應(yīng)對中之間相互作用的因果整合網(wǎng)絡(luò)。此類模型包括"拱形"模型（H?ffding and Satne, 2019）、混合架構(gòu)（Christensen et al., 2016, 2019）、雙過程模型（Neemeh, 2021）、激進混合架構(gòu)（Gallagher and Varga, 2020）以及各種類似方法（Bermúdez, 2017; Pacherie and Mylopoulos, 2021）。

雖然這些模型在其理論承諾方面各不相同，但總體主旨是一致的：在專家表現(xiàn)過程中，低階和高階認知過程都被利用并相互影響。例如，自動化的非意識過程，如姿勢的持續(xù)調(diào)整或籃球運球，可能受到高階意識過程的影響，如思考并意識到對手的策略。一位面對臂展更長對手的混合武術(shù)格斗手可能會戰(zhàn)略性地試圖通過擒抱而非踢打和拳擊來智勝對手。這種高階戰(zhàn)略決策反過來影響格斗手如何調(diào)整姿勢并重新配置其感覺運動準(zhǔn)備狀態(tài)以適應(yīng)某些行動類型。

在舞蹈表演的文獻中，一些現(xiàn)象學(xué)家同樣指出，即使在高度編排的表演中（一個動作引發(fā)下一個動作），專業(yè)舞者也必須根據(jù)舞臺的特殊性、當(dāng)晚的觀眾、燈光、空氣密度和濕度、服裝故障以及其他因素調(diào)整其表演（Bresnahan, 2014）。同樣重要的是，或許甚至更重要的是，專業(yè)舞者（以及一般的專業(yè)表演者）必須始終在對身體本身的意識監(jiān)控中進出，以根據(jù)身體當(dāng)天的感覺進行調(diào)整（Ravn, 2020）。

從這些簡要的例子中，我們可以看到，具身的專業(yè)知識，無論是在行走或駕駛等平凡案例中，還是在體育和表演等高度專業(yè)化的領(lǐng)域中，都涉及各種認知過程和不同意識層次（意識的、從未意識的、前意識的、前反思的）的流暢混合。雖然混合架構(gòu)方法在諸如"心理表征"等概念的承諾上，或如何概念化不同認知機制之間的因果關(guān)系上存在分歧，但普遍共識是，流暢應(yīng)對不僅僅是自動化的問題。相反，我們經(jīng)常利用并在各種認知過程之間切換。例如，音樂家有時會報告自己處于完全自動化的狀態(tài)，同時監(jiān)控自己的行動和同伴音樂家的行動。在這種狀態(tài)下，演奏的音樂家通過自動化行動，但他們隨時準(zhǔn)備以自上而下的控制進行干預(yù)（H?ffding, 2019）。

在流暢應(yīng)對和專家表現(xiàn)的討論中同樣重要的是傾向性技能或習(xí)慣的概念。在此，思想家們傾向于發(fā)展強烈受約翰·杜威（John Dewey, 1922）習(xí)慣概念啟發(fā)的習(xí)慣理論，即將習(xí)慣視為一種對情境敏感、靈活的行動傾向。無論是在明確反表征主義的生成式認知科學(xué)中（Gallagher, 2020; Segundo-Ortin and Heras-Escribano, 2021），還是在表征主義的認知科學(xué)中（Schack, 2004; Sutton et al., 2011; Bermúdez, 2017; Pacherie and Mylopoulos, 2021），普遍認為習(xí)慣是專家表現(xiàn)和流暢應(yīng)對中的一個重要概念。在這種觀點下，習(xí)慣通過練習(xí)而根深蒂固，但能靈活地適應(yīng)各種情境。與情境上僵化的運動程序不同（Ghez, 1985; Neilson and Neilson, 2005），習(xí)慣總是由當(dāng)前情境調(diào)節(jié)并精細調(diào)整的——習(xí)慣是適應(yīng)性地在環(huán)境中存在的方式（Dewey, 1922）。

學(xué)習(xí)智能決策代理認知架構(gòu)

學(xué)習(xí)智能決策代理（Learning Intelligent Decision Agent，LIDA）是一個系統(tǒng)層面的認知架構(gòu)，旨在提供對認知的完整且整合的解釋（Franklin et al., 2016）。因此，LIDA 模型并非僅建模心智的某一方面，而是旨在成為一個"認知的統(tǒng)一理論"（Newell, 1994），能夠建模人類、動物和人工心智。此處所使用的"認知"廣泛涵蓋了心智的每一種機制，包括但不限于感知、注意、動機、規(guī)劃、深思、元認知、行動選擇和運動控制，以及所有這些活動的具身性。因此，"認知"意在涵蓋代理心智生活的全部，包括其具身性和具身行動。在 LIDA 框架內(nèi)，"心智"被廣泛理解為自主代理的控制結(jié)構(gòu)（Franklin, 1995; Franklin and Graesser, 1997）。此處"控制結(jié)構(gòu)"（參見 Newell, 1973）被廣泛理解為那些使代理能夠追求其議程的機制。成為自主代理的部分含義在于擁有一個議程，而擁有心智則意味著擁有使個體能夠追求該議程的結(jié)構(gòu)（無論其議程多么簡單或復(fù)雜）。因此，自主代理始終在處理"我接下來應(yīng)該做什么？"這一問題。

學(xué)習(xí)智能決策代理由許多短期和長期記憶模塊，以及被稱為代碼元（codelets）的專用處理器組成。雖然模塊化有時在當(dāng)代心智哲學(xué)中被視為"貶義詞"，但 LIDA 模型在以下意義上是模塊化的：它由一組獨立模塊組成，這些模塊持續(xù)執(zhí)行其指定任務(wù)。然而，重要的是要注意，LIDA 模型并不承諾大腦的模塊化（Franklin et al., 2013）。事實上，LIDA 模型對大腦不做任何主張。因此，即使由動態(tài)且充滿神經(jīng)復(fù)用（neural reuse）的大腦（Kelso, 1995; Anderson, 2014）也可以實現(xiàn) LIDA 模型。

重要的是，LIDA 模型實現(xiàn)了意識的全球工作空間理論（Baars, 1988, 2019）。代理通常無法意識到其環(huán)境（外部或內(nèi)部）中的一切，因此需要"過濾掉"最相關(guān)的信息。因此，LIDA 代理擁有關(guān)于世界的信息，這些信息在稱為全局工作空間（Global Workspace）的模塊中"競爭"其注意力。任何勝出的結(jié)構(gòu)（最典型的是一組結(jié)構(gòu)的聯(lián)盟）會被全局廣播到整個模型中的每個模塊——因此稱為"全局廣播"。通過這種方式，全局工作空間充當(dāng)一個過濾器，決定哪些信息可供代理的其余模塊使用。

在 LIDA 中，感官刺激被用于在稱為當(dāng)前情境模型（Current Situational Model, CSM）的模塊內(nèi)構(gòu)建外部環(huán)境和內(nèi)部環(huán)境的豐富模型。概括而言，CSM 創(chuàng)建世界的模型，然后模型的不同部分被發(fā)送到全局工作空間中競爭。

LIDA 模型利用兩種類型的專用處理器：結(jié)構(gòu)構(gòu)建代碼元和注意代碼元。結(jié)構(gòu)構(gòu)建代碼元在 LIDA 的 CSM 中構(gòu)建（可能復(fù)雜的）表征結(jié)構(gòu)。這些結(jié)構(gòu)可以包括（除其他外）來自代理環(huán)境的感官內(nèi)容和被提示的長期記憶（例如，來自感知聯(lián)想記憶、空間記憶、瞬態(tài)情景記憶和陳述性記憶）。另一方面，注意代碼元持續(xù)監(jiān)控 CSM，尋找與其關(guān)注點匹配的結(jié)構(gòu)。如果找到，前意識內(nèi)容及其對應(yīng)的注意代碼元會形成聯(lián)盟，在 LIDA 的全局工作空間中競爭意識。

聯(lián)盟由注意代碼元及其倡導(dǎo)的內(nèi)容組成。這些聯(lián)盟隨后被發(fā)送到全局工作空間內(nèi)競爭意識的"注意"。在全局工作空間模塊內(nèi)發(fā)生的競爭決定系統(tǒng)將意識性地注意什么。無論哪個聯(lián)盟具有最高的激活值，其內(nèi)容就會被廣播到整個模型中的每個 LIDA 模塊（即，其內(nèi)容被全局廣播）。意識包括（除其他外）離散的認知時刻在重疊周期中展開的頻繁序列化廣播，然后通常由每個模塊處理。換句話說，意識是離散的，一件事接一件事以快速節(jié)奏發(fā)生（Baars, 1988）。雖然 LIDA 的所有模塊都異步接收輸入，但全局廣播的序列化性質(zhì)促進了意識以及（如我們將看到的）具身行動的平滑序列化展開。關(guān)于 LIDA 模型、其模塊和過程的一般概述，見圖 1。

為了能夠處理代理在不同文化、個人歷史和當(dāng)前情境下具有不同需求的事實，多個變量被附加到 CSM 中的結(jié)構(gòu)上。例如，每個結(jié)構(gòu)都有一個激活值，該值部分用于衡量其顯著性。這些結(jié)構(gòu)的顯著性用于確定包含這些結(jié)構(gòu)的聯(lián)盟的激活，從而調(diào)節(jié)它們在全局工作空間中贏得全局廣播競爭的機會。關(guān)于 LIDA 中顯著性和動機的深入說明（參見 McCall et al., 2020）。

LIDA 研究計劃的核心承諾之一是 LIDA 模型是一個具身架構(gòu)（Franklin et al., 2013）。這意味著 LIDA 代理在設(shè)計上是受生物啟發(fā)的，并且始終與其環(huán)境處于活躍的交互之中。符合認知的 4E 方法，LIDA 代理始終處于回答“我接下來做什么？”這一問題的過程中。此外，不斷回答這個問題意味著所有 LIDA 代理都有一個“議程”，并且在許多具身 LIDA 代理中，該議程源于代理身體的需求。

具身認知領(lǐng)域的辯論經(jīng)常區(qū)分弱具身和強具身（Gallagher, 2011）。粗略地說，如果身體傾向于僅僅在系統(tǒng)的中央處理中被“表征”，那么一種認知方法就是弱具身的。如果系統(tǒng)物理身體的構(gòu)造有助于其認知的構(gòu)成，那么該系統(tǒng)就是強具身的。然而，LIDA 模型并不完全符合這一分類。LIDA 模型使用包容架構(gòu)（Brooks, 1991），并通過其背側(cè)流與環(huán)境處于持續(xù)敏感的交互之中。LIDA 背側(cè)流除其他外，直接影響代理與其世界的物理介入。LIDA 代理還擁有一個身體圖式，持續(xù)影響感覺運動行動的展開。同時，確實 LIDA 模型也在當(dāng)前情境模型中表征其自身的身體。此外，LIDA 認知架構(gòu)的設(shè)計使其既可以在物理代理中實現(xiàn)，也可以在非物理代理中實現(xiàn)，例如分別是機器人或軟件代理。因此，LIDA 模型包含強具身和弱具身兩者的元素，并且在物理代理中，這兩種方法往往都起作用。

有了這個概述，我們準(zhǔn)備好深入探討關(guān)于 LIDA 認知周期和行動選擇的更多細節(jié)。行動選擇在流暢應(yīng)對期間尤為重要，因為成功的流暢應(yīng)對需要在正確的時間熟練地選擇和執(zhí)行正確的行動。

認知周期

學(xué)習(xí)智能決策代理（LIDA）的認知周期分為理解階段、注意階段以及行動與學(xué)習(xí)階段（見圖 2）。LIDA 的認知周期始于外部和內(nèi)部的感官輸入，以及在當(dāng)前情境模型（Current Situational Model, CSM）中結(jié)構(gòu)（即表征）的構(gòu)建與更新。吸引注意代碼元關(guān)注的結(jié)構(gòu)隨后被帶到全局工作空間，在此它們競爭意識。勝出的結(jié)構(gòu)在整個模型中被廣播，系統(tǒng)可能通過行動選擇機制做出行動（內(nèi)部或外部）的決策。學(xué)習(xí)也可能作為每次意識廣播的結(jié)果而發(fā)生。雖然關(guān)于 LIDA 中學(xué)習(xí)的詳細討論超出了本文的范圍，但足以說明的是，LIDA 代理通常在每個認知周期中學(xué)習(xí)（作為其意識廣播的直接結(jié)果）。

對于不熟悉 LIDA 的讀者而言，記住以下幾點是有幫助的：每個認知周期都非常迅速，在人類中僅持續(xù) 200–500 毫秒（Madl et al., 2011），并且 LIDA 的模塊在很大程度上是異步且獨立于彼此工作的。因此，認知周期可以"重疊"。例如，一個認知周期的"行動與學(xué)習(xí)階段"可以與下一個認知周期的"感知與理解階段"同時發(fā)生。因此，雖然每個認知周期在概念上被劃分為離散的、串行的階段，但代理的模塊和過程完全處于非活動狀態(tài)的情況很少見。

行動選擇

在每個認知周期的行動與學(xué)習(xí)階段，LIDA 的行動選擇模塊通常會選擇指定可執(zhí)行（內(nèi)部或外部）行動的行為。出于多種原因，這個行動選擇過程是必要的。例如，可能存在許多行為可以完成一項任務(wù)，盡管并非所有行為都能同樣出色地完成。例如，移動一個盒子可以通過攜帶它、用手推它、用腳蹬它，甚至四肢著地爬行時用頭推它來實現(xiàn)。在這些情況下，行動選擇有助于選擇這些行為中最具情境相關(guān)性和最可靠的行為。此外，在任何給定時刻，代理可能擁有多個相互競爭的欲望和目標(biāo)。行動選擇有助于選擇更有可能導(dǎo)致最期望結(jié)果的行為。最后，行動選擇協(xié)調(diào)非沖突行為的并行選擇。

歷史上，行動選擇一次只選擇一個行為。在本文中，我們增強了行動選擇模塊，包含了一個自動化行動選擇子模塊（見"LIDA 中的流暢應(yīng)對”部分），允許在每個行動選擇事件中選擇多個非沖突的行為。行動選擇依賴于 LIDA 的程序性記憶，這是一個長期記憶模塊，用于確定情境相關(guān)的行動及其預(yù)期的環(huán)境后果。換句話說，程序性記憶指定了可采取的行動以及如果采取這些行動會發(fā)生什么，而行動選擇則根據(jù)該知識決定代理將做什么（見圖 3）。

當(dāng)意識內(nèi)容被全局廣播到所有 LIDA 模塊時，它被程序性記憶接收，程序性記憶利用意識廣播的內(nèi)容來實例化與該意識內(nèi)容相關(guān)的圖式。實例化的圖式被稱為行為，它們是 LIDA 行動選擇模塊選擇的候選者。每個圖式由一個上下文（即環(huán)境情境）、一個行動和一個結(jié)果（即該行動的預(yù)期環(huán)境后果）組成。這些可以在許多不同的抽象和普遍性級別上指定。每個圖式還包含一個基線激活值，用于估計在給定上下文中采取該行動時，圖式結(jié)果隨之發(fā)生的可能性。例如，一個通用的“轉(zhuǎn)鑰匙圖式”可能指定一個行動，對應(yīng)于轉(zhuǎn)動鑰匙所需的身體運動，上下文是靠近鎖，預(yù)期結(jié)果是鎖被打開。每次成功選擇并執(zhí)行該圖式的行動（在給定上下文中）通常會導(dǎo)致其基線激活值增加。同樣，每次失敗會導(dǎo)致其基線激活值減少。如果，正如我們可能預(yù)期的，這個“轉(zhuǎn)鑰匙圖式”通常成功，那么它最終將擁有較高的基線激活值。然而，如果其上下文指定不足，例如如果它沒有限制“轉(zhuǎn)鑰匙”僅在代理“靠近鎖”時進行，那么其行動可能會在不適當(dāng)?shù)那榫持斜徊扇。瑢?dǎo)致一個不可靠的圖式，經(jīng)常莫名其妙地失敗。這種不可靠性將表現(xiàn)為該圖式具有較低的基線激活值。

此時，自然會有人問：“等等，每件事都有一個圖式嗎？有煮咖啡圖式嗎？有看電視圖示嗎？有 CrossFit 圖式嗎？”首先，我們必須理解許多圖式是特定于文化的。一個部署在汽車工廠流水線機器人上的 LIDA 代理不需要一個“酷握手”圖式。然而，一個存在于不同握手是文化流暢性不可或缺組成部分的文化中的代理，可能擁有針對不同文化相關(guān)問候的圖式。其次，我們必須理解復(fù)雜行動是通過執(zhí)行多個更簡單的行動來實現(xiàn)的。例如，騎自行車包括雙腿蹬踏、轉(zhuǎn)向、剎車、掃描環(huán)境等等。在 LIDA 的歷史上，將多個行動協(xié)調(diào)為復(fù)雜行動是通過圖式流來實現(xiàn)的（見“行為流和技能”部分）。由于這些流的存在，LIDA 代理不需要為每個復(fù)雜行動學(xué)習(xí)獨特的圖式。相反，看似新穎的復(fù)雜行動可以通過多個預(yù)先存在的圖式表現(xiàn)出來。通過這種方式，LIDA 實現(xiàn)了一種形式的“遷移學(xué)習(xí)”（Pan and Yang, 2009）。為了進一步促進復(fù)雜行動的學(xué)習(xí)，在本文中，我們引入了圖式的層級組織（見"LIDA 中的流暢應(yīng)對”部分），它與行動的自動化行動選擇相結(jié)合，允許流暢的代理行為。

當(dāng)行動選擇選擇一個指定外部行動的行為時（即，旨在修改代理外部環(huán)境的行動），它將其傳遞給 LIDA 的感覺運動記憶以執(zhí)行。另一方面，如果選擇的行為指定了一個內(nèi)部行動（例如，用于支持心理模擬的行動），它會被發(fā)送到（或用于生成）一個結(jié)構(gòu)構(gòu)建代碼元，從而相應(yīng)地更新當(dāng)前情境模型。行為的選擇也可能導(dǎo)致期望代碼元的創(chuàng)建。期望代碼元是一種注意代碼元， tasked with 監(jiān)控當(dāng)前情境模型，尋找與代理最近選擇行為的預(yù)期結(jié)果相匹配的內(nèi)容。這會暫時使代理的注意力偏向于其最近行動的環(huán)境后果，有助于在代理的行動及其結(jié)果之間產(chǎn)生反饋循環(huán)。因此，符合生成式和預(yù)測性的認知方法，行動、感知和預(yù)測在一個反饋循環(huán)中緊密聯(lián)系在一起。

關(guān)于流暢應(yīng)對的研究普遍認同，流暢應(yīng)對由一系列自動的和有意識控制的行動組成，同時也包括低層感覺運動活動和高層思維，如策略制定或監(jiān)控（Christensen et al., 2016; Montero, 2016; H?ffding, 2019; Gallagher and Varga, 2020）。換句話說，流暢應(yīng)對是根深蒂固的自動過程與有意識的深思熟慮過程的結(jié)合，從而產(chǎn)生流暢且熟練的行動。在 LIDA 中，這是通過結(jié)合四種不同的行動選擇模式來建模的：意識介導(dǎo)的行動選擇、意志決策、警報和自動化行動選擇（Franklin et al., 2016, pp. 29–32）。意識介導(dǎo)的行動選擇指的是代理執(zhí)行的許多行動，其中涉及意識廣播，但同時代理并未意識到那些用于選擇這些行動的選擇過程。例如，在帆船運動中，運動帆船手可能有意識地意識到桅桿上的不同繩索，但并未意識到行動選擇中的競爭過程，正是該過程使她選擇了最終部署的特定繩索握法。同樣，網(wǎng)球運動員可能有意識地意識到接近的球，但并未意識到使他選擇扣殺而非截擊的行動選擇過程。

意志行動選擇指的是這樣一種行動選擇類型，其中代理有意識地且主動地意識到某些選擇過程。例如，當(dāng)一個代理在深思熟慮棋盤游戲中最好的一步棋是什么，并反復(fù)斟酌不同的選擇、結(jié)果和陷阱時，他們就是在進行意志行動選擇。通過反復(fù)斟酌不同的可能行動及其結(jié)果，“選項”在當(dāng)前情境模型中被創(chuàng)建出來（Franklin et al., 2016）。這些選項可以變得有意識并進入程序性記憶，程序性記憶隨后可能基于這些選項實例化行為。行動選擇隨后可以從這些行為中進行選擇。因此，意志行動選擇的第一部分是有意識的，而第二部分是無意識的（意識廣播正在被利用，但代理并未意識到行動選擇模塊中發(fā)生的過程）。事實上，在任何行動選擇模式中，代理都無法意識到行動選擇模塊內(nèi)部正在發(fā)生什么——該模塊只是持續(xù)地執(zhí)行其工作。簡而言之，在意志行動選擇期間，代理意識到他們正在權(quán)衡的選項，但并未意識到行動選擇“內(nèi)部”正在發(fā)生什么。

警報是從未意識的過程，它們繞過全局工作空間中的競爭。如果某個對象或事件被感知聯(lián)想記憶識別為警報，該對象或事件將被直接發(fā)送至程序性記憶以實例化圖式。與警報內(nèi)容相關(guān)的行為在行動選擇中被賦予高激活值，通常被選中并立即傳遞給感覺運動記憶——感覺運動記憶反過來將運動計劃傳遞給運動計劃執(zhí)行。簡單來說，許多代理都有過在警報情況下行動的經(jīng)歷，并且只在事后才意識到他們的行動。例如，對于許多人來說，一只大蜘蛛爬在手臂上會導(dǎo)致一系列刷拂、跳躍和痙攣反應(yīng)，他們只在事后才意識到威脅。同樣，在駕駛中，許多司機體驗到對危險情況的反應(yīng)速度快于或等于他們有意識地意識到情況的速度。注意此處，警報既可以是像蜘蛛例子中那樣的先天性的，也可以是像駕駛例子中那樣由文化決定的。

行動選擇的最后一種模式是自動化行動選擇。自動化行動是過度學(xué)習(xí)的行動，其中一個行動可以被視為調(diào)用下一個行動。自動化行動的選擇是無意識地進行的，也就是說，選擇不一定需要來自意識廣播的內(nèi)容。這些通常是那些已經(jīng)反復(fù)練習(xí)過的行動，它們可以在沒有意識思考的情況下執(zhí)行。例如，在空曠的人行道上行走是典型的自動化行動。它只需要很少的注意力，代理可以同時專注于其他事項。在本文中，我們將在"LIDA 中的流暢應(yīng)對”部分詳細討論自動化行動選擇。

雖然我們在"LIDA 中的流暢應(yīng)對”部分會詳細討論自動化，但值得在此注意自動化行動選擇與警報之間的一個核心區(qū)別。警報行動一旦執(zhí)行完畢就會恢復(fù)到正常功能，并且不要求進一步的行動。通過這種方式，警報是對代理正在進行的任何事情的暫時中斷。另一方面，自動化行動不會中斷系統(tǒng)內(nèi)的正常過程，也不會優(yōu)先于正常過程。此外，自動化行動指定哪些行動將從自動化行動選擇模塊內(nèi)隨后進行（關(guān)于此更多內(nèi)容見"LIDA 中的流暢應(yīng)對”部分）。

雖然在人類看來，這個整個過程，從程序性記憶開始，經(jīng)過行動選擇、感覺運動記憶，最后到運動計劃執(zhí)行，可能顯得漫長且費力，但重要的是要記住這個過程極其迅速。每個認知周期通常發(fā)生在幾百毫秒之內(nèi)（Madl et al., 2011）。因此，當(dāng)處理快速動態(tài)行動時（正如流暢應(yīng)對中經(jīng)常發(fā)生的那樣），重疊的認知周期足夠迅速，足以進行調(diào)整并即時行動。此外，我們必須記住，運動計劃執(zhí)行與所有其他系統(tǒng)并行運行，允許對進行中的運動計劃進行無意識調(diào)整。此外，LIDA 感覺運動系統(tǒng)基于 Brooks 的包容架構(gòu)（Brooks, 1991），允許代理與世界進行快速交互。

同樣，類似于生成式和預(yù)測性處理的心智方法，LIDA 代理始終處于適應(yīng)性行動的過程中；我們可以說，LIDA 代理始終在回答“我接下來應(yīng)該做什么？”這個問題。在 LIDA 中，行動選擇不斷從候選行為中選擇一個行為并將其發(fā)送至感覺運動記憶（除非該行動是進行深思）。這確保了代理始終處于行動過程中，以保持與其環(huán)境的最佳適應(yīng)關(guān)系。

行為流與技能

流暢應(yīng)對涉及“技能”和“最佳把握”（optimal grip）。對一項活動擁有最佳把握，意味著熟練地、流暢且輕松地駕馭該活動（Merleau-Ponty, 1945/2012; Rietveld and Kiverstein, 2014; Bruineberg et al., 2021）。諸如“技能”和“流暢性”之類的概念，通常包括能夠以不間斷的方式執(zhí)行多個行動，并將這些動作鏈調(diào)整以適應(yīng)情境的動態(tài)實時變化和需求（Nakamura and Csikszentmihalyi, 2014）。

在 LIDA 中，技能和流暢性部分是通過行為流來實現(xiàn)的。除了單個圖式外，程序性記憶還包含可以被實例化的圖式流。圖式流是一系列串在一起的動作圖式，可以使用來自一個或多個全局廣播的內(nèi)容集體實例化。整個實例化的圖式流被稱為行為流。一旦行為流被發(fā)送到行動選擇模塊，該模塊可以快速一次選擇一個行為，并將每個行為傳遞給感覺運動記憶（后者反過來將運動計劃傳遞給運動計劃執(zhí)行）。

對于生物代理而言，流暢應(yīng)對通常涉及一系列流暢的行動。例如，運籃球、邁三大步，然后跳起扣籃，可以作為一系列整合的、流暢的動作發(fā)生。此外，人們很少一次只做一件事。因此，LIDA 中的行動選擇過程通常涉及行動選擇模塊從幾個行為流中快速挑選行為。歷史上，在 LIDA 概念模型中，行動選擇一直是一次只選擇一個行動，且僅選擇一個。然而，在生物代理中，物理行動經(jīng)常重疊。因此，在本文中，我們正在增強 LIDA 的行動選擇以支持多個行動的同時選擇。具體來說，除了通過我們原始的行動選擇算法一個接一個地選擇行動外，我們還支持自動化行動的同時選擇。這是通過行動選擇的新自動化行動選擇子模塊實現(xiàn)的。開發(fā)這個子模塊是本文的貢獻之一。

例如，人們可以想象一個（令人難忘的）場景：馬戲團小丑騎著獨輪車，雜耍，同時故意地、瘋狂地大笑，同時表演性地齜牙咧嘴。這樣的表演需要多個熟練行動同時重疊。即使行動選擇被限制為一次只選擇一個行為，這并不意味著先前選擇的行為的執(zhí)行必須是順序的。此外，行動選擇可以從多個并發(fā)行為流中快速選擇行為，并將它們向前傳遞給感覺運動記憶以執(zhí)行。

成為某項活動的熟練代理涉及（除其他外）擁有經(jīng)過微調(diào)、排練良好的行為流和運動計劃模板，這些可以靈活地調(diào)整以適應(yīng)當(dāng)前情境的需求。在 LIDA 中，流暢應(yīng)對的許多“熟練”方面由行動選擇、感覺運動記憶，尤其是運動計劃執(zhí)行處理。當(dāng)行為被發(fā)送到感覺運動記憶時，系統(tǒng)必須創(chuàng)建一個運動計劃——一個高度具體的身體運動計劃。運動計劃指定特定運動命令序列（即運動命令），這些命令指導(dǎo)代理的每個特定執(zhí)行器。這里，執(zhí)行器僅僅意味著代理通過其作用于世界的物理部件之一。例如，工廠機器人可能只擁有一個“手臂”執(zhí)行器。另一方面，人類擁有多得多的執(zhí)行器。

運動計劃及其運動命令通過背側(cè)流對來自感覺記憶的快速傳入數(shù)據(jù)做出反應(yīng)和適應(yīng)（Neemeh et al., 2021），以保證代理的行動與環(huán)境的最當(dāng)前狀態(tài)同步。

通常在流暢應(yīng)對中，當(dāng)代理作用于環(huán)境時，環(huán)境可能會發(fā)生變化。例如，作為一名運動帆船手，涉及在船只被不規(guī)則的風(fēng)和水流碰撞和搖晃時，熟練地操縱船帆。為了在這種動態(tài)情境中熟練地完成運動計劃，運動計劃在代理行動時通過 LIDA 的背側(cè)流不斷對感官信息做出反應(yīng)。一個正在航行的代理可能會發(fā)出一個運動計劃去抓取特定的繩索。然而，當(dāng)他們抓取時，船被一個大浪搖晃。而不是以相同的方式繼續(xù)抓取，通過背側(cè)流實時更新運動計劃確保代理調(diào)整其抓取動作，并仍然成功抓住繩索。

可供性、面向行動的表征和行為流

最近關(guān)于流暢應(yīng)對的研究用可供性，有時是面向行動的表征，闡釋了代理與環(huán)境之間大部分熟練的交互循環(huán)（Milikan, 1995; Clark, 2016; Williams, 2018; Gallagher, 2020; Bruineberg et al., 2021; Kronsted, 2021a）?？晒┬院兔嫦蛐袆拥谋碚魇莾蓚€非常相似的概念?？晒┬酝ǔ１欢x為行動的可能性，這種可能性作為一種關(guān)系存在于受文化熏陶的代理與環(huán)境之間（Gibson, 1979/2013; Chemero, 2009）。重要的是，可供性通常被認為是一個非表征概念。面向行動的表征非常相似——但正如名字所暗示的，它們是一類心理表征。面向行動的表征是那些也召喚或推動代理進入行動的表征（Milikan, 1995; Ramsey, 2007; Clark, 2016; Kirchhoff and Kiverstein, 2019）。

在 LIDA 中，我們通過使用表征性可供性采取了一種中間立場的方法。LIDA 可供性被概念化為系統(tǒng)內(nèi)的表征。關(guān)于 LIDA 代理如何學(xué)習(xí)和使用可供性的最近論述（見 Neemeh et al., 2021）。在此只需說明，隨著 LIDA 代理在各種活動中變得受文化熏陶并接受訓(xùn)練，它們學(xué)習(xí)感知新的可供性，并可以對此做出反應(yīng)。隨著 LIDA 代理獲得更高的技能，其感知系統(tǒng)可以檢測到越來越細粒度的可供性，這些可供性可以納入越來越細粒度的行為流的選擇中。

行動、學(xué)習(xí)、行為流和可供性之間存在著細致的關(guān)系。LIDA 使該模型區(qū)別于其他認知架構(gòu)的方面之一是"L"——學(xué)習(xí)。嚴(yán)格來說，LIDA 代理可以在每個認知周期中“學(xué)習(xí)”新事物。隨著每次全局廣播，幾乎所有模塊都可以用來自廣播的內(nèi)容進行更新，并且每個模塊（包括各種記憶模塊）都可以根據(jù)該廣播執(zhí)行某些功能。例如，感知聯(lián)想記憶可能會建立新的連接，瞬態(tài)情景記憶可能會組合成一個新事件，意識內(nèi)容隊列添加到似是而非的當(dāng)下（specious present），也許程序性記憶開始構(gòu)建一個新圖式，等等。關(guān)于 LIDA 中學(xué)習(xí)的詳細論述（見 Kugele and Franklin, 2021）。

就流暢應(yīng)對而言，隨著 LIDA 代理作用于其環(huán)境，每次廣播后，代理會慢慢變得更加熟悉該環(huán)境和手頭的相關(guān)任務(wù)。這種適應(yīng)包括為這些可供性構(gòu)建更專門化和細粒度的可供性及行為圖式。例如，代理可能對巴西柔術(shù)一無所知，但經(jīng)過訓(xùn)練，對手的不同動作會與行動或反行動的可供性相關(guān)聯(lián)（Kimmel and Rogler, 2018）。對手試圖進行后頸絞殺——提供了將背部平貼在墊子上的可供性。對手在封閉防守期間將體重放在錯誤的位置提供了執(zhí)行腿部三角絞的可供性?？晒┬耘c其相關(guān)的行為圖式之間存在一個良性循環(huán)。流暢應(yīng)對通常是一個擁有細粒度可供性的問題，這些可供性使得使用適當(dāng)細粒度的行為圖式成為可能（見圖 4）。

當(dāng)代理感知到一個事件時，它們也感知到相關(guān)的可供性。如果包含可供性的聯(lián)盟在全局工作空間的廣播競爭中勝出，那么廣播內(nèi)容中可供性的存在將有助于實例化行為圖式，從而也促進在行動選擇中贏得競爭。

如前所述，選擇一個行為（可能來自行為流）也會創(chuàng)建一個期望代碼元，以促進對行為相關(guān)結(jié)果的監(jiān)控。期望代碼元的創(chuàng)建不僅有助于將行動結(jié)果帶入意識，還有助于確保與這些行動結(jié)果相關(guān)的可供性也被有意識地廣播。在一個促進行動的反饋循環(huán)中，對一個可供性采取行動會帶來下一個可供性。這種反饋循環(huán)符合關(guān)于可供性的經(jīng)驗和理論文獻，這些文獻將流暢應(yīng)對概念化為行動與可供性之間的反饋循環(huán)（Di Paolo et al., 2018; Kimmel and Rogler, 2018; de Oliveira et al., 2021; Kimmel and Hristova, 2021; Kronsted, 2021b）。

總體而言，我們看到流暢應(yīng)對不是一個已經(jīng)熟練某項活動的問題。相反，流暢應(yīng)對涉及不斷提高自身技能和適應(yīng)性的能力。在 LIDA 中，這種適應(yīng)性內(nèi)置于跨模塊的信息流中，由意識廣播促進。

當(dāng)然，流暢應(yīng)對不僅關(guān)乎知道“做什么”，還關(guān)乎擁有足夠發(fā)展的感覺運動協(xié)調(diào)性來做到這一點——用外行話說就是擁有正確的運動技能。因此，LIDA 中的技能循環(huán)還包括代理構(gòu)建和完善日益復(fù)雜的運動計劃模板。經(jīng)過許多認知周期，感覺運動記憶被緩慢更新，以便代理（希望）始終處于知道“如何做”的位置，并且具有高度的復(fù)雜性。詳細說明感覺運動記憶如何構(gòu)建和更新運動計劃超出了本文的范圍。重要的要點是，LIDA 代理通過更新其“做什么”的圖式（行為）和“如何做”的計劃（運動計劃模板）來一致地更新其行動能力。

讓我們以變得擅長運動為例——在這種情況下，是足球。通過練習(xí)，足球運動員學(xué)習(xí)感知場地，并根據(jù)不同的機會來看待它。也就是說，球員隨著時間的推移，學(xué)會根據(jù)不同的可供性來體驗比賽，“在這種情況下，我可以長傳，從右邊這個人身邊運球過去，或者短傳回傳?！彪S著時間的推移，球員學(xué)會根據(jù)提供“做什么”可能性（潛在行為）的可供性來看待場地。然而，學(xué)習(xí)利用可供性也是學(xué)習(xí)如何具體利用可供性“如何做”（運動計劃）的問題。因此，通過練習(xí)，代理還通過開發(fā)日益復(fù)雜的運動計劃模板來微調(diào)其身體能力——起初，運球和踢球是笨拙的，但隨著時間的推移，它變得成為第二天性。

自然地，做像專家級足球這樣高級的事情需要多個過程——一些是意識介導(dǎo)的，另一些是自動的。因此，接下來，我們將看看在流暢應(yīng)對期間不同的行動選擇模式是如何交織在一起的，以及自動化行動的作用。

自動化與自動化行動選擇子模塊

流暢應(yīng)對的一個關(guān)鍵方面在于它同時涉及高層和低層認知過程（Christensen et al., 2016; Montero, 2016; H?ffding and Satne, 2019; Gallagher and Varga, 2020）。讓我們回到小丑的例子。那位同時騎著獨輪車、雜耍、咧嘴笑并與選定的觀眾成員交談的小丑表演者，可能會利用意識介導(dǎo)的、完全意識的以及自動化的行動。因此，為了說明流暢應(yīng)對期間行動中這種重疊現(xiàn)象，我們需要看一看 LIDA 代理是如何實現(xiàn)自動化的。自動化行動被實現(xiàn)為行為流中的一系列行為，這些行為已被掌握到這樣的程度，即這些行為可以在沒有意識廣播介導(dǎo)的情況下被選擇——也就是說，自動化行為可以在不需要感官輸入更新的情況下被選擇。然而，這些行為的執(zhí)行可能通常仍需感官輸入（例如通過背側(cè)流甚至意識廣播）。

自動化與自動化行動選擇子模塊

就流暢應(yīng)對而言，代理能夠同時執(zhí)行多個行動往往是重要的（例如，踩踏板和傳球，運球和鏟球，拳擊和格擋，等等）。因此，在本文中，我們向 LIDA 模型引入了一個新的子模塊，即行動選擇的自動化行動選擇子模塊（AAS）。該子模塊與行動選擇并行運行，并反復(fù)將行為發(fā)送至感覺運動記憶（SMM）。例如，在我們的獨輪車小丑例子中，自動化行動選擇可以反復(fù)選擇自動化行為“踩踏板”并將其發(fā)送至 SMM。

擁有一個完全處理自動化行為的子模塊，并能夠反復(fù)選擇此類行為，允許行動選擇并行專注于其他形式的行動選擇，如意識介導(dǎo)的行動選擇或深思。讓我們回到柔術(shù)和三角絞的例子。“三角絞”是一個高層行為，由幾個動作組成（見圖 5）：腿勾、三角勾、手臂勾和擠壓。當(dāng)行動選擇選擇該高層行為時，它將該行為發(fā)送至 AAS 子模塊。從那里，AAS 可以從“三角絞”行為流中的組成行為中進行選擇。簡而言之，行動選擇將高層自動化行為傳遞給 AAS，然后 AAS 從高層行為的行為流中的低層組成行為中進行選擇。能夠并行選擇行動，使得柔術(shù)練習(xí)者能夠仔細閱讀對手的模式，并深思接下來做什么，同時產(chǎn)生復(fù)雜的行為，如“三角絞”（圖 6, 7）。流暢應(yīng)對通常是通過讓自動化行動選擇與其他形式的行動選擇和諧地并行工作來實現(xiàn)的。

自動化行動選擇與行動選擇并行運行，從自動化行為流中選擇行為（例如，行走、踩踏板、運球、演奏一首根深蒂固的歌曲等）。來自所選行為流的每個行為可以被視為在該流中“調(diào)用下一個”行為。因此，一旦選擇了高層自動化行為，其每個低層行為，比喻地說，得以選擇下一個行為是什么。例如，如果一個代理通過自動化行動選擇演奏一首過度學(xué)習(xí)的鋼琴曲（比如 Bent Fabric 的《Alley Cat》），每個音符，對應(yīng)一個低層行為，“調(diào)用下一個”。一旦從"Alley Cat 自動化行為流”中選擇了第一個音符，第一個音符在其完成后選擇下一個音符。這產(chǎn)生了許多音樂家認可的感覺，即樂曲本質(zhì)上在演奏自己。這種一個行動調(diào)用下一個行動的自動化也確保音樂家可以同時唱歌，與觀眾眼神交流，俏皮地抖動肩膀等，所有這些都同時進行。

用 LIDA 術(shù)語來說，自動化行為是“退化”行為流——它們是不包含分支選項的過度學(xué)習(xí)的行動。缺乏分支選項是允許行為直接“調(diào)用下一個”的原因。一個用于踩踏板的高層自動化行為可能包含一個用右腿踩踏板的行為，然后調(diào)用一個用左腿踩踏板的行為——沒有分支選項。

重要的是，自動化行為流也可以是層級結(jié)構(gòu)化的，其中這些流中的每個行為可以對應(yīng)其他行為流。這種能力至關(guān)重要，因為許多行動的規(guī)格受益于層級結(jié)構(gòu)，并且這些高層行為的復(fù)用在記憶中可能更高效。高層行為通常包含必須“對齊”的多個行為流。例如，制作一個魯本三明治需要獲取面包、蛋黃醬、酸菜、咸牛肉和瑞士奶酪，組裝組件，并將它們放在盤子上。這些子行動中的每一個都可以是自動化的，并屬于其自己的行為流。共同地，這些自動化行為有助于實現(xiàn)高層“魯本三明治”行為。

熟食店工人可能會像往常一樣制作和包裝三明治，而不考慮顧客的困難特殊訂單“只加一點蛋黃醬，多加泡菜，加沙丁魚！”以不同方式制作三明治需要意識介導(dǎo)的行動選擇，而非一個行動調(diào)用下一個行動的自動化。這解釋了為何有時即使明確打算做一件事，代理最終卻做了另一件事，因為行動的開端具有自動化性質(zhì)。

值得注意的是，盡管自動化行為沒有分支選項并調(diào)用下一個行動，它們?nèi)匀簧善谕a元。就像 LIDA 中的所有其他行動一樣，期望代碼元的生成允許系統(tǒng)跟蹤其行動的完成情況，以便系統(tǒng)可以知道是繼續(xù)其行為還是切換到其他行為。

當(dāng)自動化行動選擇將自動化行為向前饋送到感覺運動記憶時，該模塊可以實例化運動計劃，這些計劃也指示自動化行動需要執(zhí)行多長時間的“時機”——從而降低“無心”做某事太久的風(fēng)險。在音樂例子中，每個音符的運動計劃被指定非常短且精確的時機。另一方面，自動化“行走”的運動計劃可以在運動計劃內(nèi)具有“直到進一步通知”的時間指定。我們必須記住，雖然自動化通常對專家表現(xiàn)有益，但流暢應(yīng)對涉及交織的行動類型。過度依賴自動化通常會導(dǎo)致任務(wù)失敗。

LIDA 中的流暢應(yīng)對

描述流暢應(yīng)對的一種方式是：使用自動化，并間歇性地使用意識介導(dǎo)的行動（見圖 8），以及其他重疊的行動選擇類型，以實現(xiàn)某個意圖（Kronsted et al., 2021）。代理并非僅僅在進行多任務(wù)處理或僅僅進行自動化。相反，代理的全部或大部分認知過程都連貫地朝向?qū)崿F(xiàn)一個意圖（完成這個困難的食譜、足球動作、穿過交通到達工作地點）。

如果某個事件迫使代理放棄其行動朝向該意圖的連貫性，流暢應(yīng)對過程就會被中斷。例如，騎獨輪車的小丑正在進行流暢應(yīng)對——騎車、雜耍、咧嘴笑和唱歌，所有這些都朝向以迷住的觀眾完成其表演的意圖。然而，如果一個舞臺工作人員突然跑到舞臺上大喊："你必須馬上過來，你妻子要生了，"那么代理的行動就不再指向完成表演這一遠端意圖。流暢應(yīng)對已被中斷。不那么戲劇性的是，如果代理在烹飪時電話響了，如果代理接起電話并關(guān)注電話交談而非爐灶，流暢應(yīng)對就暫時被中斷了。當(dāng)然，一旦代理放下電話，這些過程就可以重新參與。相比之下，如果代理在打電話時繼續(xù)烹飪，則仍可以說該代理處于流暢應(yīng)對狀態(tài)。

雖然我們在此主要關(guān)注感知和行動選擇，而非記憶過程，但 LIDA 中的流暢應(yīng)對是一個跨所有模塊運作的現(xiàn)象。如前文所述，我們在本文中在此向 LIDA 認知架構(gòu)引入了一個新補充——自動化行動選擇子模塊。在本節(jié)中，我們將簡要更詳細地討論不同的行動選擇模式，然后描述它們在流暢應(yīng)對期間交織的性質(zhì)，特別是與自動化行動選擇子模塊相關(guān)的方面。最后，我們提供三個具體案例研究，以展示整個理論框架可能如何展開（見"結(jié)論"部分）。

交織的行動選擇與反饋循環(huán)

我們現(xiàn)在可以看到，LIDA 代理如何在流暢應(yīng)對期間通過行動選擇類型的交織來實現(xiàn)行動選擇——意識介導(dǎo)的行動選擇、意志行動選擇、警報和自動化行動選擇。當(dāng)代理在各種動態(tài)變化的情境中行動時，它們必須部署不同形式的行動選擇以適應(yīng)性地實現(xiàn)其目標(biāo)。例如，代理可能會部署一系列行為和行為流，以仔細操作臺鋸，將木塊雕刻成正確的尺寸。此類行為和行為流可能包括走向臺鋸、抓住木材、仔細將其在臺面上對齊，并將木材向前滑動到鋸上，同時瞄準(zhǔn)以確保直線切割。當(dāng)代理部署這些行為流時，它們也可能會有間歇性的深思時刻，在此期間它們積極思考先切割哪些塊以及如何按正確順序?qū)⑺鼈兌询B起來。代理可能會進一步深思切割的正確尺寸，這反過來將向下傳遞并影響實例化運動計劃的具體細節(jié)以及運動計劃執(zhí)行中的行動執(zhí)行。

由于我們例子中的代理非常擅長木工，他們經(jīng)過多年練習(xí)開發(fā)了用于操作臺鋸的自動化行為流和高度復(fù)雜的運動計劃模板。因此，代理主要通過自動化行動選擇來操作鋸。也許當(dāng)代理操作臺鋸時，他們的手指危險地靠近刀片，系統(tǒng)中觸發(fā)警報將手向后拉。重要的是，當(dāng)警報使代理能夠繼續(xù)預(yù)期活動時，它們是流暢應(yīng)對流程的一部分。因此，在臺鋸例子中，阻止代理切斷手指的警報自然允許代理繼續(xù)該活動。然而，將大蜘蛛從手上甩掉的警報并不會延續(xù)預(yù)期活動，并且通常會打破流暢應(yīng)對。在此提出警報的原因是為了強調(diào)警報通常必須被學(xué)習(xí)，并且通常是特定于技能和情境的。例如，在巴西柔術(shù)的情境之外，得到一個漂亮的下勾抱是甜蜜且令人安慰的。然而，在柔術(shù)情境內(nèi)，這意味著練習(xí)者即將被掃倒并可能輸?shù)舯荣?。因此，可能會觸發(fā)一個特定于情境的警報，使練習(xí)者收回手臂并試圖夾緊腋窩（以拒絕對手的下勾）。警報通常是掌握技能的組成部分，因為它們迅速且繞過意識廣播的競爭。

讓我們回到我們的臺鋸例子。在多年練習(xí)的某個時刻，操作臺鋸已變得自動化；選擇木塊、在臺面上準(zhǔn)備它們以及執(zhí)行切割現(xiàn)在由自動化行為流完成，其中一個行動調(diào)用下一個行動。通過這種方式，代理可以反復(fù)一次又一次地選擇相同可靠的行為流，直到工作完成。自動化允許在自動化行動展開的同時并行選擇其他行動（通常是意識介導(dǎo)的或深思的行動）。工人可以操作臺鋸（得益于自動化行動選擇子模塊），同時大聲呵斥其學(xué)徒糾正姿勢、給他們端咖啡，或者深思對于需要不同技術(shù)的困難木塊使用哪種技術(shù)。

總的要點是，LIDA 中的流暢應(yīng)對涉及部署各種形式的行動選擇，每種形式都針對手頭的任務(wù)。無論是警報、意識介導(dǎo)的行動、深思行動還是純自動化行動，每個被選擇的行為都連貫地朝向以適應(yīng)性的方式完成代理的目標(biāo)。

在此關(guān)頭，我們不能忘記流暢應(yīng)對涉及代理的行動與環(huán)境變化之間的多個反饋循環(huán)。例如，跟在一輛車后面駕駛同時試圖閱讀車上有趣的保險杠貼紙，涉及必須與該車輛保持正確的距離范圍。太遠則無法閱讀貼紙，太近則車輛可能相撞——代理必須保持“最佳把握”（Merleau-Ponty, 1945/2012; Dreyfus and Wrathall, 2014; Bruineberg et al., 2021）。如前所述，運動中感官信息的快速背側(cè)流更新會更新行動中的運動計劃執(zhí)行，以便代理在行動期間能與環(huán)境保持最佳關(guān)系。LIDA 代理的行動與背側(cè)流信息之間存在持續(xù)的反饋循環(huán)。

此外，隨著每個行動，也會生成一個期望代碼元。如前所述，此類代碼元掃描當(dāng)前情境模型，尋找與代理行動預(yù)期結(jié)果相關(guān)的對象和事件。由期望代碼元帶入全局工作空間的結(jié)構(gòu)通常具有高度顯著性，并且非?？赡苴A得意識廣播的競爭。以這種方式，代理的行動與其期望之間存在一個反饋循環(huán)。通過行動與高激活結(jié)果之間的反饋循環(huán)，LIDA 代理可以在動態(tài)情境中與其活動的展開保持仔細協(xié)調(diào)。我們看到，與代理行動同時發(fā)生的是對這些行動結(jié)果的注意，這反過來有助于確定預(yù)期活動的完成。這是對行動結(jié)果的注意偏向，這反過來有助于延續(xù)預(yù)期活動的完成。

最后，認知周期通常通過學(xué)習(xí)協(xié)助增加適應(yīng)性。LIDA 代理可以在每個認知周期更新其記憶模塊（Kugele and Franklin, 2021）。通過這種方式，代理總是緩慢但肯定地使其自身朝向更大程度的適應(yīng)性移動。

通常，我們可以想到至少三個幫助 LIDA 代理進行流暢應(yīng)對的反饋循環(huán)——一般認知周期（遠端時間尺度上的適應(yīng)性）、行動注意循環(huán)（近端時間尺度上的適應(yīng)性）和行動背側(cè)流循環(huán)（快速時間尺度上的運動適應(yīng)性）。簡而言之，認知周期有助于較長時間內(nèi)的任務(wù)適應(yīng)性。意識介導(dǎo)的行動選擇有助于代理當(dāng)前情境中的適應(yīng)性。自動化、運動計劃和背側(cè)流負責(zé)快速的瞬間適應(yīng)性（見圖 9）。

我們已經(jīng)探討了不同形式的行動選擇，以及它們在流暢應(yīng)對期間如何交織朝向任務(wù)的完成。我們也探討了伴隨這些各種形式行動選擇的不同反饋循環(huán)，以及這些反饋循環(huán)如何幫助代理在不同時間尺度上適應(yīng)任務(wù)。

在我們的討論中，我們將把迄今為止所探討的所有內(nèi)容應(yīng)用于三個小型案例研究，以觀察流暢應(yīng)對如何在每種情境下的 LIDA 代理中展開。我們從相對簡單的行走例子開始，逐步提升到駕駛，然后是快餐烹飪。

獨自行走

薩姆（Sam）早上 5:00 起床，在謝爾比農(nóng)場公園（Shelby Farms Park）進行日常散步。這條小路是環(huán)繞湖泊的一英里環(huán)路，清晨時分意味著同時散步的人非常少。

薩姆的系統(tǒng)利用了行走的自動化行為流。當(dāng)小路圍繞湖泊略微彎曲時，感覺記憶更新薩姆的運動計劃和運動命令，以便薩姆調(diào)整其身體方向、每一步的高度和長度，以及在非常易行的平坦地形中移動所需的其他微小調(diào)整。路面高度的微小差異意味著有時薩姆的感覺記憶必須更新其踏步運動命令，使其稍微更長、更高一些。

由于這主要是自動化的問題，薩姆可以讓他的思緒漫游，并積極思考生活中其他需要深思的事情（我應(yīng)該加入比特幣熱潮嗎？《魷魚游戲》真的那么好看嗎？我的人生在做什么？）。鑒于地形中沒有障礙物，薩姆的系統(tǒng)可以簡單地繼續(xù)選擇和執(zhí)行自動化行走行為。然而，沒有任何自動化行為是無限期的，薩姆確實仍需定期檢查障礙物。因此，薩姆仍然頻繁地看向前方道路并重新選擇自動化行走行為。

最終，薩姆注意到一個行人和他們的狗正在靠近。這個人和他們的狗贏得了意識競爭，薩姆的行動選擇現(xiàn)在在多個候選行為之間進行選擇（而自動化行動選擇則確保薩姆仍在行走）。在行動選擇中，走到草地上或站立不動讓狗和主人通過是兩個最顯著的選項。站立不動在行動選擇的競爭中勝出，薩姆讓這個人及其狗在狹窄的小路上通過。選擇這個行為也中斷了自動化行走行為。一個期望代碼元被生成，除其他外，尋找一條清晰的行走路徑，因為這是薩姆行動預(yù)期結(jié)果。當(dāng)狗和主人現(xiàn)在位于薩姆身后時，當(dāng)前情境模型繼續(xù)更新。然后，期望代碼元將空路徑結(jié)構(gòu)帶入全局工作空間以競爭廣播。由于薩姆打算行走并期望擁有一條清晰的路徑，該結(jié)構(gòu)具有高激活值，并可能贏得意識競爭。

由于空路徑進入意識，程序性記憶實例化相關(guān)圖式，包括一個高層"行走"行為。該行為及其行為流被發(fā)送到行動選擇。行動選擇選擇高度相關(guān)的自動化"行走"行為并將其發(fā)送至自動化行動選擇子模塊。結(jié)果，薩姆繼續(xù)行走，由自動化行動選擇子模塊負責(zé)選擇行動?，F(xiàn)在，他再次可以自由地繼續(xù)思考加密貨幣、熱門電視節(jié)目和存在主義。

駕駛

薩姆結(jié)束了他充滿存在主義思考的晨間散步。上午 8:00，薩姆開車去當(dāng)?shù)匾患也宛^上班。路線結(jié)合了郊區(qū)道路和高速公路駕駛，大約需要 20 分鐘完成。部分交通是高峰時段的交通。

薩姆正在利用自動化行為流，以安全距離跟隨他前面的車輛。這當(dāng)然也包括安全距離跟隨的運動計劃，該計劃正在接受持續(xù)的背側(cè)流更新。背側(cè)流輸入到運動計劃確保薩姆不會將油門踏板踩得太重或太輕。在高峰時段交通中以適當(dāng)距離跟隨另一輛車涉及對運動命令的持續(xù)調(diào)整，以向油門踏板施加適當(dāng)量的壓力。

然而，由于這是高峰時段，薩姆也需要經(jīng)常踩剎車，并在適當(dāng)?shù)膲毫ο虏葎x車。這意味著通過意識介導(dǎo)的行動選擇，踩剎車的行為被選擇并在適當(dāng)?shù)膲毫λ缴蠄?zhí)行。因此，薩姆擁有一個自動化跟車行為圖式和運動計劃，該計劃經(jīng)常被踩剎車的意識介導(dǎo)行為所中斷，以保持適當(dāng)距離。每次剎車被踩下時，一個期望代碼元被生成，并幫助車輛之間產(chǎn)生的距離進入意識。車輛之間新的距離被廣播反過來幫助行動選擇要么重新選擇自動化跟隨行為圖式，或者其他一些自動化駕駛行為。

通過意識介導(dǎo)的行動選擇，薩姆決定激活變道的行為流。行動選擇快速地從變道行為流中選擇每個行為。感覺運動記憶為每個變道行為在運動計劃之間進行選擇，運動計劃執(zhí)行開始執(zhí)行物理運動。簡而言之，薩姆變道；檢查后視鏡、側(cè)視鏡、回頭查看、打開轉(zhuǎn)向燈、再次檢查、向左轉(zhuǎn)動方向盤、將方向盤轉(zhuǎn)回中立位置、重新檢查車窗和后視鏡。

突然，一個正在發(fā)短信并駕駛的人偏離車道進入薩姆的車道，觸發(fā)了警報。情況的緊急性意味著車輛的靠近繞過了意識廣播的競爭，并被直接發(fā)送到程序性記憶。圖式被實例化，行動選擇選擇一個適當(dāng)?shù)男袨榱鳎▌x車并轉(zhuǎn)向）。鑒于情況的緊急性，剎車并轉(zhuǎn)向行為流具有非常高的顯著性，并輕松贏得行動選擇中的競爭。感覺記憶選擇適當(dāng)?shù)倪\動計劃模板并實例化它們，薩姆猛踩剎車并將車轉(zhuǎn)向避開魯莽的司機。

由于警報負責(zé)規(guī)避機動，薩姆尚未意識到剛剛發(fā)生了什么。大約 100 毫秒后，在事件在當(dāng)前情境模型中被重建之后，薩姆才"意識到"剛剛發(fā)生了什么。然而，在這 100 毫秒期間，由于警報過程的迅速性，剎車并轉(zhuǎn)向機動已經(jīng)發(fā)生。通過這種方式，薩姆在魯莽司機面前幸存下來。

在警報機動期間，期望代碼元被創(chuàng)建，在當(dāng)前情境模型中搜索規(guī)避機動的預(yù)期結(jié)果——與迎面而來的司機保持安全距離。由于這種事態(tài)獲得，薩姆現(xiàn)在可以使用意識介導(dǎo)的行動選擇，并選擇對分心的司機 aggressively 鳴喇叭——真是開始輪班的絕佳方式。

快餐廚師

薩姆因駕駛遭遇而略顯煩躁地到達工作崗位。他開始他在餐館擔(dān)任快餐廚師的輪班。這家餐館有一個柜臺，快餐廚師在柜臺后面，還有幾張桌子。這家餐館在一天中的最初幾個小時特別繁忙（人們進來吃早午餐和宿醉早餐）。薩姆在那段時間全神貫注于工作，同時處理多個訂單。訂單以快速節(jié)奏涌入，許多客人對他們的菜品要求修改（額外奶酪、不要奶酪、旁邊加巧克力豆煎餅、旁邊加辣醬、用沙拉代替薯條等）。除了制作各種菜單項目外，幾位常客帶著他們的特殊訂單到達，并期望在他們坐在柜臺時得到問候。

讓我們從第一個訂單開始——兩份班尼迪克蛋、土豆和一份哈羅米沙拉（訂單一）。看到訂單紙條后，一個遠端意圖在當(dāng)前情境模型中被創(chuàng)建（完成訂單一）——這個意圖提示關(guān)于哈羅米沙拉、土豆和班尼迪克蛋的信息進入 CSM。首先，意圖（完成訂單一）贏得意識競爭，在接下來的幾個周期中，關(guān)于廚房當(dāng)前狀態(tài)的結(jié)構(gòu)以及包含班尼迪克蛋、土豆和哈羅米蛋信息的結(jié)構(gòu)，各自贏得意識競爭（鑒于認知周期的迅速性，這一切仍然發(fā)生在最初的一兩秒內(nèi)?。?。

此時，關(guān)于廚房狀態(tài)和要做什么的信息現(xiàn)在存在于 CSM 中，并被廣播到程序性記憶。這些信息現(xiàn)在被用于實例化大量的圖式和圖式流。這些候選行為被發(fā)送到行動選擇，行動選擇現(xiàn)在必須選擇"做什么"。在這種情況下，對應(yīng)于水波蛋自動化行為流的高層行動被選擇并發(fā)送到 AAS。AAS 從"水波蛋"自動化行為流中選擇行為并將它們發(fā)送到感覺運動記憶模塊。感覺運動記憶實例化廚師高度熟練的水波蛋運動計劃，并將其發(fā)送到運動計劃執(zhí)行。這個過程繼續(xù)，行為流中的其他行為被自動化行動選擇子模塊選擇，其中每個行動可以被視為調(diào)用下一個行動。因此，薩姆最終利用自動化快速攪拌醋水混合物、打碎雞蛋并將它們撈出來。

當(dāng)薩姆通過自動化水波蛋時，一位?？妥诠衽_旁（大盧）。這位?？偷拇嬖趯λ_姆來說非常顯著，并輕松贏得意識競爭。程序性記憶在接收到全局廣播（包含"常客大盧"的內(nèi)容）后實例化幾種問候行為，其中一種被行動選擇選擇。同時，水波蛋自動化行為仍在被執(zhí)行。換句話說，薩姆現(xiàn)在一只手快速攪拌鍋，另一只手將雞蛋打入鍋中，同時將身體朝向顧客，說道："嘿伙計，最近怎么樣？"

大盧試圖隔著柜臺與薩姆握手問候。但由于薩姆雙手占滿，他需要使用補償性行為。伸出的手進入意識并實例化幾種可能的候選行為——其中一種行為是用肘部完成問候。選擇這個行為意味著實例化一個運動計劃，該計劃也考慮到薩姆仍在通過自動化攪拌鍋并打雞蛋。當(dāng)薩姆將肘部伸過柜臺以便大盧可以與他的肘部擊掌時，薩姆用于攪拌和打雞蛋的運動計劃可以通過背側(cè)流信息和/或后續(xù)的意識廣播進行大幅調(diào)整。

當(dāng)雞蛋即將完成時，一個新訂單進來：法式吐司和炒雞蛋，配一份培根（訂單二）。這個事實進入意識并為訂單二創(chuàng)建一個遠端意圖，該意圖被存儲在薩姆的瞬態(tài)情景記憶以及當(dāng)前情境模型中以備后續(xù)檢索。一旦薩姆完成訂單一，他就可以關(guān)注并處理訂單二。然而，此刻薩姆仍需組裝訂單一。訂單二的意圖贏得意識競爭，該意圖在整個模型中被廣播，包括各種短期和長期記憶模塊（薩姆現(xiàn)在處理的是當(dāng)前情境模型中存在的兩個遠端意圖）。

然而，薩姆仍在處理訂單一。因此，薩姆現(xiàn)在使用意識介導(dǎo)的行動來仔細組裝訂單一的班尼迪克蛋（他需要抓取并組裝英式松餅、火腿、水波蛋和荷蘭醬）。鑒于廚房里有幾位廚師，薩姆不必從頭制作所有東西（例如，一名工人在醬汁站，另一名在肉類站）。然而，薩姆確實需要知道每個組件的位置以及他同事的位置和活動。這些信息在薩姆的當(dāng)前情境模型中更新，包括環(huán)境中的可供性。例如，如果荷蘭醬鍋的蓋子蓋著，醬汁就無法傾倒。然而，如果蓋子傾斜，薩姆從根深蒂固的機構(gòu)知識中知道他的同事已完成醬汁工作。在這種情況下，鍋因此提供了"可傾倒性"，薩姆利用該信息執(zhí)行一個意識介導(dǎo)的行動，將一些醬汁倒在雞蛋上。

當(dāng)薩姆組裝班尼迪克蛋、倒醬汁并調(diào)整裝飾時，他將菜肴的當(dāng)前狀態(tài)與班尼迪克蛋通常應(yīng)該是什么樣子的長期記憶進行比較——呈現(xiàn)效果是成功的一半。此外，當(dāng)他向菜肴添加每個組件時，期望代碼元持續(xù)保持他的注意力在軌道上。

薩姆將完成的菜肴放在服務(wù)臺上供服務(wù)員取走，并開始訂單二，此時訂單三、四和五也陸續(xù)到達。當(dāng)薩姆使用自動化行動制作更多雞蛋、翻炒煎土豆或攪拌時，他也在跟蹤每個訂單，行動選擇反復(fù)發(fā)送新的行為向前推進。在自動化行為與意識介導(dǎo)行為之間持續(xù)舞蹈的間歇，薩姆可能需要進行深思。例如，薩姆應(yīng)該處理訂單五而不是訂單四，因為訂單四的所有原料尚未準(zhǔn)備好？一個觀念運動過程開始，包含提議者、支持者和反對者。"不，讓我們按先來先做的順序處理菜肴。那樣最簡單""是的，讓我們把訂單四擱置，以便在等待三文魚完成烹飪時處理我們能處理的訂單。"即使薩姆在積極深思，他仍在執(zhí)行自動化行動和意識介導(dǎo)的行動。最終，在三文魚烹飪期間跳過訂單四贏得了深思過程，行動選擇選擇與制作訂單五相關(guān)的行為。

下午 4 點左右，早午餐高峰終于結(jié)束，薩姆可以掛起圍裙回家。真是忙碌的一天！

結(jié)論

流暢應(yīng)對是高技能活動（如體育和表演）中的常見現(xiàn)象，但也存在于我們?nèi)粘?dǎo)航世界的生活中。流暢應(yīng)對通常涉及認知活動朝向某個任務(wù)或活動的連貫性和集中性（這通常是高度文化決定的）。

學(xué)習(xí)智能決策代理（LIDA）代理通過交織幾種形式的行動選擇來參與流暢應(yīng)對，包括：意識介導(dǎo)的行動選擇、意志行動選擇、警報和自動化。自動化是過度學(xué)習(xí)的行為流，允許在沒有意識干預(yù)的情況下選擇行為；概念上是一個行動調(diào)用下一個行動。這些自動化也促進了自動化行動執(zhí)行的并發(fā)性。自動化行為流不僅可以并發(fā)執(zhí)行，而且也可以是層級結(jié)構(gòu)化的。流暢應(yīng)對通常涉及將注意力和適應(yīng)性偏向任務(wù)，以便代理能夠在各種情境中獲得最佳把握。

LIDA 模型包含跨遠端、近端和快速時間尺度的各種反饋循環(huán)，以幫助代理實現(xiàn)適應(yīng)性。符合最近具身和生成式的認知方法，LIDA 代理始終在回答"我接下來應(yīng)該做什么？"這個問題。通過交織的行動和感知循環(huán)，代理追求其議程，并在此過程中在不同時間尺度上達到更高程度的適應(yīng)性。

流暢應(yīng)對文獻以及我們在 LIDA 中對流暢應(yīng)對探索的一個優(yōu)勢在于，專家行動和日常生活都利用相同的認知資源，因此我們可以在不使用任何額外"特殊"認知資源的情況下，清晰地描繪從新手到專家的進展。事實上，從流暢應(yīng)對的文獻以及我們在 LIDA 中對流暢應(yīng)對的概述中，我們可以體會到專家表現(xiàn)和日常認知中所涉及的復(fù)雜性。盡管流暢應(yīng)對執(zhí)行起來看似輕松，但它對任何認知系統(tǒng)（無論是人工的還是有機的）而言都是一項巨大的成就。

原文鏈接：https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.