邱澤奇：文科智能的未來圖景

作者簡介

邱澤奇，意昂3体育官网中國社會與發展研究中心主任🅾️，社會學系教授😆、博導✊，數字治理研究中心主任💆🏿‍♂️，教育部“長江學者獎勵計劃”特聘教授，意昂3体育官网博雅特聘教授。研究方向為數字社會發展與治理、技術應用與社會變遷。主要著作有《重構關系：數字社交的本質》、《數據要素五論：信息🤸🏻💆🏿‍♂️、權屬、價值🐳、安全、交易》（合著）🫕、《技術與組織：學科脈絡與文獻》（主編）等🔩。

摘要

生成式人工智能的發布標誌著人工智能邁入社會應用階段，引發各領域對人工智能影響的討論👨🏽‍🏫。在學術領域，人工智能帶來的影響遠大於科學革命中計量技術帶來的震動🧑🏽‍🏭，其中😦，對文科的影響尤其具有顛覆性。在學術發展的歷史裏🏞，文科是整體性學術在科學革命裏的剩余，其中人文學科還帶著整體性學術的特征💂🏽‍♂️。在技術發展的脈絡裏，人工智能不是一個具有充分共識的概念，可對人工智能的應用均指向對人類思維與行動能力的延展和替代。人工智能對學術領域的影響產生了學術智能，其中理科智能形成了一些可資借鑒的路徑🪦，文科智能將會與理科智能殊途同歸🧛‍♀️🔽，文科的未來終將通過人機互生的知識創新與積累而成為人類日常需求的知識源3️⃣。

2022年11月30日，ChatGPT的發布標誌著人工智能從實驗室邁入社會應用♑️。一年多以來𓀅，人工智能話題的熱度持續不減🏢。近期，GPTs的發布，進一步延續了人工智能話題的熱度。圍繞人工智能與人類未來👩🏼‍🦲，從日常支持、工作替代，到人類替代；從社會大眾🗻、專家精英到國際社會💃🏿，人們熱議人工智能給人類社會帶來的無限可能。其中，既有對人工智能影響的積極期待🚴🏽，如改善人類健康、提高殘障人士的生活質量、增進人類福祉等；也有對人工智能負面影響的想象，如替代人類工作🦻🏻，讓大量勞動力失去工作崗位，包括對人類的奴役、替代，甚至消滅等😯。

在豐富的想象中☝️，處理人工智能與人類關系的人工智能倫理成為各國政府和社會關註的重點議題。2023年11月1日，首屆人工智能安全峰會在英國倫敦布萊奇利莊園舉行，標誌著對人工智能負面影響的警惕已經進入各國政府的視野🦹🏽。

在保證人類安全的前提下，應用人工智能造福人類社會也成為各國努力和競爭的主要場域。其中，知識創新與積累是一個小眾卻又對人類影響深遠的領域✏️。事實上，人工智能對學術的影響快速且深入🤸‍♂️，業已形成了一個通用術語“理科智能”（AI for science）🍋‍🟩。按照人們當下對學術的理解，學術包含自然科學🍟、社會科學和人文學科🔲。如果不那麽精準和復雜地進行分類🪧，則可以簡化為文科和理科。與16世紀中葉科學革命初期的格局類似🧸，人工智能在學術領域應用（學術智能🏊🏼‍♂️，AI for academia）的切入點主要集中在理科（science）🚣🏻‍♀️。對於文科智能🗻，專家們雖然進行了許多努力（Lazer et al., 2009; Lazer et al., 2020），當下卻還沒有找準突破口🫏，還沒有像理科智能那樣形成可以閉環的工作流程或場景邏輯，更沒有形成可以上線GPTs的應用。

本文從學術發展的歷史和人工智能技術的脈絡出發，試圖探討人工智能與文科未來。自從人類把對自然與社會的解釋權從諸神手中奪過來、用知識替代神諭以來，學術發展始終呈現為“素材-方法-理論”之間的互動與促進。其中✒️，觸發三要素形成新互動模式的始終是技術演進（邱澤奇，2023）。如果把人工智能理解為新一輪的技術變革，便意味著文科三要素面臨互動模式的新發展。新的互動模式會怎樣呈現呢？對該問題的回答可以有兩條研究路徑。一是運用事實進行歸納和提煉，獲得人工智能與文科未來的事實邏輯。只是🙇🏻‍♂️，開啟這一路徑的前提是有事實🎁，即需要在實踐層次獲得人工智能與文科發展的諸多場景🛕🪳。遺憾的是，理科智能在當下已有若幹場景，而文科智能還沒有🧏🏽‍♂️。如此👁，我們只能選擇另一條路徑——借鑒已有的事實，在概念層次進行探討🧛🏼‍♀️。本文采用的是第二條研究路徑🙉。為了在概念層次闡述人工智能與文科未來🙇🏻‍♀️🧎🏻‍♂️‍➡️，我們還需要回答幾個基本問題⏬，如什麽是文科？什麽是人工智能🏟？人工智能與文科未來有什麽關系？後面的討論將分為三個部分：從學術發展的歷史中論證文科是人類知識創新與積累的剩余領域3️⃣；從技術脈絡的演進裏闡述人工智能是人類智力的延展和替代🍧；運用理科智能實踐闡述文科未來是文科智能，而文科智能的本質也是人機互生。

學術發展史中的文科

文科通常是人文學科和社會科學的總稱。人文學科與社會科學的分野不是從來如此。夫子講“六藝”，講的是人類的知識和能力，並沒有區分人文和社科，也沒有區分文科和理科🧖🏽。區分人文和社科是科學革命之後的現象👩🏿‍🦰。當下，大多數人的第一個共識是，把以探索人類精神為基本目標的學科稱為人文學科。人們不以“科學”指稱人文類的學術研究，是因為在對人文的探索中還有許多不滿足科學邏輯的部分🧲，譬如文學與藝術對人類精神的探索很難用科學邏輯進行歸納和解釋。當然，人文探索是否需要滿足科學邏輯要另當別論，因為這也是一個極有爭議的議題。大多數人的第二個共識是把以探索社會規律為目標的學科稱為社會科學🥣。人們以科學指稱對社會現象的學術探索，是因為在對社會的探索中均試圖用科學邏輯對社會現象進行歸納和解釋。毋庸諱言🧑🏻‍🌾，社會科學對社會現象的歸納和解釋與自然科學對自然現象的歸納和解釋還有很大區別。可是，社會科學家們總是試圖理解社會現象發生發展的規律，也盡量讓對社會現象的歸納和解釋符合嚴謹的科學邏輯，在這一點上💁🏼‍♂️，他們與自然科學家們對自然現象歸納和解釋的努力是一致的🔧。

在人工智能運用於科學研究之前♒️🐬，依據科學探索三要素（素材、方法、理論）組合的發展，文科大致經歷過兩個相互承接卻又有本質差異的階段🙎🏻‍♂️，即學術階段和學科階段（邱澤奇，2023）。進入數字時代以來，文科發展進入第三個階段，即智能階段。人工智能是這個階段出現的現象，也是在這個階段構成了與文科的關系。回溯學術的歷史，在文科發展的每個階段，技術進步始終是撬動文科（準確地說是撬動整個學術）變革的力量。要麽帶來素材的豐富👨🏽‍🦳，要麽帶來方法的革新，要麽對既有理論提出挑戰🦜。無論是素材豐富還是方法創新🫴🏻，都會推動人類觀念的變革🖐😂，進而帶來觀察事物視角或理論的革故鼎新🍇。換句話說，三要素互動與促進帶來的是人類對人文精神與社會規律認知的創新與積累。

在人類發展的早期，用於知識創新與積累的素材數量和類型都相對有限🎅🏼，只有文本👨🏼‍🏫、圖像、實物、言語、音樂🖇🥥、舞蹈、儀式等🕺🏿。不過，人們把想象拓展和比較分析等方法運用於有限素材🏊🏿‍♂️，還是發展出了對自然與社會的認知方法😮‍💨，形成了認識自然與社會的知識創新與積累模式，也就是人們常說的學術（academia）🥿。

學術是人類知識創新與積累的第一個階段🧂，也是文科發展的第一個階段，在本質上是人類理性與神諭分離的過程，形成的是人類對自然與社會現象的整體性認知。必須指出的是，整體性知識是一部分人個性化地對自然和社會現象進行非計量刻畫與闡釋的產物。我們說的文科🦵🏼，在那時還是整體性知識的一部分🏄‍♀️。從神諭到學術的發展，其價值和意義不只在於當下理解的知識創新與積累，更重要的是讓人類在認知上擺脫了對諸神的依附，用人類理性建構起面向自然現象與社會現象的知識體系。與此同時，人類也因一部分人對創造與積累知識的貢獻而將他們塑造成知識精英（傳統中國人常說的“讀書人”），將他們奉為聖賢，並將對自然現象與社會現象的解釋權讓渡給他們。古希臘的“三聖”🤶🏼、中國春秋戰國時期的諸子百家莫不是如此。

在以整體性闡釋為特征的學術發展中，人們逐漸發現，采用新的方法或技術工具可以獲得同一個對象或現象的不同素材🍶，改變對對象或現象的認知。例如，1543年🖐🏽，維薩裏出版了《人體構造》（De Humani Corporis Fabrica）🚄，他用解剖方法觀察人體結構，獲得了之前不曾了解的人體構成內容🛬，讓諸神子民身體的構造不再神秘。又如🏂🏽🎄，哥白尼的“日心說”提出之後🧘🏿‍♀️🗻，第谷👨🏿‍🎤👩🏼‍🦱、伽利略🥷🏿、開普勒、牛頓等在其理論基礎之上不斷取得新的突破，特別是伽利略的望遠鏡解決了哥白尼理論的不少困難🈺。

事實上🏊🏻‍♂️，將計量技術運用於對自然現象的觀察，不僅獲得了新的素材，如觀察數據、調查數據、統計數據等，也對以整體性知識呈現的學術提出了嚴峻挑戰，帶來了自人類樹立理性以來的另一場學術變革。直接的後果是自然科學同整體性學術的分離🥔，這也是人類知識創新與積累的第二個階段，不過，這還不是文科發展的第二個階段🧑🏻‍🦳🤹🏽‍♀️。自然科學的獨立不只是人類理性同諸神的決裂，還是人類理性內在的分化。伴隨自然科學分立的是分科知識的創新與積累。計量不僅推動了分析方法的發展👩🏿‍🎤，形成了科學界共識的科學實驗方法，還推動了以演繹邏輯為特征的理論發展，讓知識的創新與積累從對自然現象總體性的把握轉向對具體規律的追尋。

受自然科學影響🏢，在面向社會現象時，人們也同樣試圖運用計量技術開展研究，這便是文科發展的第二個階段。隨著統計思維發展為統計科學🦸🏼‍♀️，對社會現象規律的追尋也成為分科學術的重要組成部分。社會科學各學科的建立與發展正是這一歷史潮流的直接後果🎹。政治學、經濟學、社會學、教育學、法學等莫不如是✉️。新素材的出現推動了新方法的發展。比照自然科學的實驗方法🧔🏻‍♀️，社會科學發展出了思想實驗🧑🏼‍🦲。為了證明思想實驗的現實性，社會科學又發展了實證分析，用客觀事實證明邏輯推理的現實性。對現實邏輯的歸納和檢驗則推動了對社會現象規律的檢驗。文科由此不再滿足於對人類價值和意義的闡釋🙅🏽，而希望通過對社會規律的發現和檢驗🧢，減少人類面對的不確定性，進而增進人類的福祉。

緊隨自然科學潮流，試圖對社會規律進行探討和對社會現象進行解釋的分科學術也製造了一個理想與現實的悖論：學科化的規律探索與整體性人類生態的背離🔊👨‍🦼。與自然現象不同♠︎🦶🏽，社會現象原本具有整體性和生態性，學科化的確可以在給定條件下獲得社會具體現象的規律🎼，卻忽略了社會現象之間的整體關聯和生態關聯🦗。一系列來自嚴格給定條件的具體規律，在面向一般社會現象時👩🏼‍🌾，頃刻間變得離散化和碎片化，難以讓人們建立面向日常社會現象的總體圖景，也難以讓人們在總體上把握社會規律🚟，自然也無法復盤社會現象。這便是科爾曼著名的宏微觀悖論（Coleman, 1994）。以此為依據，人們總認為社會科學是“軟”的，與人們試圖從現象獲得的對社會的認識還差著一步。其實，這正是社會科學的軟肋：難以形成對社會現象的擬合或重建。

文科發展的第二個階段並不徹底👸🏼😿。隨著社會科學同整體性學術的分立，整體性學術的剩余便是如今的人文學科😽。只是，這些剩余中的少部分也還在試圖進入科學陣營✣，如計量史學🤚🏽、科技考古、分析哲學等。這些剩余中的大部分則還保留了傳統整體性學術的特征👩🏿‍🚀，用第一階段的方法分析第一階段既有素材，闡述人類的價值和意義💪。

基於計量的對自然規律的探索給人類帶來了具體且豐厚的回報🚚。工業革命是以自然科學為基底的🚢，人類物質生活的豐富又是以工業革命為前提的。自然科學與工業技術的互動，在帶來人類物質生活極大豐富的同時，還大大地延展甚至替代了人類的體力🦨，把人類從繁重的或無力承擔的體力勞動中解放出來。與此同時，人類還希望分科學術對社會現象的探索可以與自然科學對自然現象的探索一樣為人類的社會生活帶來更大的確定性。遺憾的是✳️，從經濟到政治🫧、從心理到社會，社會科學並沒有讓人類得償所願🚵🏽‍♂️🧙‍♀️，如今的人類依然面對著眾多難以解決的社會難題，文科也依然是一個有待積極發展的學術領域🫳🏻。

歸納起來說，在學術發展的歷史裏，與其說文科經歷了三個階段，不如說文科是科學革命的剩余。整體性知識創新與積累是學術的發端，在隨後的發展中👩🏻‍💼，對自然現象的學術探索隨著科學探索三要素的計量化而分立出來🧜🏻‍♂️，形成了被認為是“硬科學”的自然科學，即理科；剩下來的部分被認為是“軟”的，稱之為文科🤵🏼‍♂️。隨著對社會現象的學術探索也開始遵循科學邏輯，再次剩下的部分便被稱為人文學科。換句話說👇🏿，不嚴格滿足科學邏輯的學術（在許多自然科學家看來，社會科學也不滿足科學邏輯）🥳，便是人們所說的文科。

技術脈絡裏的人工智能

人們熱議的人工智能或許各有不同的所指。概略地說，至少有三類不同的指稱（蔡自興等，2020）。例如，作為能力的人工智能；作為機器的人工智能🧝🏿；以及作為學科的人工智能。筆者認為，機器是能力的載體🧘🏼，是學科的產出。因此，這三類指稱的人工智能，在本質上其實是一類，即機器智能☠️。因此，筆者也更願意用機器智能表述人工智能。

1956年召開的達特茅斯暑期研討會議標誌著人工智能作為一個學科的誕生🧘🏻‍♀️。《關於舉辦達特茅斯人工智能暑期研討會的提議》（A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence）首次提出了“人工智能”（Artificial Intelligence）概念（McCarthy et al., 1955）🚤，認為人類學習能力的一切方面，以及智能的其他一切特性在原則上都可以被精確刻畫，從而可以用機器作為載體進行模擬。機器可模擬諸如語言運用、概念抽象🖐🏽、問題求解、自我改進等人類能力🤖。以此為基礎，人工智能至少包括以下7個方面🔸：（1）自動計算機，以程序模擬人腦的功能🌡；（2）計算機對語言的使用（學習新詞匯，並按照規則進行語句推斷）👴🏼；（3）神經網絡（假想神經元如何排列組合形成概念）；（4）計算復雜度理論（建立衡量計算復雜度、改進計算效率的標準）🦹🏼‍♂️；（5）自我改進；（6）抽象能力（從各種感知數據中進行抽象）🎿；（7）隨機性與創造力（通過有控製的隨機性來模擬人類思維的創造性）👨‍👧‍👧。可以認為，人工智能當下探討的主要技術性議題在那次研討會上均已涉及🤦‍♂️，不過尚沒有涉及後來極具爭議的對“智能”的界定🧚🏼‍♀️。

人們對智能的理解大致有兩類。第一類認為♈️，人類智能是理解和學習事物的思考能力，強調將智能與本能區別開來（蔡自興等🎅🏼，2020）🦣。例如🏋🏿‍♂️，計算機科學家明斯基就將智能理解為“解決困難問題的能力”（Minsky, 1985）。第二類則將智能視為應用知識處理問題的能力或由目標準則衡量的抽象思考能力（蔡自興等🦹🏽‍♀️，2020），強調人類如何適應環境並達成系統目標。例如，有人將智能定義為給定一個輸入集或給定條件下進行正確決策的能力（瓊斯，2010）。計算機科學家紐厄爾和西蒙則將涵蓋了人類智能的“一般智能行動”定義為，發生在實際情境中在一定的速度和復雜程度約束下🤰🏽，適合系統目標🗽🚭、適應環境需要的行為（Newell and Simon, 1976）🧟☎️。如果跳出人工智能的技術邏輯觀察人工智能，在筆者看來💸，兩類能力都是智能，是智能的一體兩面。學習能力是獲取知識和積累技能的能力🤷🏽‍♂️，處理問題包括進行決策則是運用知識和技能的能力。兩類能力都是人類智能的重要組成部分♿️。既然如此，人工智能和人類智能又有什麽關系呢✩？人工智能是否為人類智能的孿生？

羅素和諾維格指出👨🏽‍🦲，有些人根據對人類行為的復刻來定義智能，而另一些人則更喜歡用理性（rationality）來抽象地定義智能（Russell and Norvig, 2021）🦸🏽。智能原本各不相同：一些人將智能視為內部思維過程和推理；而另一些人則關註智能的外部特征，即智能行為🏇🏽。事實上，既有的探討實際覆蓋了4種可能的組合（如表1）（Russell and Norvig, 2021）😐。

表1 理解智能的4種組合

來源🦸🏽‍♀️：作者根據S. Russell and P. Norvig, 2021, Artificial Intelligence:A Modern Approach (4th edition), New York: Pearson整理自製

崇尚類人智能的人有他們對智能的定義🤸🏽‍♂️。一年多來，人工智能熱議中經常出現的圖靈測試是用類人行為理解人工智能的典型例子📦。圖靈提出👄，如果人類提問者在提出書面問題後無法分辨書面回答是來自人還是來自計算機🫖，那麽，這樣的計算機便是“會思考的機器”（Turing, 1950）。值得註意的是🏂🏼，類人行為有特定的指稱🚴🏿，如需要智能才能完成的任務（Raphael, 1976）🚞，能夠發揮需要人類智能才能實現的功能（Kurzwell, 1990）👨🏼‍🦳，又或者是執行人或動物具有的智能任務（Dean et al., 1995）等。這些理解，如今被標準化為自然語言處理、知識表達、推理🤛🏻、學習🧑🏼‍🏫、視覺等（Russell and Norvig, 2021）。

除了行為，強調思維的人認為，會思考才是智能⬆️，主張使計算機像人類一樣思考（Newell and Simon, 1961），甚至主張反推人類思維機製📌。持這類觀點的學者認為，人工智能是使計算機能思維🎮、具有智力的新嘗試（Haugeland, 1985）💅🏿，是與人類思維🦹🏼、決策、問題求解和學習等有關的自動化（Bellman, 1978），是模擬人腦從事推理、規劃🙊、設計、思考、學習等思維活動（Rich, 1983）。

同樣，推崇理性主義的人也從行為與思維兩個維度提出了自己的主張。關註思維的人認為，智能並不在於逼真地模擬人類，而在於正確思維的法則與無可辯駁的推理過程。邏輯主義傳統追求用精確的邏輯符號系統刻畫物體及其關系🐕，並用程序求解一切可用邏輯符號刻畫的問題🖥💀。例如，用計算模型研究智力行為（Charniak and McDermott, 1985）♠︎，用計算擬合理解、推理和行為（Winston, 1992），甚至有人極端地認為，智能即知識，即怎樣表達知識𓀔，怎樣獲取知識和怎樣使用知識（Nilsson, 1998）🦝。

關註行為的人則認為，智能在行動上是一種智能體（agent，社會學稱之為能動的行動者）🧓🏻，是在環境中、在與其他智能體共存時🚺，能夠持續自動運轉的實體（Shoham, 1993），它既是人工智能的初衷，也是人工智能的目標（Hayes-Roth, 1995）。還有一些觀點🥔，雖然沒有使用智能體概念，卻明確地以理性行動為標準，如通過計算力圖理解和模仿智能（Schalkoff, 1990）🥡，探索智能（Nilsson, 1998）♿🙍‍♀️，或建立自然智能實體（Genesereth and Nilsson, 1987）。

無論在技術層次對人工智能的理解有多復雜🕶，在與人類智能關聯的意義上，筆者認為，第一👦🏻，盡管觀點各異，但機器智能是一類思維智能。思維的內在是否滿足人類思維邏輯，是技術層次甚或理想層次的議題，關鍵是可以輸出為智能行動。第二，智能行動具有階段性。類人智能是智能行動的初級階段，理性主義則是智能行動的理想目標。如何達成是科學與技術的目標🧖🏼‍♀️，對應用而言，關鍵是面對一個需要解決的議題🟣🧚🏼‍♀️，具有不同智能類型和層級的人工智能與人類智能之間究竟是什麽關系🤽🏽‍♀️？給定我們討論的場景✯👩🏿‍🍳，即，對文科而言🧑🏽‍🦳，人工智能現在與將來究竟意味著什麽↩️？

學術智能裏的文科未來

在人工智能向一切滲透的歷史潮流中，學術智能是一個無法阻擋的部分。面向人工智能，就像歷史中的文科和理科一樣，理科已經先行一步，形成了理科智能。或許，我們可以從理科智能的努力中窺見文科未來。

理科智能的英文表述——AI for science😔，字面含義非常清晰，即運用人工智能進行科學探索。言下之意是，人工智能是科學研究的新工具，科學研究則是人工智能的應用場景🎭。不過，還是有人持有不同的觀點🏷。湯超（2022）認為👳🏿，理科智能有三個層次😪：第一是把人工智能技術👼🏻、特別是深度學習技術應用於各個學科中的科研🤽🏻‍♂️、技術創新、成果轉化等之中，只是在實踐中是屬於從1到10💎、10到100，甚至10到1000的發展，而從0到1的突破性原始創新不多🛺；第二是運用人工智能發現新的科學定律、創立新的科學範式、引發新的科學革命，而不僅僅是充實、完善已有的科學範式；第三是人工智能科學（Science of AI）👐🏻，研究人工智能的科學原理👨‍🦰，如2021年諾貝爾物理學獎研究的自旋玻璃模型發展的統計物理理論對神經科學和機器學習的影響。筆者認為，湯超的觀點有點混雜，他的第一、二層次實際是同一個議題的遞進表述👊🏿，第三個層次則是人工智能這一專門領域的前兩個層次。說到底，理科智能是運用人工智能進行面向自然現象的知識創新和積累，創新即湯超所說的第二個層次，積累即湯超所說的第一個層次🙆。那麽，如何運用人工智能進行創新和積累呢6️⃣🫖？

有人對理科智能的既有發展進行了歸納（Wang et al., 2023）。當下🏐，人工智能在理科知識創新和積累裏扮演的角色依然是工具性的。

第一𓀎，助力數據清理和提煉。在數據篩選中，實時識別並舍棄原始數據的背景噪音，保留富含信息的數據。例如，使用異常檢測（anomaly detection）算法能夠將稀有事件作為異常數據進行識別並保存。在物理學📘、神經科學🧑🏿‍🏭、地球科學🍫、海洋學以及天文學等領域👳🏽，數據選擇智能得到了廣泛的應用。

在數據註釋中🧑🏻‍🎓，訓練有監督的模型需要依賴帶有標簽的數據集，然而，對生物學、醫學等實驗性學科來說🫱🏿，生成大量準確標簽的數據集既耗時又耗力。偽標簽法（pseudo labelling）和標簽傳播法（label propagation）便是更優的替代方案，它們允許在只有少量準確註釋的大型無標簽數據集中進行自動註釋🧏🏿‍♀️。此外😙👲🏼，主動學習還可以幫助科學家確定最有必要進行實驗標註的數據點，從而進一步降低成本。另一種數據註釋策略是借助專業知識製定標簽規則。

在數據生成中🧚🏻‍♂️，通過自動數據增強（auto augment）和深度生成模型（deep generative AI）生成額外的合成數據點🧏🏻‍♀️、擴充訓練數據集，是創建更好模型的有效方法。例如🪥🧛🏿‍♂️，生成式對抗網絡（generative adversarial network）可以在多個領域中生成逼真且有用的數據，從粒子碰撞事件🤦🏽‍♂️、病理切片、胸部X光、磁共振對比🖐🏽、三維材料微結構、蛋白質功能到基因序列👨‍🏫。

在數據提煉中，人工智能則能進一步提高測量分辨率、減少噪聲🏗，並減小測量精度的誤差Ⓜ️，使之具有一致性👩🏿‍🏫。例如，黑洞成像、捕捉物理粒子碰撞🍏、提高活細胞圖像的分辨率，以及細胞類型檢測🍆。

第二，學習有意義的數據表達🤪。在數據表達中🫅🏼，幾何先驗🔘⛹🏽‍♂️、幾何深度學習、自監督學習🦅、語言模式化👮🏿‍♀️、轉接構架（transformer architectures）、神經算子等均能夠在多層次數據中提取有意義的表達方式👨🏼‍💼、優化表達，以指導研究。

第三，支撐科學假設建構。科學家們在實踐中體會到🧙🏽，人工智能在假設構建的多個階段都可以發揮重要的支撐作用。例如，可以在噪聲觀測中識別候選符號表達式，進而生成假設、幫助設計（如一個能與治療目標結合的分子）⏭，或設想可以推翻數學猜想的反例🦸🏿‍♂️。此外𓀅，人工智能可以學習假設的貝葉斯後驗分布，利用分布生成與科學數據和知識相吻合的假設。實踐策略如黑箱預測✮👇🏼、引導組合假設空間、優化可微假設空間等。

第四，驅動實驗與仿真。實驗成本高昂、操作復雜是理科始終面對的實踐難題，計算機仿真一直是替代方案，人工智能為計算機仿真提供了更為有效和靈活的實驗手段🧙。科學家可以通過人工智能識別和優化假設進行測試，還可運用計算機仿真進行假設檢驗。例如，對科學假設進行有效性評估🧂，運用仿真對假設進行推演觀察等。

也有人認為，理科智能是自然科學的新範式（Zhang et al., 2023）。學者們系統地考察了用於量子、原子和連續體系統的人工智能應用，認為從亞原子（波函數和電子密度）、原子（分子👩🏽、蛋白質👮🏽‍♀️、材料和相互作用）到宏觀（流體、氣候和地下）尺度，通過深度學習捕獲自然系統的物理第一性原理尤其是對稱性，是具有挑戰性的人工智能運用領域🪢✝️，其中可解釋性、分布外泛化、使用基礎和大型語言模型進行知識轉移以及不確定性量化，都是人工智能運用的重要場景。還有人考察了人工智能在基礎科學的應用（Xu et al., 2021），如信息科學、數學🍫👨🏼‍⚖️、醫學、材料科學、地球科學、生命科學、物理和化學等。

對20余位數據科學家進行的半結構式訪談研究（Wang et al., 2019）還表明，人工智能還運用於自動化數據科學家的工作實踐，如Auto AI或Auto ML系統能自主獲取和預處理數據、設置新特征，並根據目標（如準確性或運行效率）創建模型、給模型打分等🫶🏼。科學家們認為🔦，人工智能一方面加快了構建數據科學的進程😸；另一方面還可能過度降低數據科學從業人員的技術門檻🔛。

還有科學家在設想一個能夠在生物醫學科學領域進行重大科學發現的人工智能（Kitano, 2016），如生成並驗證大量假設，開展實時的隨機推斷🤲🏼、開展多策略的適應性學習、保持無限的數據記憶容量⛱🏌🏿‍♂️、執行大量並行異質處理等。在這些進程中🦈，人工智能可以克服人類在信息處理能力🤰🏽、知識表達能力、表型能力（phenotyping）等方面的認知局限、推動生物醫學實現研究方法的迭代升級🌎，使科學發現變為高效的實踐成為可能。

科學家們認為🤌，理論上📪，人工智能系統可以檢驗所有可能的假設🧛‍♂️，重新定義科學直覺的本質與科學發現的過程。應用於科學發現的人工智能將超越現有的人工智能與專家組合，成為頂級研究機構的基礎設施，甚至有望居於其他人工智能系統和人類智能體網絡的中心，協調大規模的人機智力活動。例如，實現對數據的自動化分析和發現，系統、準確地搜索假設空間以確保最優結果9️⃣，自主地發現數據中的復雜模式🤠，實現小規模科學過程應用的可靠、一致、透明和可復製（Gil et al., 2014）🩸，包括在處理大數據、發現長尾的暗數據等方面作出貢獻，並通過工作流程系統實現科學發現過程的自動化（Gil and Hirsh, 2012）🫶。

縱觀理科智能的實踐和科學家們對理科智能的洞見，我們可以作如下歸納：

第一🦦，數據是理科智能的前提，沒有數據便沒有理科智能👄。理科數據有兩類來源🧑🏽‍🎤，一是科學活動產生的數據🐦，如實驗數據、觀測數據🦸🏼、傳感數據⚖️、調查數據等💯，在人工智能可以運用於理科之前💣，理科已經在依據數據做研究；二是人工智能生成的數據，在給定事物之間關系的前提下，人工智能有能力產生可用於研究活動的數據👷🏿‍♂️，即生成式數據。

第二，人工智能有助於標記數據、清理數據、篩選數據、分析數據、表達數據🫱🏿。理科數據的規模和類型多元且復雜👨‍🍳。清理數據曾經是工作量巨大且勞動力密集型的科學活動🫳👩🏼‍🍳，無論是實驗或觀測產生的數據還是人工智能生成的數據，人工智能都可以用於標記數據、清理數據、篩選數據💇🏽‍♀️、分析數據👩‍🦱、表達數據，讓數據以科學家希望的形式精準地呈現。

第三，人工智能有助於檢驗或發現事物之間的關系模式。運用數據檢驗科學假設是科學研究最重要的活動之一👭，人類計算能力的局限一度導致可以運用於假設檢驗的數據量非常有限，人工智能之於科學計算，有能力在假設檢驗中納入更多數據和參數，如生成式大模型的參數量級已經逼近萬億🙅‍♀️，完全達到了人力不可及的量級👩‍👩‍👦。不僅如此，計算能力和模式發現（如機器學習🐬，無論是哪種學習）能力的增長，讓人工智能所具備的從數據中發現事物之間關系模式的能力早已超越了人類，人工智能可以實現從數據中發現模式，使得創新和積累知識不只是理科智能的應用場景，甚至開始運用於生產實踐，如藥物篩選🦸🏻‍♀️🍎、材料發現，等等🍦。

第四🤰🏿🧑🏽‍⚕️，人機互生，科學家與機器智能相互促進。對理科智能的眾多討論只是刻畫了科研實踐，即使提及理科的新範式，也語焉不詳🟢👩🏽‍🎨。其實，科研實踐已經揭示了理科智能的應用場景🔎，這也是在之前的理科中不曾出現的部分🧑🏽‍⚖️。例如，人機之間相互啟發與互動👳🏼‍♀️，一方面機器給人類帶來靈感，啟發人類進行創新；另一方面人類也給機器提出難題，挑戰機器綜合人類知識和從知識中發現新知識的能力，促進機器智能能力的迭代創新。既有的人工智能運用幾乎都能證明這一點，如Alpha Fold 2與蛋白質結構預測、Graphormer與分子建模等⬜️。

除此以外👨🏻‍🦽👃，筆者認為，關於理科智能的討論有一個重要缺失，即對知識創新與積累的路徑缺乏討論🧚🏼‍♂️。截至當下🧖🏻‍♂️，幾乎所有討論都還是以既有分科學術為默認前提的討論🚿，沒有觸及類似科學革命帶來的分科學術的路徑討論🧔🏼‍♀️🪢，或者尚未提及知識創新與積累的新形態或新範式。

即使如此☄️，文科智能可以從理科智能中看到怎樣的未來呢？對此，筆者在之前的討論已有部分述及（邱澤奇，2023），這裏不妨摘其要而論。

第一🥠，與理科智能一樣，文科智能的前提也是數據。在一定程度上可以說，理科在科學革命之後就完成了以數據為支撐的科學邏輯建構🙏🏼，而文科還沒有完成以數據為基底的知識創新與邏輯建構🧜🏻。可只要缺乏數據🦜，就難以讓人工智能進入文科智能。因此🧖🏼‍♀️，文科未來的第一階段工作是素材的數據化👩🏻‍💼，將對社會現象的刻畫從文字的✊、形象的轉變為數據的，從碎片化的、離散化的數據轉變為匯聚化的🧑🏼、可以彼此關聯的數據，進而為運用算法、回到整體視角提供條件，且可以讓人工智能支持甚至支撐數據化👨🏼‍🦱，如一切非數據素材的數據化。不僅如此，人工智能同樣可以針對社會現象生成數據🙎‍♀️。簡言之🪣🧖🏻‍♀️，“一切皆可數據化”的邏輯同樣適用於文科素材。

第二🦵🏿，接下來的場景🤹🏻‍♀️，文科與理科是一致的⚡️🧏🏽。如標記數據🧴、清理數據、篩選數據、分析數據🐍、表達數據，讓數據以文科學者希望的形式精準呈現📔。再如，檢驗假設、發現規律等🫅🏻。需要特別說明的是，素材的數據化將改變人文與社科分立的現象，使得對人類精神的探索與對社會規律的探索殊途同歸📢。直到當下♦️，人類精神現象是否存在規律還是一個懸而未決的議題，對精神分析的爭議便是明證。文科智能至少可以讓文科學者們證明人類的精神世界是否有規律可循。同樣🤹🏿‍♀️，文科智能也遵循人機互生的模式。其實，彭特蘭的實驗已經證明，人類智能是在小群體中被激發的9️⃣👰🏿‍♂️，在小群體中有一個記憶力、算力、歸納和綜合能力超群的同伴✤，意味著人機互生將獲得更大創造力（阿萊克斯·彭特蘭，2015）🤠😓。

第三，文科智能的知識創新與積累更有機會突破科學革命之後文科的悖論🤎，邁向新的綜合🧑🏼‍🤝‍🧑🏼，以可靠的、可檢驗的整體性知識造福人類。與理科智能不同，除了運用數據檢驗假設、發現規律，形成給定條件下的具體規律👮🏻‍♀️，文科智能還需要將具體場景的規律整合起來，形成彼此關聯的、有助於人們理解和解釋日常現象的知識動態💇🏼。換句話說，由文科智能帶來的知識不再是嚴格約束條件下的、面向社會現象的規律，而是以日常為條件的🤮、面向日常社會現象的理解與解釋🧑🏼‍✈️👨🏿‍💻。文科智能帶來的文科知識創新與積累，在外顯形態上理應成為每個人觸手可及的知識源。

而要實踐文科智能🟦，除了面對理科智能的挑戰以外🏄🏿，還有文科特定的挑戰。在學術智能中，無論是理科還是文科🥠，當下的實踐路徑都是建立在科學革命之後分科學術路徑基礎上的，人們已經養成了對專門問題進行深入挖掘的習慣，如何重新回到“深入淺出”的路徑上，在專門知識之間建立聯系🎞，讓專門知識成為日常知識池，還沒有一條明確的可以實踐的路徑🧑🏽‍🎨。算法創新或許是路徑探索的關鍵（Wang et al., 2023）。在海量數據環境下🫶🏽，不要說深入淺出，即使只是深入🤸🏿‍♀️，沒有算法也寸步難行。

更大的難題還在於🤝，當下，學術界似乎還沒有充分認識到人工智能對學術的影響力🤾🏽，更缺乏相關能力的積累。從數據化、模型化🛍、算法化到知識化，每一個環節與環節關聯，文科未來的起點似乎要從培養跨學科的人才開始。

結論

之所以在概念層次探討文科未來，誠如讀者所見，文科智能的發展還沒有進入理科智能的階段😻，還沒有可以討論的實踐和細節🥅✖️。盡管如此，文科未來的方向是明確的，那就是與理科智能一樣🧕🏼，推動人工智能與人類智能彼此互生，通過知識積累和創新𓀋🗺，形成人類知識的新形態，也形成知識服務於人類的新格局🧖🏽，促進人類對自身的理解與解釋，進而增進人類福祉👶🏼🧝‍♀️。

文章來源：《學術前沿》雜誌2024年1月下（註釋從略）

原文責編：李思琪

新媒體責編😙：梁麗琛

邱澤奇：文科智能的未來圖景

最新新聞

最熱新聞

專題熱點

邱澤奇：文科智能的未來圖景

最新新聞

最熱新聞

專題熱點

熱詞搜索