?

機器行為與人機協同決策理論和方法

2021-04-16 02:59曾大軍梁嘉琦王刊良楊彥武陳偉運劉鵬飛謝佳亨

管理科學 2021年6期

關鍵詞：人機機器決策

曾大軍，張柱，梁嘉琦，徐楠，王刊良，楊彥武，陳偉運，徐楊，劉鵬飛，謝佳亨

1 中國科學院自動化研究所，北京 100190

2 中國科學院大學經濟與管理學院，北京 100190

3 中國科學院大學人工智能學院，北京 100190

4 中國人民大學商學院，北京 100872

5 華中科技大學管理學院，武漢 430074

6 電子科技大學計算機科學與工程學院，成都 611731

7 特拉華大學 Alfred Lerner 商業與經濟學院，紐瓦克 19716

引言

隨著大數據和機器智能的普及，人工智能技術正被越來越多地應用到管理和決策領域。人工智能在搜索、計算、優化、形式化推理、對抗博弈等領域優勢明顯，但在高級認知功能方面性能十分低下。在經驗和知識積累的基礎上，人類能夠靈巧地實現無監督學習、小樣本甚至無樣本學習，甚至進行“無中生有”的創造。人與機器協同工作，從而構成混合智能系統，已成為包括管理科學在內的多個學術領域共同關注的熱點。

在此背景下，機器行為學作為一門研究人工智能如何與人類共存、交互和協同的新興學科開始快速發展，其核心內容包括機器個體復雜行為、機器集群交互與行為涌現、人機融合群組協調管理等。人機協同決策過程是人類、數據和算法的相互融合、相互作用、相互影響的過程，這種交互過程貫穿于算法模型的建立、人機交互分析和結果綜合等各個階段，需要結合決策組織的文化、具體決策情景和任務特征對機器行為進行綜合研究，并整合多學科的知識和見解。機器行為與人機協同決策研究的核心目標是融合機器個體和機器集群智能與人類專家智慧，設計二者協同決策的有效機制，其面臨的主要挑戰包括機器智能在學習和推理方面的可解釋性弱、人機融合群體的行為復雜、人與機器表達和解決問題的機理差異大。

作為新一輪科技革命和產業變革的重要驅動力，人工智能已上升為國家戰略，而基于機器行為與人機協同的決策理論和方法則是其基礎內容之一。2017 年7 月8 日國務院印發《新一代人工智能發展規劃》明確指出：“大數據驅動知識學習、跨媒體協同處理、人機協同增強智能、群體集成智能、自主智能系統成為人工智能的發展重點”，混合增強智能理論需“重點突破人機協同共融的情景理解與決策學習、直覺推理與因果模型、記憶與知識演化等理論，實現學習與思考接近或超過人類智能水平的混合增強智能”。

1 國內外研究現狀和發展態勢

1.1 國內外研究現狀

機器行為與人機協同決策的相關研究不僅受到政府主管部門的支持，同時也受到學術界的廣泛關注，主要表現在相關研究機構的項目支持、重要學術期刊的關注，以及一系列科研成果的不斷涌現等方面。

2010 年美國情報高級研究計劃局發起了“基于群體智慧的事件估計”項目，該項目融合專家群體研判，預測效果顯著；2016 年美國情報高級研究計劃局資助的“混合預測挑戰”項目利用人機協同的方法對地緣政治事件進行預測。近些年來，美國國家科學基金會也資助了一批關于人機協同決策理論和應用方向的研究，2019 年的“面向醫療決策制定的人機合作研究”項目和“AI-DCL：基于人在決策回路中的人工智能系統偏見治理”項目。在歐洲，相關研究同樣也受到政府支持和鼓勵，2018 年歐盟資助了“推動面向學校教育的具有類人社交能力的直覺式人機交互”項目，其目標之一是探索機器人與人的虛擬角色的外表、行為、感知的相互關系等基礎問題。此外，2018 年英國工程與物理科學委員會資助了“人機合作中的信任”項目，其目標之一是通過交叉學科方法將人與智能體交互以及信息可視化技術整合到人工智能的規劃研究中，從而使人與人工智能的協作進入到新發展階段。

隨著大數據和人工智能技術的進一步發展，機器行為與人機協同決策也逐漸受到大量學者的關注。SHIRADO et al.[1]和AWAD et al.[2]先后在《Nature》上發表論文，認為與簡單機器人的交互可以增加人類協調性，機器與人類合作可達到人類之間合作的水平。2019 年4 月24 日，《Nature》刊發了MIT 媒體實驗室領銜撰寫的，來自美國、德國、法國、英國和加拿大等國33 位作者參與的題為“Machine Behavior”的綜述文章，提出了機器行為學這一跨學科的新興領域，認為廣義的機器行為包括人機協同過程了出現的一系列合作、競爭和協調行為[3]，標志著相關探索已成為國際跨學科研究的焦點。近5 年來，《Nature》和《Science》等綜合性期刊已發表20 余篇相關論文[4-5]，《MIS Quarterly》等管理學期刊已發表20 余篇相關論文[6-9]，《自動化學報》和《軟件學報》等中文頂級期刊已發表10 余篇相關論文[10-11]，這體現了機器行為與人機協同決策在醫療健康、應急管理、交通系統和政策智能等領域起到重要作用，也反映了機器行為與人機協同決策本身具有的學科交互的研究特點。

1.2 發展態勢

在機器行為與人機協同決策的相關研究中，棋牌類的人機博弈、社交媒體中的信息傳播、基于算法的定價和交易、人機談判、供應鏈決策等研究已經取得一系列重要的理論和技術成果?？傮w而言，已有研究聚焦于特定任務，在技術層面設計面向特定功能的智能體和算法，但仍缺乏跨學科、體系化的頂層設計和部署，對深層科學問題的研究還處于起步階段。近年來，大數據和人工智能的飛速發展，一方面大量擴充了交叉關聯的海量數據和復雜多樣的應用場景，另一方面促進了深度強化學習、因果發現和推理、圖神經網絡等基礎理論和方法的提升，這為機器行為與人機協同決策研究帶來新的機遇。該領域未來的發展趨勢和研究熱點有以下三方面。

(1)在研究機器行為的機理和演化中，充分考慮法律制度、倫理規范和文化等因素的影響。已有相關研究主要面向結構化的簡單應用場景，未來研究需要面向真實復雜的管理決策場景，將法律制度、倫理規范和文化等融合到機器行為的機理、發展、適應性、群體演化等方面的建模中。

(2)研究人機協同決策中機器行為與人的行為的交互機理和相互影響，尤其是機器行為對人的塑造和影響。隨著人工智能系統在生產和生活中的廣泛應用，人機協同決策會對參與其中的個人或群體提出特定的要求，機器行為也可能導致一些新的社會現象或問題，對人的心理、行為、生活和工作等產生影響。

(3)針對不同的管理應用場景，研究相應的新型人機協同決策理論和技術。雖然已有研究涉及人類的政治、經濟、醫療和教育娛樂等各個領域，但是還存在大量的有重大價值和應用前景的場景尚未涉及，對應的人機交互機制和人機協同決策機制還有待深入挖掘。

2 中國發展基礎和優勢

機器行為與人機協同決策的相關研究也受到中國學者的高度重視。20 世紀90 年代，錢學森等[12]和戴汝為[13]提出了開放復雜巨系統理論和從定性到定量的綜合集成研討體系，其核心是將專家智慧與機器智能有機地結合起來，這為本領域在中國的發展奠定了基礎。

近年來，隨著腦科學和人工智能技術的進步，中國越來越多的研究機構對機器行為與人機協同決策進行了相關研究。2015 年中國科學院成立腦科學與智能技術卓越創新中心，其研究內容之一為人機智能協同。2017 年，中國科學院、清華大學、北京大學、復旦大學、浙江大學、上海交通大學、西安交通大學、東南大學、廈門大學、微軟亞洲研究院、曠視科技等高校、科研機構和企業的學者參加了中國科協新觀點新學說學術沙龍“人機協同的混合增強智能”，有效地傳遞了人機協同的混合增強智能的理念，表明混合智能將成為新一代人工智能的一個重要部分。此外，機器行為與人機協同決策也逐漸受到工業界的關注，2016 年微軟亞洲研究院開展的“HI+AI：人機協同，賦能未來”項目，強調人機協同在人工智能發展中的關鍵作用；2018 年阿里巴巴提出“人機協同”智能服務解決方案。

機器行為與人機協同決策的相關研究同樣受到政府的支持和鼓勵。2019 年5 月，習近平總書記在致第三屆世界智能大會的信中強調，在包括腦科學等新理論、新技術驅動下，人工智能呈現出深度學習、跨界融合和人機協同等新特征，正在對經濟發展和社會進步等方面產生重大而深遠的影響。開展腦科學和類腦研究，借鑒腦處理信息的特點推進人工智能的發展，是實現智能科技快速發展的關鍵環節。近些年，國家自然科學基金委員會(以下簡稱基金委)資助了一批關于人機協同決策方法和應用方向的研究，如2017 年資助了 “多源數據融合與人機混合實驗驅動的兩級電力市場全景式建模與決策理論研究”項目，2019 年資助了“腦機混合智能”項目。此外，基金委資助了一批相關的青年科學基金項目和面上項目。

在各類基金的支持下，中國學者在該領域取得了初步成果，已有人機協同決策的相關研究成果發表在中國和國際高水平期刊上，中國期刊包括《自動化學報》《軟件學報》《Frontiers of Information Technology& Electronic Engineering》等，國際期刊包括《 MIS Quarterly》《 Decision Support Systems》《 IEEE Transactions on Neural Systems and Rehabilitation Engineering》《European Journal of Operational Research》《International Journal of Production Research》等。就研究領域而言，已有研究主要集中在理論探討和系統設計，應用方面主要集中于人機談判、供應鏈決策、船舶自動避碰和制造業等方向。

整體而言，中國科研力量在該研究領域已具備堅實基礎，隨著進一步的成長和壯大，有希望在該領域做出國際領先的成果，引領該領域的快速發展。

3 主要研究方向和典型科學問題

對于機器行為與人機協同決策理論和方法，主要研究方向包括管理決策環境下的機器行為模式及其演化、人機協同中人的行為塑造和特征、人機協同決策的新型模式和管理場景、基于人機協同決策的產品和服務創新4 個方面，它們之間的相互關系見圖1。這4 個研究方向從整體上覆蓋了機器行為與人機協同決策的微觀、中觀和宏觀3 個層次，管理決策環境下的機器行為模式及其演化側重于研究人機協同決策中機器的行為模式，人機協同中人的行為塑造和特征重點研究人的行為塑造和特征。由于在人機協同決策中人機之間的交互作用，這兩個方向的研究有一定交互。在這兩個研究方向的基礎上，第3 個研究方向側重于人機協同決策中的新型模式和管理場景，最后一個研究方向重點關注人機協同決策理論和方法在生產和生活中的具體應用，主要研究基于人機協同決策的產品和服務創新。

圖1 主要研究方向的關系Figure 1 Relations of the Main Research Directions

3.1 管理決策環境下的機器行為模式及其演化

在管理決策場景中，簡單設定機器針對特定目標能夠達到最優性能未必是最佳選擇。在特定的社會文化背景下，人機協同可能產生復雜的社會聯動效應，對這些次生效應的評估或預期將對機器行為的可能模式及其演化路徑造成影響。此外，法律制度、倫理規范和決策文化也對機器行為構成實質性的約束，如法律和倫理對獲取和使用訓練數據集會直接影響機器可能產生的行為，對機器行為可解釋性的需求也會制約機器行為的復雜性。探討這些約束條件下機器行為的模式和可能的演化路徑具有重要的研究意義。

典型科學問題舉例：特定管理決策環境下機器產生特定行為的內在機理，機器行為的傳播復制和突變，機器行為的發展及其驅動因素，機器行為的適應性，集群機器行為特征及產生機理，集群機器的協同和管理等。

3.2 人機協同中人的行為塑造和特征

人機協同決策環境對參與決策的個體提出了更高的要求，需要參與決策的個體對機器行為有一定的理解，以形成高效協同。近年來，以深度學習為代表的人工智能技術在多個特定領域取得了突出進展，但其“黑盒”特征也阻礙了其進一步的發展和使用。為解決這些新技術催生的人機協同問題，從機器行為的角度，需構建更易理解的可解釋性人工智能；從人和組織的角度，需要從決策流程和方法、人員培訓和組織決策文化等多個方面保障人機協同的順利實施。這個過程將會影響參與人的行為，同時也需要考慮人的行為對過程可能造成的影響。

典型科學問題舉例：人機協同決策中的參與者角色確定與任務分工，人員培訓及其評價方法，人機協同決策算法模型，人機協同決策中的算法厭惡及其規避措施，人機協同決策中的交互優化，機器行為對人類決策行為的長期影響等。

3.3 人機協同決策的新型模式和管理場景

在很多管理決策場景中，機器智能的作用形式、貢獻度因場景和相關特征統計分布的不同而存在差異，人與機器的協同也存在不同的組合機制和形式。如一些場景下需要高強度的人力監督和監管，并利用群體智慧對機器進行在線培訓；另外一些場景下則需要人機交互學習，充分利用機制設計、團隊和制度，以保證高效持續的人機協同。本方向的問題需要綜合多個學科進行系統的理論和實證研究。

典型科學問題舉例：人機協同決策的典型場景及其分類，人機信任和合作的影響因素，人機協同決策模式及其效果的實證，人機協同的群體智慧決策方法，人機協同機制設計，人機協同決策行為的長期演變等。

3.4 基于人機協同決策的產品和服務創新

在人機協同決策環境中，企業需要挖掘、預測消費者的內在和潛在需求，而不只是簡單地滿足表層和顯性需求。同時，企業的產品設計和制造過程、服務流程將需要更加智能化，需精準理解消費群體結構和行為以及個體行為、需求和偏好。此外，人機協同決策還可能催生數據驅動的風險識別、政策影響評估及效果預測、大規模模擬推演系統等新的產品和服務形態。

典型科學問題舉例：基于人機協同的計算廣告投放機制，融合人機行為的自動推薦方法，基于人機協同的新一代電子商務，大數據驅動的群體行為計算實驗，人機協同環境下的產品和服務模式創新，新能源政策推演和風險分析等。

4 結束語

隨著大數據和人工智能技術在眾多行業的普及，研究人工智能如何與人類共存、交互、協同的機器行為學作為一門新學科逐漸興起。以人機協同為核心的機器行為學在管理和決策領域具有巨大的應用潛力，同時也面臨人機融合帶來的行為復雜性、機器智能的弱可解釋性、人與機器表達和解決問題的差異性等多方面的挑戰。相關研究在中國處于快速起步階段，需要深入探索管理決策環境下的機器行為模式及其演化、人機協同中人的行為塑造和特征、人機協同決策的新型模式和管理場景、基于人機協同決策的產品和服務創新。今后仍需進一步提煉新的關鍵科學問題，規劃和推進相關項目的實施和人才隊伍的培養，以推動機器行為與人機協同決策理論和應用的健康發展，為國家發展人工智能的戰略目標夯實理論和技術基礎。

致謝：

感謝霍紅、李林靜、魏一鳴(依姓氏拼音排序)等各位專家參與本次“機器行為與人機協同決策理論和方法”優先領域討論并提出真知灼見，這些建議和意見對本文尤其是其中第三部分關鍵科學問題具有很大幫助。

猜你喜歡

人機機器決策

環球時報(2022-07-13)2022-07-13

環球時報(2022-03-14)2022-03-14

從內到外，看懂無人機

南都周刊(2021年3期)2021-04-22

詩意的理性：論阿西莫夫機器人小說中的人機倫理

英美文學研究論叢(2020年2期)2020-02-06

決策大數據

決策(2018年8期)2018-12-10

決策大數據

決策(2018年11期)2018-11-28

決策大數據

決策(2018年10期)2018-11-07

未來機器城

電影(2018年8期)2018-09-21

諸葛亮隆中決策

小天使·四年級語數英綜合(2018年1期)2018-07-04

水下無人機：解鎖釣魚新姿勢

知識就是力量(2017年3期)2017-03-21

管理科學2021年6期

管理科學的其它文章: 控排企業碳市場收益測度與戰略選擇; 資本市場開放與企業金融化-基于滬(深)港通交易制度的準自然實驗; 有限理性下政策不確定性對新能源企業投資的影響; 平臺供應鏈的管理理論與方法前沿課題; 重大突發事件下區域綜合交通系統應急保障和管理; 醫聯網與智慧醫療健康管理

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合