2012年7月,美國國防科學(xué)委員會發(fā)布了《自主性在國防部無人系統(tǒng)中的地位》,進(jìn)一步指出自主能力是美軍無人系統(tǒng)中的核心能力,分析了自主能力給無人機(jī)(UAV)、無人地面系統(tǒng)(UGS)、無人海上平臺(UMV)和無人太空系統(tǒng)(USS)帶來的作戰(zhàn)效益。報告指出,美國當(dāng)前無人系統(tǒng)的運(yùn)用主要是在取得絕對制空權(quán)的條件下執(zhí)行偵察和打擊任務(wù),需要高度重視無人系統(tǒng)所受到的威脅、人為干擾和網(wǎng)絡(luò)攻擊等挑戰(zhàn)。
報告認(rèn)為“世界上并不存在完全自主的無人系統(tǒng),所有的自主無人系統(tǒng)都是人一機(jī)聯(lián)合認(rèn)知系統(tǒng)”,提出了一套從認(rèn)知層次、時間軸和人一機(jī)系統(tǒng)權(quán)衡空間等 3 個視圖定義的自主系統(tǒng)參考框架,并期望代替對無人系統(tǒng)自主控制等級的劃分,強(qiáng)調(diào)自主難題的解決要更多地關(guān)注指揮官、操作員和開發(fā)人員三者的協(xié)調(diào)問題。
報告提出了提高自主能力亟待發(fā)展的技術(shù),包括感知、規(guī)劃、學(xué)習(xí)、人一機(jī)交互、自然語言理解和多智能體協(xié)調(diào)6項(xiàng)關(guān)鍵技術(shù),指出每個研究領(lǐng)域的技術(shù)發(fā)展現(xiàn)狀和目前存在的差距。其中感知技術(shù)包括導(dǎo)航、任務(wù)、系統(tǒng)健康與移動操作4類感知,主要差距是復(fù)雜戰(zhàn)場感知與態(tài)勢理解,包括突發(fā)威脅/障礙的實(shí)時檢測與識別、多傳感器集成與融合、有人一無人空域沖突消解,以及可靠感知和平臺健康監(jiān)控的證據(jù)推理能力等;規(guī)劃技術(shù)的難點(diǎn)是在物理和計算約束和對現(xiàn)有計劃做最小改變的條件下,決定什么時候自主重規(guī)劃、什么時候求助于操作員;學(xué)習(xí)技術(shù)的難點(diǎn)是在友、敵智能體并存的非結(jié)構(gòu)化動態(tài)環(huán)境中的非監(jiān)督學(xué)習(xí);人一機(jī)交互的難點(diǎn)是自然用戶接口,實(shí)現(xiàn)可信賴的人一系統(tǒng)協(xié)作以及可理解的自主系統(tǒng)行為;自然語言理解的難點(diǎn)是以實(shí)際環(huán)境直接互動為重點(diǎn)的指令和對話理解;多智能體協(xié)調(diào)需要重點(diǎn)關(guān)注針對特定任務(wù),合適協(xié)調(diào)方案與系統(tǒng)屬性的映射,正確的緊急行為,干擾下任務(wù)重分配以及魯棒網(wǎng)絡(luò)通信問題。
自動化(Automation)目前應(yīng)用于各種系統(tǒng),一般包括應(yīng)用軟件來實(shí)現(xiàn)遂行的邏輯步驟或操作。傳統(tǒng)的自動化是指“系統(tǒng)運(yùn)行無需或很少需要人工操作,但系統(tǒng)功能僅局限于設(shè)定的具體行動”。應(yīng)用于飛行器系統(tǒng)的自動化還包括飛行控制系統(tǒng)所用的電傳操作技術(shù)、將多個傳感器信息進(jìn)行整合的數(shù)據(jù)融合技術(shù)、制導(dǎo)與導(dǎo)航自動化技術(shù)(如飛行管理系統(tǒng))、地面防撞自動回收技術(shù)等??梢哉f,這些系統(tǒng)只是在一種或多種功能上實(shí)現(xiàn)了不同程度的自動化(從低級到復(fù)雜),屬于半自主性(Semi-autonomous)。
“自主性”(Autonomy)總的來說是指“在更為廣泛的作戰(zhàn)條件、環(huán)境因素和更為多樣的任務(wù)或行動中,使用更多的傳感器和更為復(fù)雜的軟件,提供更高層次自動化的行為”。自主性的特征通常體現(xiàn)在系統(tǒng)獨(dú)立完成任務(wù)目標(biāo)的程度。也就是說,自主系統(tǒng)要在極其不確定的條件下,能夠完全排除外界干擾,即使在沒有通信或通信不暢的情況下,仍能彌補(bǔ)系統(tǒng)故障所帶來的問題,并確保系統(tǒng)長時間良好運(yùn)行。
要實(shí)現(xiàn)自主性,系統(tǒng)必須“有一系列基于智能的能力,能夠?qū)υO(shè)計中未規(guī)劃未預(yù)測到的態(tài)勢做出響應(yīng)(即基于決策的響應(yīng))。自主系統(tǒng)應(yīng)當(dāng)能夠在一定程度上實(shí)現(xiàn)自我管理和自我指導(dǎo)(由人的決策代理進(jìn)行)”。軟件設(shè)計方面,不僅要基于計算邏輯(更加通俗的說法是“基于規(guī)則”),還要采用計算智能(如模糊邏輯、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)),通過智能體的通信和協(xié)同來實(shí)現(xiàn)目標(biāo)。此外,學(xué)習(xí)算法可以實(shí)現(xiàn)學(xué)習(xí),并適應(yīng)動態(tài)環(huán)境的能力。自主性可視為自動化的重要延伸,可以在各種未完全預(yù)測到的環(huán)境下成功地執(zhí)行面向任務(wù)的高級指令,正符合目前對人在具備適當(dāng)?shù)莫?dú)立性和任務(wù)執(zhí)行限制時的期望。因此,自主性也可理解為設(shè)計良好、具備較高能力的自動化。
空中、地面、水面和水下無人平臺將成為未來軍事行動中不可或缺的重要組成部分。然而,當(dāng)前大多數(shù)無人系統(tǒng)都由人遙控,在一些任務(wù)中的自動化程度較低(例如操作員指定平臺的航點(diǎn))。未來,這些遙控平臺將具備更為強(qiáng)大的自主性;然而,“遙控”和“自主”這兩個概念事實(shí)上是正交的,即只能存其一,也可二者兼而有之。遙控平臺可由人直接遙操縱,也可實(shí)現(xiàn)半自主(應(yīng)用一些自動化功能)或全自主運(yùn)行。此外,有人裝備也可借助軟件,以人工、半自主或全自主等多種方式遂行多樣化任務(wù)。
自主性可以理解為控制譜系的一個潛在端。然而,在未來30年里,大部分應(yīng)用將運(yùn)用一定級別的半自主能力。換言之,我們將見證系統(tǒng)控制的逐步發(fā)展,而介于中間的自主等級將在不同任務(wù)中得到應(yīng)用。未來隨著自主能力越來越強(qiáng),可以應(yīng)對更多任務(wù)并應(yīng)用環(huán)境中更多樣的變化,系統(tǒng)將逐步向自主性更強(qiáng)的作戰(zhàn)行動發(fā)展。然而,在大部分作戰(zhàn)行動中,自主能力仍要求與空軍人員進(jìn)行交互,以接收指令,了解作戰(zhàn)需求,并實(shí)現(xiàn)行動協(xié)同。
依據(jù)不同的決策類型,自主將發(fā)揮不同的作用,也面臨著不同的挑戰(zhàn)。如果從認(rèn)知層次視圖檢查設(shè)計方案,那么可以站在不同控制級別上的用戶(從飛行員到任務(wù)指揮官)的立場上,更好地發(fā)揮自主作用,還能為擴(kuò)大自主使用范圍提供機(jī)遇。目前,許多系統(tǒng)都注重將自主與平臺相結(jié)合,在這個過程中,需要在飛行員和傳感器操作員之間進(jìn)行互動。自主可以將較高級別的航路點(diǎn)轉(zhuǎn)化為平臺軌跡和控制行動,對照目標(biāo)定位、跟蹤傳感器,并將原始傳感器數(shù)據(jù)處理成較高級別的信息內(nèi)容(如目標(biāo)跟蹤等)。
自主也可以和任務(wù)相結(jié)合,利用規(guī)劃工具,支持編隊領(lǐng)導(dǎo)和編隊成員生成潛在的行動過程和任務(wù)管理功能,以監(jiān)視任務(wù)執(zhí)行情況,確定當(dāng)前故障或故障先并為其他平臺和隊員的操作協(xié)同提供便利條件。
在更高的認(rèn)知層次上,工作重點(diǎn)將轉(zhuǎn)向參照高級任務(wù)目標(biāo)對資源進(jìn)行管理。目前,在不同任務(wù)目標(biāo)的指引下,大規(guī)模資源與任務(wù)分配,例如,每個平臺具備不同傳感器與武器配置選項(xiàng),平臺對多個目標(biāo)的任務(wù)指派也不同,實(shí)現(xiàn)多平臺多目標(biāo)的任務(wù)分配,大部分工作都是手動完成的。大規(guī)模資源與任務(wù)分配在時間和人力上向任務(wù)指揮官及其手下所有人員提出了嚴(yán)峻的挑戰(zhàn)。大規(guī)模作戰(zhàn)特別適合于基于最優(yōu)化的規(guī)劃工具。利用這種基于最優(yōu)化的規(guī)劃工具,可以使部隊盡快投入任務(wù),減少人力與工作負(fù)荷,并確保更好地完成任務(wù)目標(biāo)。在這個層次上,態(tài)勢理解的主要對象不是平臺,而是復(fù)雜的、不確定的、快速演化的戰(zhàn)場空間。對此,利用智能分析軟件,可以有效地協(xié)助任務(wù)指揮官整理大量數(shù)據(jù),同時提取可行動的相關(guān)資料。
正如前文所述,依據(jù)不同的決策類型,自主將發(fā)揮不同的作用,也面臨著不同的挑戰(zhàn)。但是,必須注意的是,在任務(wù)的時間軸上,決策類型隨著時間的變遷也會發(fā)生變化。一項(xiàng)任務(wù)可分為三個階段:啟動階段、執(zhí)行階段和結(jié)束階段。在每個階段,自主技術(shù)都有不同的應(yīng)用空間。例如,在啟動階段可以利用自主規(guī)劃算法,發(fā)揮起飛前的相關(guān)功能,包括路徑規(guī)劃、意外事故應(yīng)急計劃等,還可以支持更為復(fù)雜的任務(wù)規(guī)劃,例如,指定許可范圍內(nèi)的權(quán)限委派和行動范圍。此外,自主起飛也是在啟動階段應(yīng)用自主技術(shù)的佐證之一。無人系統(tǒng)任務(wù)的執(zhí)行階段是一個平穩(wěn)的階段。無人機(jī)通常離不開自主航路點(diǎn)導(dǎo)航。除此之外,自主技術(shù)還可以利用軟件智能體來監(jiān)控行動故障或態(tài)勢變化,主動防止因這些行動故障或態(tài)勢變化而導(dǎo)致初始計劃中的某個部分或某些部分失效或需要進(jìn)行重規(guī)劃。在結(jié)束階段,一但任務(wù)完成,便可以利用自主技術(shù)來對收集到的數(shù)據(jù)進(jìn)行預(yù)處理,然后將處理后的數(shù)據(jù)返回給平臺,最后再使平臺自主著陸。
尤其值得注意的是,整個任務(wù)期間,人類與計算機(jī)智能體在各個認(rèn)知層次上的主動性和地位相互之間是可以易位的,其目的是適應(yīng)態(tài)勢發(fā)生變化時所出現(xiàn)的新事件、新干擾和新機(jī)遇的需求。在感知、作用和規(guī)劃的不斷循環(huán)過程中,自主發(fā)揮了積極的作用。
通過權(quán)衡空間視圖,可以有效地預(yù)測因資源失衡等(如人力資源浪費(fèi)、故人為失誤增多等)可能引發(fā)的不良后果及其相關(guān)癥狀。從權(quán)衡空間視圖上看,自主可以被比喻為氣球:一方面利用自主技術(shù),可以提高系統(tǒng)的能力;另一方如果權(quán)衡不恰當(dāng),那么將會導(dǎo)致“氣球爆炸”或限制這一氣球的膨脹。按要求,應(yīng)對以下五個方面進(jìn)行恰當(dāng)?shù)臋?quán)衡:
(1)適應(yīng)度。在系統(tǒng)對新任務(wù)或意外情況的自適應(yīng)能力和性能最優(yōu)化之間行權(quán)衡。
(2)計劃。在系統(tǒng)有效地跟蹤現(xiàn)行計劃與全面檢測某個計劃不再有效而需要改變的需求之間進(jìn)行權(quán)衡。
(3)影響力。在集中式與分布式之間進(jìn)行權(quán)衡,使遠(yuǎn)程或當(dāng)?shù)孬@取的信息在不受潛在因素或不明因素影響的前提下具有可視性。
(4)視角。在局部性與全局性之間進(jìn)行權(quán)衡,掌握態(tài)勢,使在一個單元中的集中行動與多個單元間的干擾和協(xié)調(diào)之間相適,以取得更好的效果。
(5)責(zé)任。在長期目標(biāo)與短期目標(biāo)之間進(jìn)行權(quán)衡,在目標(biāo)上達(dá)成統(tǒng)一。
表12對上述五個權(quán)衡空間進(jìn)行了匯總。這五個權(quán)衡空間得出一致的結(jié)論:如果不恰當(dāng)?shù)靥岣咦灾鞯燃?,那么可能會引發(fā)不良后果或?qū)е洛e失機(jī)遇,進(jìn)而影響系統(tǒng)的整體性能。下面以特別工作組親自經(jīng)歷的案例為例,證明無人系統(tǒng)自主性在使用不恰當(dāng)?shù)那闆r下,可能會引發(fā)意想不到的后果。如果提前考慮多個權(quán)衡空間中可能出現(xiàn)的后果,那么就可以提前捕捉預(yù)警信號,在各個權(quán)衡空間內(nèi)及時進(jìn)行系統(tǒng)性能平衡或再平衡處理,從而有效地減少引進(jìn)自主技術(shù)時所帶來的風(fēng)險。
無論是在平臺上還是在戰(zhàn)場上,感知( Perception)能力都是實(shí)現(xiàn)自主的關(guān)鍵要索。只有通過感知,無人平臺才可以到達(dá)目標(biāo)區(qū)域(如導(dǎo)航、避開障礙物等)實(shí)現(xiàn)任務(wù)目標(biāo)。例如,平臺收集傳感器數(shù)據(jù)、應(yīng)用動能武器和對抗簡易爆炸裝置(IED)等都離不開感知能力。
感知過程需要傳感器(硬件)與感知能力(軟件的支持。傳感器模態(tài)是傳感器原始輸入,包括聲音、壓力、溫度和光照等。在某些情況下,它與人的五種感官相似。模態(tài)可以繼續(xù)進(jìn)行細(xì)分。例如,視覺通道可以細(xì)分為可見光、紅外線、X光以及其他模態(tài)。當(dāng)傳感器模態(tài)利用電磁波頻譜來生成圖像時,導(dǎo)航與任務(wù)傳感器處理也可以稱為計算機(jī)視覺。圖像是以類似于圖片的格式所呈現(xiàn)的數(shù)據(jù),與所捕捉到的現(xiàn)場有直接物理對應(yīng)關(guān)系。在下文論述中,我們根據(jù)感知的不同目的,將無人系統(tǒng)的感知功能分為四大類,即導(dǎo)航感知、任務(wù)感知、系統(tǒng)健康感知與操作感知。由于在某些情況下,平臺可能為了實(shí)現(xiàn)室內(nèi)導(dǎo)航而需要對某扇門進(jìn)行操作,也有可能為了完成某項(xiàng)任務(wù)而需要對簡易爆炸裝置進(jìn)行操作,因此,這四個類別經(jīng)常存在交叉現(xiàn)象。此外,到達(dá)目標(biāo)區(qū)域和在拒止區(qū)域內(nèi)移動,需要導(dǎo)航功能的支持,而在導(dǎo)航功能的支持下到達(dá)目標(biāo)區(qū)域之后,則需要通過任務(wù)感知來完成任務(wù)目標(biāo)。
在啟動制導(dǎo)、導(dǎo)航和控制(GN&C)功能時,需要通過導(dǎo)航感知來支持路徑規(guī)劃和動態(tài)重規(guī)劃,以實(shí)現(xiàn)多智能體通信與協(xié)調(diào)。一般情況下,導(dǎo)航是指平臺朝目標(biāo)方向移動的全過程,這與平臺運(yùn)動控制相對(如保持豎直位置或?yàn)樽闶綑C(jī)器人選擇步法)。通過提高導(dǎo)航感知能力,可以提高平臺的安全性(因?yàn)槿说姆磻?yīng)速度通常不夠快,也無法克服網(wǎng)絡(luò)的滯后性,因而無法保證導(dǎo)航的可靠性和安全性),同時減少操作平臺或駕駛平臺時的認(rèn)知工作負(fù)荷盡管這還不是以減少人力需求量。通過選擇機(jī)載感知處理方式,可以提高平臺間的反應(yīng)速度,幫助平臺對抗網(wǎng)絡(luò)攻擊或網(wǎng)絡(luò)破壞。
任務(wù)規(guī)劃、想定規(guī)劃、評估與理解、多智能體通信與協(xié)調(diào)和態(tài)勢感知都需要任務(wù)感知的支持。提高任務(wù)感知的自主感知能力,可以帶來四大好處一是機(jī)器人能夠秘密地執(zhí)行任務(wù),例如,在不需要全程網(wǎng)絡(luò)連接的情況下進(jìn)行跟蹤某個活動,從而減少網(wǎng)絡(luò)受到攻擊的可能性,減操作員的認(rèn)知工作負(fù)荷;二是通過自主識別,即使是目標(biāo)提示或給目標(biāo)劃分優(yōu)先級別,可以減少數(shù)據(jù)分析員的需求量;三是通過機(jī)載確認(rèn)或給部分?jǐn)M發(fā)送數(shù)據(jù)劃分優(yōu)先級別,可以降低網(wǎng)絡(luò)需求,例如,“全球鷹”需要消耗大量帶寬;四是可將任務(wù)感知與導(dǎo)航結(jié)合,例如,指揮平臺在空中盤旋靜止、轉(zhuǎn)圈等。
平臺健康感知主要應(yīng)用于故障檢測與平臺健康管理但是,在進(jìn)行故障預(yù)測、重規(guī)劃與意外管理時,也需要應(yīng)用平臺健康感知功能。加強(qiáng)自主健康監(jiān)控至少有三大好處:一是當(dāng)自主故障檢測、確認(rèn)和修復(fù)的速度可能高于手動檢測、確認(rèn)和恢復(fù)的速度時,使得故障弱化,并有助于修復(fù)故障;二是提高用戶對系統(tǒng)的任度,尤其是系統(tǒng)不按預(yù)期運(yùn)行,或在任務(wù)關(guān)鍵階段突然出現(xiàn)故障時;三是進(jìn)步減少操作員的認(rèn)知工作負(fù)荷,不再需要特別安排一位操作員全程監(jiān)視診斷
隨著導(dǎo)航地點(diǎn)從室外轉(zhuǎn)向室內(nèi),任務(wù)重點(diǎn)也從遠(yuǎn)程感知轉(zhuǎn)移到遠(yuǎn)程行動上,操作感知變得越來越重要。利用地面機(jī)器人來將門打開是一項(xiàng)艱巨的任務(wù)。除此以外,需要利用操作感知來完成的其他任務(wù)包括拆除簡易爆炸裝置、車輛檢查在此過程中,需要移動毯子、包裹等物件),以及物流與材料處理等。提高自主操作感知有兩大好處:一是它可以減少完成操作任務(wù)所需的時間及其工作負(fù)荷;是減少參與任務(wù)的機(jī)器人數(shù)量,因?yàn)樵跊]有提高自主操作感知能力之前,通常要另外安排第二個機(jī)器人來協(xié)助操作員隨時監(jiān)控操縱器與被操縱物體之間的關(guān)系
規(guī)劃(Planning)是指能將當(dāng)前狀態(tài)改變?yōu)轭A(yù)期狀態(tài)的行動序列或偏序的計算過程。國防部將規(guī)劃定義為在盡可能少用資源的前提下,為實(shí)現(xiàn)任務(wù)目標(biāo)而行動的過程。在這一過程當(dāng)中,共有兩個關(guān)鍵點(diǎn):①描述行動和環(huán)境條件、設(shè)定目標(biāo)/資源最優(yōu)化標(biāo)準(zhǔn);②在遵照硬性限制條件(例如,平臺在地形和速度等方面的限制條件)、優(yōu)化軟性限制條件(例如,最大程度地減少完成任務(wù)所需的時間或人力)的前提下,提供計算行動序列和分配行動資源的算法。
各個領(lǐng)域都有自己相應(yīng)的規(guī)劃,包括商業(yè)/工業(yè)、政府和軍方等。制造業(yè)很早就已經(jīng)開始制訂物流規(guī)劃和生產(chǎn)調(diào)度,以確保各種商業(yè)產(chǎn)品的生產(chǎn)計劃與產(chǎn)品需求相協(xié)調(diào)。例如,機(jī)器制造與交通信息管理系統(tǒng)(ETMS)專門用于規(guī)劃和管理香港地鐵系統(tǒng)的維護(hù)與修理工作:200年,Bell等人開發(fā)了人工智能規(guī)劃系統(tǒng)來設(shè)計和監(jiān)控英國電力系統(tǒng)的電壓;美國NASA所開發(fā)、部署的多個系統(tǒng)也使用了人工智能規(guī)劃;自主科學(xué)航天器實(shí)驗(yàn)分析了地球觀測衛(wèi)星的實(shí)驗(yàn)結(jié)果并重新規(guī)劃了問題求解和機(jī)遇開發(fā)的方法( Sherwood等,2007);多飛行器綜合科學(xué)理解系統(tǒng)( MISUS)則專門用于在一組自主飛行器內(nèi)協(xié)調(diào)多個數(shù)據(jù)采集計劃( Estlin等,2005);蒙特利灣海洋研究所一直致力于開發(fā)智能體控制反應(yīng)性執(zhí)行程序T-REX系統(tǒng),該系統(tǒng)主要用于控制水下自主系統(tǒng)來執(zhí)行數(shù)據(jù)采集任務(wù)( Mcgann等,2008);OTS公司也開發(fā)了用于對新海軍艦艇進(jìn)行規(guī)劃的準(zhǔn)時信息系統(tǒng)( ARGOS)和在非作戰(zhàn)條件下的空軍飛行路徑規(guī)劃系統(tǒng),以達(dá)到減少燃油消耗的目的(OTS,2012)。人工智能規(guī)劃有助于對復(fù)雜系統(tǒng)進(jìn)行管理,其優(yōu)化組合既是最為關(guān)鍵的一個步驟,也是難于完成的一項(xiàng)任務(wù)。它所提供的算法還可以幫助系統(tǒng)針對無人環(huán)境(如太空、海洋等)做出相應(yīng)的行動決策(提供自主能力)。
機(jī)器學(xué)習(xí)現(xiàn)已成為開發(fā)智能自主系統(tǒng)最有效的辦法之一。大體而言,從數(shù)據(jù)中自主獲取信息比手動知識工程的效率更高。計算機(jī)視覺最新技術(shù)系統(tǒng)開發(fā)、機(jī)器人技術(shù)、自然語言理解和規(guī)劃主要依賴于訓(xùn)練數(shù)據(jù)自主學(xué)習(xí)。通過在大量具體數(shù)據(jù)中尋找可靠的模式,一般可以使自主系統(tǒng)的精確性和魯棒性高于手動軟件工程,還可以使系統(tǒng)根據(jù)實(shí)際運(yùn)行經(jīng)驗(yàn)自動地適應(yīng)新環(huán)境。
人一機(jī)交互( Human—Robot Interaction,HRI)是一個相對而言較新的跨學(xué)科領(lǐng)域,主要解決人與機(jī)器人、計算機(jī)或工具如何協(xié)作的問題。它是人一系統(tǒng)交互的一個分支領(lǐng)域,側(cè)重于人與機(jī)器人之間雙向的認(rèn)知交互關(guān)系,在這個交互關(guān)系當(dāng)中,由機(jī)器人承擔(dān)智能體的角色,在遠(yuǎn)離用戶、計算機(jī)或自動駕駛儀的位置上運(yùn)行,在技術(shù)上巨有明顯的優(yōu)勢。為了與有關(guān)科學(xué)文獻(xiàn)保持一致,本報告將一律采用人一機(jī)交互這一術(shù)語,無人平臺(UxV)則表示特定形式的機(jī)器人。
無人平臺和計算機(jī)之間具有明顯的區(qū)別。無人平臺承擔(dān)著智能體的角色能對物質(zhì)世界造成影響,通常也具備一定級別的自主性。它的能力高于一般工具,可以承擔(dān)一定的工作或擁有有限主動權(quán)。機(jī)器人作為智能體,引發(fā)了人們對其能力、自適應(yīng)能力、共享目標(biāo)以及人際禮儀的高期望值,這種期望被稱為“社會響應(yīng)”,盡管人一機(jī)之間的關(guān)系可能并不十分和諧。人一機(jī)交互主要解決六大基礎(chǔ)研究問題①
(1)人與無人平臺如何溝通?
(2)如何為人與無人平臺之間的工作娛樂或相應(yīng)的交互關(guān)系建模?
(3)如何研究并提高人與無人平臺之間的配合度?
(4)如何預(yù)測人與無人平臺協(xié)作的可用性和可靠性?
(5)如何捕獲和表達(dá)人與無人平臺在特殊應(yīng)用領(lǐng)域中的交互關(guān)系?
(6)如何刻畫終端用戶?
由于研究范圍十分廣泛,人一機(jī)交互涵蓋了無人系統(tǒng)、人因?qū)W、心理學(xué)、認(rèn)知科學(xué)、通信、人一計算機(jī)交互、計算機(jī)支持工作組以及社會學(xué)等多個領(lǐng)域。這種龐大的多學(xué)科交叉狀態(tài)明顯不同于傳統(tǒng)工程設(shè)計、接口開發(fā)或生物工程學(xué)。研究人一機(jī)系統(tǒng)與平臺之間的關(guān)系,有助于國防部改進(jìn)系統(tǒng)性能、減少平臺操作成本和設(shè)計成本,提高現(xiàn)有系統(tǒng)對新環(huán)境的自適應(yīng)能力,并加快其推行進(jìn)程。通過改善人與無人平臺之間的協(xié)作關(guān)系,可以提高系統(tǒng)執(zhí)行任務(wù)的速度,同時降低失誤率;而如果在改善人與無人平臺協(xié)作關(guān)系的同時,改進(jìn)通信接口、提高應(yīng)用程序的可用性和可靠性,那么還可以減少系統(tǒng)操作人員的需求量,降低在缺乏人一機(jī)交互支持的情況下,設(shè)計不同系統(tǒng)顯示或重新設(shè)計無人系統(tǒng)的成本。如果能夠較好地理解人、無人平臺以及自主性在特殊形勢下各自的作用和局限性,那么將有助于設(shè)計出不僅能監(jiān)控越限行為,還能預(yù)測新需求的系統(tǒng),從而提高系統(tǒng)的自適應(yīng)能力。通過提高人一機(jī)交互水平,不僅可以提高無人系統(tǒng)的任務(wù)執(zhí)行能力,還可以提高人類對系統(tǒng)的信任度。我們希望借助于這些有利條件來加快這一技術(shù)的推行進(jìn)程。此外,利用先進(jìn)的人一機(jī)交互人類學(xué)方法,可以在無人系統(tǒng)使用過程中捕捉創(chuàng)新機(jī)會,從而加快新能力、新用途和最優(yōu)實(shí)踐的推行。
機(jī)器人與人可以通過遠(yuǎn)程遙現(xiàn)( romote presence.)和任務(wù)代理(taskable agency)這兩種方式進(jìn)行協(xié)作。在國防部的大多數(shù)應(yīng)用領(lǐng)域當(dāng)中,系統(tǒng)都是以拓展作戰(zhàn)人員的可達(dá)領(lǐng)域,使作戰(zhàn)人員能夠進(jìn)入拒止區(qū)為目的的。因此,基于聯(lián)合認(rèn)知系統(tǒng)內(nèi)協(xié)作類型的特征描述,比基于人與機(jī)器人之間的接近性的一般性分類系統(tǒng)能更有效地表述人一機(jī)交互概念。
遠(yuǎn)程遙現(xiàn)是指人通過無人系統(tǒng)來進(jìn)行遠(yuǎn)距離實(shí)時感知和行動。在遙現(xiàn)編隊當(dāng)中,之所以仍然將人留在控制回路中,一方面是因?yàn)槭苡嬎銠C(jī)視覺限制,另方面也是為了能夠監(jiān)控未建模或意外情況。然而,留在控制回路中的人并不一定需要為了能在遠(yuǎn)端環(huán)境中工作而充當(dāng)機(jī)器人操作員的角色。編隊的工作表現(xiàn)取決于無人系統(tǒng),因?yàn)檎怯蔁o人系統(tǒng)來補(bǔ)償因與機(jī)器人協(xié)作而造成的感知構(gòu)建損失(例如,機(jī)器人通過環(huán)境效應(yīng)使信息量減少)和最大程度地減少直接控制機(jī)器人的工作負(fù)荷。
任務(wù)代理是指將任務(wù)責(zé)任全部委派給無人系統(tǒng)。在機(jī)動智能體編隊中,人在交接完一項(xiàng)任務(wù)之后,必須負(fù)責(zé)處理其他任務(wù),直到無人系統(tǒng)再次返回。較之遙現(xiàn)編隊,在任務(wù)代理編隊中,人與機(jī)器人之間的聯(lián)系較少,但是仍然必須保持人與機(jī)器人之間的交互,以確保任務(wù)委派正確無誤,任務(wù)意圖被充分理解,并且能在無人系統(tǒng)返回之后在認(rèn)知層次上對發(fā)現(xiàn)成果進(jìn)行匯總。信任度是影響機(jī)動智能體是否能夠順利得以推行的一個主要因素。
究竟選擇遠(yuǎn)程遙現(xiàn)還是任務(wù)代理,主要取決于任務(wù)的實(shí)際情況。這兩種的作方式之間有著明顯的區(qū)別。不同的任務(wù)也需要采用不同的策略。例如:在行秘密監(jiān)視任務(wù)時,無人系統(tǒng)可能要在獨(dú)立工作數(shù)天或數(shù)星期之后,才能將有價值的數(shù)據(jù)帶回;而在執(zhí)行特種部隊任務(wù)時,則可能需要無人系統(tǒng)不間斷地執(zhí)行態(tài)勢警戒。
在無人系統(tǒng)研究過程當(dāng)中,有許多人認(rèn)為遠(yuǎn)程遙現(xiàn)就是遙操作(Teleoperation),而之所以將人仍然保留在控制回路中,是由于自主能力的不足。事實(shí)上特別工作組也發(fā)現(xiàn)無人系統(tǒng)經(jīng)常被認(rèn)為是“完全自主”或“完全遙操作”的系就這種觀點(diǎn)忽視了部分自主能力的價值,如,警戒運(yùn)動、航路點(diǎn)導(dǎo)航以及感知提示等。利用這些自主能力,只要操作無誤,就可以減少操作員的工作負(fù)荷,使員能夠?qū)⑷烤W⒃谌蝿?wù)執(zhí)行上。
與自然語言處理(NLP)密切相關(guān)的是能用英語等普通語言與人類進(jìn)行交流的計算系統(tǒng)的發(fā)展( Jurafsky&Mamm,200)。自動語音識別(ASR)是將語音信號轉(zhuǎn)化為文本信息的過程,而自然語言理解(NLU)則是將文本信息轉(zhuǎn)化為計算機(jī)能理解的正式表述的過程。人一機(jī)交互受自然語言影響。如果給無人系統(tǒng)發(fā)出的口頭指令不精確,那么委派的內(nèi)容將會簡單化,委派的速度也會隨之加快然而,自然語言是一門獨(dú)立的研究學(xué)科。本報告也同樣持有這一觀點(diǎn)。
人向自主系統(tǒng)發(fā)指令時,自然語言是最常態(tài)最自然的一種方式。人類一般利用自然語言來為自主系統(tǒng)制定多樣化的高級目標(biāo)和策略,而不是直接進(jìn)行具 體的遙操作。但是,由于自然語言本身具有一定的不明確性,因此在自然語言的 理解上存在一定的困難。在理解自然語言時,必須結(jié)合當(dāng)時的語境來推斷語言 的真實(shí)意義。構(gòu)建一個能理解英語指令和人類語言的自主系統(tǒng)將是一項(xiàng)高技術(shù) 難度的挑戰(zhàn)。為解決這個問題,我們經(jīng)常利用傳統(tǒng)圖形用戶界面(GUI)來與計 算系統(tǒng)溝通。然而,在大多數(shù)情況下(例如,當(dāng)用戶不方便用手進(jìn)行操作時),語言仍然是最理想的溝通方式。
在執(zhí)行跨機(jī)器人/軟件智能體/自然人任務(wù)時,我們常常會提到多智能體協(xié)調(diào)這一術(shù)語。每個智能體都具有一定的自主性。多個智能體之間可以通過兩種方式進(jìn)行協(xié)調(diào),即分布式協(xié)調(diào)和集中式協(xié)調(diào)。分布式協(xié)調(diào)是指多個智能體直接進(jìn)行互動或交涉;集中式協(xié)調(diào)是指在規(guī)劃器的指導(dǎo)下統(tǒng)一進(jìn)行協(xié)調(diào)。無論智能體采用哪種方式進(jìn)行協(xié)調(diào),我們都必須確保智能體不僅能夠同步化,還能適應(yīng)環(huán)境或任務(wù)的動態(tài)變化。多智能體同步化經(jīng)常被理解為多智能體系統(tǒng)之間的主動協(xié)同(如機(jī)器人足球賽)或非主動協(xié)同(如螞蟻的覓食行為)。雖然協(xié)作(人一機(jī)協(xié)作)與協(xié)同之間有一定的關(guān)聯(lián),但它指的是截然不同的主題,它假定每個智能體都對其他智能體的能力有一定的認(rèn)知理解能對目標(biāo)完成進(jìn)度進(jìn)行監(jiān)控,并且能像人類一樣進(jìn)行編隊。因此,在研究過程中,多智能體協(xié)調(diào)與人一機(jī)交互是兩個相互關(guān)聯(lián)的技術(shù)領(lǐng)域,但是一般而言,多智能體協(xié)調(diào)研究主要側(cè)重于不同配置的智能體協(xié)同機(jī)制,而人一機(jī)交互則側(cè)重于協(xié)作認(rèn)知。本節(jié)內(nèi)容將主要介紹多智能體協(xié)調(diào)的一個分支領(lǐng)域—一多機(jī)器人系統(tǒng)協(xié)同。
多無人平臺協(xié)調(diào)至少有四大好處:擴(kuò)大覆蓋面、降低成本、提供冗余能力、實(shí)現(xiàn)規(guī)范化。與單個平臺獨(dú)立工作相比,多無人平臺協(xié)調(diào)的共同覆蓋面更廣,持久力更強(qiáng),不僅可以發(fā)揮網(wǎng)絡(luò)通信中繼的作用,還可以為傳感器網(wǎng)絡(luò)覆蓋面提供保障。多個低成本無人平臺都可以替代單個高成本低可觀測平臺,也可以替代應(yīng)對“反介入”和“區(qū)域拒止”而必需的高保護(hù)級別的系統(tǒng)。在出現(xiàn)噪聲、混亂、干擾、偽裝/隱蔽欺騙現(xiàn)象時,多個低成本平臺并行可以提供冗余能力,即使其中有幾個平臺正在執(zhí)行其他任務(wù)或出現(xiàn)故障時,最后依然能夠順利地完成任務(wù)。通過協(xié)調(diào)多個專用平臺或異構(gòu)平臺,可以減少成本,降低設(shè)計要求。例如:在異構(gòu)平臺編隊中,專用無人平臺可以為其他無人平臺加燃料,從而可以達(dá)到簡化設(shè)計、降低平臺成本的目的。
自動化有助于在滿足一致性、可靠性和可預(yù)測性的前提下按照編程執(zhí)行行動,其挑戰(zhàn)在于,這些行動通常只適于具備限制條件的態(tài)勢(即設(shè)計人員預(yù)見并且軟件開發(fā)人員并為之編程的態(tài)勢),以及局限于為感知理解所處環(huán)境而使用的有限傳感器列陣所提供的測量值。開發(fā)既能精確感知,又能準(zhǔn)確理解(識別并分類)所檢測目標(biāo)( Object),并確立相互之間的關(guān)系以及更主要的系統(tǒng)目標(biāo)(Goal),是自動化的重大挑戰(zhàn),尤其是在遇到預(yù)期外(不在設(shè)計范圍內(nèi))的目標(biāo)、事件或態(tài)勢時(Object, Event, or Situation)。智能決策需要這種能力。然而,目前大多數(shù)自動化技術(shù)都存在脆弱性( Brittleness),換言之,在設(shè)計和編程范圍內(nèi)的態(tài)勢下能夠正常使用,但需要人的干預(yù)來處理設(shè)計和范圍以外的態(tài)勢。
另外,人雖然存在個體差異,但通常具備掌握大局(整體任務(wù)目標(biāo))、評估態(tài)態(tài)勢(行動上下文)、飛行中思考的能力,以適應(yīng)新的態(tài)勢,并不是按照基于規(guī)則方式(大多數(shù)軟件編程如此),更多地依賴于模式識別、心智模型、類比推理(有時在非常抽象的層面上)。然而,人并不擅長快速連貫地處理大量數(shù)據(jù),也難以長時間保持注意力。
隨著自主能力的不斷提升(包括應(yīng)對更多樣的態(tài)勢和不確定性的能力),我們預(yù)測未來系統(tǒng)對人的干預(yù)需求將會下降。然而,在可以預(yù)見的未來,仍然需要保持一定程度的人一系統(tǒng)交互,其原因包括:
(1)硬件越來越復(fù)雜,因而更容易出現(xiàn)故障
(2)軟件越來越復(fù)雜,因而更容易出現(xiàn)漏洞,脆弱性也隨之上升。
(3)這些系統(tǒng)將在對抗環(huán)境中使用,因而可能會遇到初始設(shè)計人員未曾考 的態(tài)勢
簡言之,隨著軟硬件通過擴(kuò)展來適應(yīng)更多態(tài)勢或作戰(zhàn)模式,并且在越來越復(fù)的環(huán)境中使用系統(tǒng),系統(tǒng)的復(fù)雜性將明顯上升。這會導(dǎo)致以下結(jié)果
(1)由于復(fù)雜性升高,導(dǎo)致系統(tǒng)的可理解性下降(即為何這樣做?
(2)給定態(tài)勢下執(zhí)行方式的可預(yù)測性下降,向必須與系統(tǒng)交互的人提出了嚴(yán)峻挑戰(zhàn)
(3)為解決前述兩個問題而進(jìn)行人為干預(yù)所需的通信鏈的脆弱性上升。
因此美國空軍在可預(yù)見的未來,大多數(shù)甚至全部作戰(zhàn)行動將采取人和自主 合的方式,從而在面對特定敵手時的各種作戰(zhàn)條件下完成任務(wù)。自主性將用以降低手動數(shù)據(jù)處理和集成需求,提高速度,并在軟硬件能力范圍內(nèi)執(zhí)行有關(guān)行動。我們?nèi)匀恍枰獧C(jī)組人員來進(jìn)行與自主性高層目標(biāo)指示有關(guān)的指揮與控制。因?yàn)闄C(jī)組人員掌握了設(shè)計界限和/或情境(上下文)感知范圍以外的知識,可以新的態(tài)勢,并與其他部隊和活動進(jìn)行協(xié)調(diào)。 了在空軍的作戰(zhàn)行動中成功實(shí)現(xiàn)自
與自主系統(tǒng)協(xié)作時的態(tài)勢感知是確保系統(tǒng)按照作戰(zhàn)目標(biāo)運(yùn)行的關(guān)鍵。人監(jiān)督自動化所面臨的關(guān)鍵挑戰(zhàn)是人在回路外(Out-of-the-Loop),換言之,檢測自動化所出現(xiàn)的問題,或者是自動化控制的系統(tǒng)所出現(xiàn)的問題,人的速度較慢,因此無法快速地完成問題診斷和適當(dāng)干預(yù)。究其原因,是在使用自動化時由以下原因?qū)е聭B(tài)勢感知明顯下降:
(1)接口不提供必要信息,且通常缺乏系統(tǒng)狀態(tài)反饋
(2)要求人經(jīng)常監(jiān)視的系統(tǒng)(而這也是人并不擅長的一種技能,因?yàn)槿嗽诒O(jiān)視時每次至多30分鐘,警覺性便會下降)。
(3)從主動信息處理切換至被動信息處理 許多航空事故之所以發(fā)生,都是因?yàn)轱w行員不在回路中,因而無法及時地進(jìn)行適當(dāng)干預(yù)。
此外,飛行員在理解自動化工作內(nèi)容的問題上(甚至是在正常操作過程中主動嘗試?yán)斫鈺r)也面臨著巨大的挑戰(zhàn)。如果對所顯示的信息存在誤解。有時是因?yàn)檎`讀系統(tǒng)模式,或者未能準(zhǔn)確地預(yù)測系統(tǒng)在給定態(tài)勢下的反應(yīng),將會導(dǎo)致態(tài)勢感知不精確,進(jìn)而決策失當(dāng)。即使是訓(xùn)練有素的飛行員也可能無法充分地理解自動飛行導(dǎo)航與制導(dǎo)控制系統(tǒng)的所有模式,因而會在一定程度上影響與自動化的有效交互。未來系統(tǒng)需要更加注重開發(fā)能使所有機(jī)組成員保持期望的態(tài)勢感知水平的自主性方法。
雖然使用自動化的目標(biāo)通常是減少手動工作量(進(jìn)而降低操作的人力需求),但它通常未必能夠?qū)崿F(xiàn)這一目標(biāo)。這種情況被戲稱為“自動化的尷尬( Irony of Automation)。在高工作負(fù)荷飛行階段(例如,飛機(jī)起降),它通常會導(dǎo)致工作負(fù)荷進(jìn)一步增大;而在低工作負(fù)荷飛行階段(例如,途中),卻能減少工作負(fù)荷。由于理解并與自動化進(jìn)行交互會使需求增大,工作負(fù)荷通常從可觀測的手動任務(wù)切換為不一定可觀測的認(rèn)知任務(wù)。未來需要進(jìn)一步開發(fā)易于使用、理解和交互的自主系統(tǒng)。此外,必須特別注重選擇哪些任務(wù)由自動化處理,或者委派給自主系統(tǒng)執(zhí)行,確保機(jī)組人員收到的是與人的能力相適應(yīng)的一組連貫任務(wù), 而不是輕易無法實(shí)現(xiàn)自動化的離散任務(wù)。這種“以人為中心”( Human Centered)的方法對于實(shí)現(xiàn)“人一自主編隊”性能最優(yōu)化至關(guān)重要。
自主性通常用以支持人的決策。專家系統(tǒng)或決策支持系統(tǒng)提供決策指導(dǎo)。例如,行動過程制定或評估、目標(biāo)提示或者對探測到的目標(biāo)進(jìn)行分類等。實(shí)際上,有效的決策支持存在困難。雖然我們一般假定這種系統(tǒng)能夠改善人的決策 尤其是在執(zhí)行困難任務(wù)時,但事實(shí)并非如此。證據(jù)顯示,人一般先采納系統(tǒng)評估所增加,因而決策時間也會相應(yīng)延長。因此,輔助決策系統(tǒng)如果存在缺陷,可能 并不一定能夠提升整體人/系統(tǒng)決策的精確度和實(shí)時性。盡管好的建議有用,但 如果建議失當(dāng),則會使決策人犯錯,因而整體任務(wù)性能將會嚴(yán)重下降。
相反,評判人的決策(例如,指出已規(guī)劃的行動過程可能存在的問題)的決策支持系統(tǒng),由于輸入是在人做出決策之后(而非之前)發(fā)生的,因此能夠剔除由人到計算機(jī)解決問題的方案偏差。它同樣還利用了計算機(jī)的一大優(yōu)勢,即快擬人提出的解決方案(例如,行動過程)從面從環(huán)境態(tài)勢的多樣性以及對抗行動中,識別出潛在的缺陷或缺點(diǎn)。這將更好地促進(jìn)人/自動化協(xié)同,進(jìn)而提升整體性能。隨著決策智能體和系統(tǒng)未來使用越來越廣泛,我們必須特別注重開發(fā)認(rèn)知交互方案來改進(jìn)(而非干擾)機(jī)組人員的決策。此外,我們必須基于人/系統(tǒng)性能的綜合輸出,認(rèn)真檢驗(yàn)這種系統(tǒng)的作戰(zhàn)效能。
為了使機(jī)組人員能夠有效地與自主系統(tǒng)協(xié)同,機(jī)組人員必須能夠判斷自主執(zhí)行任務(wù)的可信任度。這種信任不僅與系統(tǒng)整體可靠性有關(guān),還與根據(jù)態(tài)勢對系統(tǒng)在特殊態(tài)勢下執(zhí)行特定任務(wù)的性能評估有關(guān)。為此,機(jī)組人員必須建立知情信任(Informed Trust)—對應(yīng)用自主能力的時機(jī)、程度以及干預(yù)時間進(jìn)行精確評估。信任度的校準(zhǔn)一從過度信任(自滿)到信任不足(抵觸)可能比較困難,應(yīng)當(dāng)基于以下幾個因素:
(1)系統(tǒng)因素。包括整體有效性和可靠性;可靠性主觀評估;發(fā)生系統(tǒng)故障 (或在態(tài)勢中無法做出適當(dāng)?shù)男袆?,導(dǎo)致快速失去信任且在問題出現(xiàn)后信任恢復(fù)緩慢的近因( Recency);系統(tǒng)的可理解性和可預(yù)測性、及時性與完整性。
(2)個體因素。包括個體執(zhí)行任務(wù)的能力、整體信任意愿以及其他個人特征。
(3)態(tài)勢因素。包括時間約束、工作負(fù)荷、必要工作,及關(guān)注其他競爭性任務(wù)的需求。
過去,機(jī)組人員就以下問題單獨(dú)進(jìn)行決策:
(1)信息。對信息輸入的信任度(例如,基于信息源的可信度、傳感器的可靠性、信息的及時性,以及來自其他信息源的確認(rèn))。
(2)他人。對其他隊友的信任度。
(3)自動化。對特定自動化工具的信任度。
然而,隨著自主系統(tǒng)在未來的普及,單獨(dú)實(shí)體之間的界限也將變得模糊。自主系統(tǒng)可以作為信息源,也可以是處理信息并執(zhí)行行動的系統(tǒng),或者是機(jī)組人員交互的對象。必須特別注意,確保機(jī)組人員能夠在充分了解有關(guān)信息的前提下建立一定的信任,確定對自主系統(tǒng)在特定任務(wù)、特定態(tài)勢、特定時刻等條件下當(dāng)保有的信任度。
為了使自主性獲得成功,系統(tǒng)必須超越簡單計算邏輯,能夠在更完整地理斷變化的任務(wù)和環(huán)境的基礎(chǔ)上進(jìn)行推理。這種系統(tǒng)需要考慮
(1)表示當(dāng)前態(tài)勢、融合多感知輸入、保證態(tài)勢理解和預(yù)測,從而支持的計算機(jī)模型。
(2)按照已學(xué)習(xí)的態(tài)勢分類(對應(yīng)于存儲的計劃與行動)映射當(dāng)前模式匹配。
(3)確定對相關(guān)信息的注意力分配、信息解釋,以及數(shù)據(jù)不完整時,缺失信息默認(rèn)值的預(yù)期態(tài)勢模型。
(4)表示態(tài)勢表達(dá)中不確定性的上下文模型。
(5)指導(dǎo)信息搜索和解釋的基于目標(biāo)的行為(目標(biāo)驅(qū)動的行為)。
(6)識別關(guān)鍵環(huán)境提示,映射至不同態(tài)勢類別的能力。
(7)根據(jù)態(tài)勢類別相對狀態(tài)和未來狀態(tài)預(yù)測,處理多項(xiàng)目標(biāo)和動態(tài)目標(biāo)優(yōu)先級重劃分實(shí)現(xiàn)數(shù)據(jù)驅(qū)動行為的能力。
(8)在模式匹配與現(xiàn)有態(tài)勢類別匹配不理想時,進(jìn)行推理的系統(tǒng)、環(huán)境與其他參與方(如隊友、敵手、平民等)的模型。
(9)態(tài)勢類別與模型的主動學(xué)習(xí)與提煉。
(10)制訂計劃以實(shí)現(xiàn)目標(biāo)并按需求進(jìn)行動態(tài)重規(guī)劃的能力。
(11)按需求優(yōu)化環(huán)境、系統(tǒng)及其他來源的數(shù)據(jù)釆集,以支持態(tài)勢模型持續(xù)需求的能力。
(12)與操作員或其他自主系統(tǒng)就上述任意功能(例如,目標(biāo)統(tǒng)一、態(tài)勢模型、決策、功能分配與優(yōu)先級劃分計劃等)進(jìn)行交互,以實(shí)現(xiàn)協(xié)同獲準(zhǔn)行動的能力。
在開發(fā)系統(tǒng)自主性的過程中,使用學(xué)習(xí)系統(tǒng)既有優(yōu)點(diǎn)也有不足。為了使這些學(xué)習(xí)系統(tǒng)成功地得到應(yīng)用,我們必須彌補(bǔ)這些不足。以積極的眼光看,應(yīng)用基于學(xué)習(xí)算法的系統(tǒng)能夠應(yīng)對各種情境因素(例如,環(huán)境因素、任務(wù)相關(guān)因素、敵手),生成能夠應(yīng)對更多樣的態(tài)勢的魯棒性方案。在這種情況下,設(shè)計人員和開發(fā)人員不需要提前預(yù)測所有潛在的條件(這從理論和實(shí)踐的角度來看都十分困 難),或者預(yù)先指定在各種可能的條件組合下應(yīng)當(dāng)采取的措施。相反,他們創(chuàng)建了一種結(jié)構(gòu),使自主性進(jìn)行自我組織和學(xué)習(xí),并適應(yīng)不斷變化的態(tài)勢。這要求自主性可發(fā)人理解學(xué)習(xí)和推理。在人的認(rèn)知和生物學(xué)的啟發(fā)下,我們得出有以下幾種方法可用:
(1)模糊邏輯( Fuzzylogic)。提供將一個或多個連續(xù)狀態(tài)變量映射至相應(yīng)類別以進(jìn)行推理和決策的框架
(2)神經(jīng)網(wǎng)絡(luò)( NeuralNetworks)。網(wǎng)絡(luò)利用通過程序在大型典型案例數(shù)據(jù) 庫的訓(xùn)練過程中學(xué)習(xí)到的可變互聯(lián)權(quán)重來進(jìn)行知識表達(dá)的算術(shù)框架,學(xué)習(xí)解決方案。
(3)遺傳與進(jìn)化算法(Genetic and Evolutionary Algorithms)。在進(jìn)化遺傳的啟發(fā)下采用重復(fù)仿真的方法,縮小潛在選項(xiàng)的范圍,選擇最優(yōu)解決方案。
以上每種方法都可結(jié)合適當(dāng)?shù)南到y(tǒng)架構(gòu)來應(yīng)對自主性挑戰(zhàn),達(dá)到知識獲取、編譯、表達(dá)存儲、處理和提取的目的。由于現(xiàn)實(shí)環(huán)境存在內(nèi)在的復(fù)雜性,這些方法的合理性可能遠(yuǎn)遠(yuǎn)超過那些借由專家來獲取緊急情況的大量細(xì)節(jié)信息的方法。
然而,學(xué)習(xí)方法也不無挑戰(zhàn)。這些方法通常要求開展大量的工作來確定提供給學(xué)習(xí)系統(tǒng)的相關(guān)參數(shù)和信息,并創(chuàng)建學(xué)習(xí)與組織輸出的適當(dāng)系統(tǒng)架構(gòu)。此外,學(xué)習(xí)系統(tǒng)還提出了以下新的挑戰(zhàn):
(1)可理解性(Understandability)。這種系統(tǒng)的邏輯與行為可能對于機(jī)組人員很難理解,而且系統(tǒng)開發(fā)人員通常無法完全理解自主性的行為方式—盡管我們可以采用相關(guān)方法來獲取描述算法“黑盒子”內(nèi)部主要特征的規(guī)則。然而這些意見可能并不完整,也不能表達(dá)系統(tǒng)行為的復(fù)雜全貌。
(2)確認(rèn)(Validation)。如果美國空軍的安全關(guān)鍵作戰(zhàn)行動接受了利用學(xué)習(xí)技術(shù)開發(fā)的自主系統(tǒng),那么成功驗(yàn)證和確認(rèn)開發(fā)這些系統(tǒng)的方法就非常關(guān)鍵。般而言,目前的技術(shù)還不足以應(yīng)對這一挑戰(zhàn)。
(3)標(biāo)準(zhǔn)化(Standardization)。如果學(xué)習(xí)算法今后能夠在實(shí)踐中繼續(xù)演化那么在一致性的問題上將會遇到新的重大挑戰(zhàn)。系統(tǒng)是否會為了保證一定程度的一致性而將學(xué)習(xí)到的經(jīng)驗(yàn)傳授給其他系統(tǒng)呢?每種情況下保證學(xué)習(xí)到適當(dāng)?shù)慕?jīng)驗(yàn)的標(biāo)準(zhǔn)是什么?這些經(jīng)驗(yàn)對于其他環(huán)境是否具有廣泛性?不同系統(tǒng)的行為方式是否不同(要求機(jī)組人員能夠理解和預(yù)測自主性的運(yùn)行方式,進(jìn)而以適當(dāng)?shù)姆绞脚c之交互并正確地調(diào)整對自主性的信任度)?如果訓(xùn)練期結(jié)束后學(xué)習(xí)算法凍結(jié),那么這些算法是否會與其他方法一樣而遭遇脆弱性的問題,因而無法在不斷變化的現(xiàn)實(shí)環(huán)境下學(xué)習(xí)和自適應(yīng)?
如果利用學(xué)習(xí)系統(tǒng)來開發(fā)未來的自主系統(tǒng),那么我們必須解決這些挑戰(zhàn)。
美國空軍先進(jìn)系統(tǒng)軟件的驗(yàn)證與確認(rèn)對于保證系統(tǒng)能夠安全而一致地按照預(yù)期運(yùn)行十分關(guān)鍵。為此,我們需要引入新的自主軟件的驗(yàn)證與確認(rèn)方法。傳統(tǒng)方法以需求跟蹤為基礎(chǔ),無法應(yīng)對自主性軟件的復(fù)雜性。十分多樣的潛在狀態(tài)和狀態(tài)組合能夠進(jìn)行相互測試,而臨界條件卻難以理解。系統(tǒng)支持自主性交互的能力是成功實(shí)現(xiàn)自主性的重要條件,確認(rèn)測試必須明確予以考慮。
自主性可能能夠應(yīng)對美國空軍作戰(zhàn)行動的許多挑戰(zhàn),但也和其他軟件系統(tǒng)樣,容易受到網(wǎng)絡(luò)攻擊。鑒于自主性的復(fù)雜性檢測漏洞或故意嵌入的惡意軟件更加困難。和自我健康監(jiān)視系統(tǒng)一樣,提高環(huán)境感知有助于應(yīng)對這一挑戰(zhàn)。此外,保證網(wǎng)絡(luò)彈性的方法(包括檢測、對抗或者應(yīng)對自主性和系統(tǒng)其余內(nèi)嵌部分的網(wǎng)絡(luò)攻擊的能力)非常重要。網(wǎng)絡(luò)彈性并不是在開發(fā)完成之后可以在加入系統(tǒng)的一種特性。相反,在開發(fā)任何自主系統(tǒng)方法的過程中我們必須考慮網(wǎng)絡(luò)彈性的因素?!顿惒┮晥D2025》( Cyber vision2025)更為完整地探討了網(wǎng)絡(luò)對抗環(huán)境下任務(wù)保障的相關(guān)問題。