這是德國弗勞恩霍夫智能分析和信息系統研究所數據科學家亞歷山大·措恩的資料照片。新華社發(受訪者供圖)
新華社柏林6月10日電 專訪|讓AI智能體真正“看懂”世界——訪德國弗勞恩霍夫研究所數據專家
新華社記者褚怡 杜哲宇
在AI加速融入現實世界的進程中,虛擬空間正逐步成為智能系統發展的重要“試驗場”。2025年聯合國虛擬世界日活動前夕,德國弗勞恩霍夫智能分析和信息系統研究所數據科學家亞歷山大·措恩在接受新華社記者書面采訪時說,AI智能體可以構建出一套通用能力體系,使其既能在虛擬環境中高效運行,也能勝任復雜的現實世界任務。
“現實與虛擬的結合極具價值。”他說,通過感知現實環境并在數字孿生中完成還原,AI智能體可以在實際應用之前,先在虛擬環境中進行模擬演練,評估操作的可行性,從而提升整體系統的可靠性。
措恩指出,許多運行在虛擬環境中的AI智能體,其核心算法與控制現實機器人使用的是同一類大語言模型。這意味著,AI智能體在虛擬空間中獲得的經驗和能力,可以較為順暢地遷移至現實環境。
作為弗勞恩霍夫智能分析和信息系統研究所自然語言理解團隊負責人,措恩長期從事基于大語言模型的機器人控制與自動編程研究。他說,團隊開發的AI智能體可通過自然語言與人類交流,并將任務自動拆解為一系列更小的子任務。
“對于每個子任務,系統會自動生成一段通常為Python語言的簡潔代碼,既用于調用其他AI智能體,也能直接給出機器人或自動化設備的具體控制策略。”他說,當一個子任務執行完畢后,主智能體將對執行結果進行評估,并決定下一步操作,以逐步推進并完成整體目標。
措恩認為,與傳統自動化系統相比,AI智能體具備更高的“性價比”。目前,許多中小企業在引入自動化技術時常面臨高成本、高技術門檻和環境復雜多變等難題。“基于AI智能體的自動化系統,能夠在很大程度上緩解這些問題。”措恩說,該系統依托先進的大型基礎模型,具備廣泛的通用知識儲備,即使沒有特定行業經驗,也能理解并完成任務。例如,僅憑一句“將蘋果和梨分別放入不同的盒子”,AI智能體就可以理解任務意圖,識別物體類別,并控制機械臂正確完成動作。
措恩指出,要實現更高程度的自主能力,AI智能體所依賴的基礎模型必須具備接收并理解其所處環境的能力,尤其是在涉及現實任務的場景中。“系統要在真實世界中運行,首先得真正‘看懂’這個世界。”他說,將高精度的三維場景數據與多路傳感器數據輸入模型,以便其在空間中進行推理和判斷,是當前人工智能研究的前沿方向之一,但這項工作仍面臨諸多挑戰。
“目前的大語言模型本質上是為處理文字而設計的,擅長語言理解與生成。”措恩說,“而來自現實世界的感知數據,比如三維點云,只是一些無序的坐標集合,并不自帶語義結構。”他表示,要讓模型真正“理解”這些數據,必須開發新的數據表示方式和訓練機制,將“非語言”信息轉化為模型能夠真正識別和處理的形式。
措恩還談到了AI智能體應用過程中最本質的問題——信任。他認為,AI智能體之所以能夠獲得用戶信任,關鍵在于其決策路徑具有高透明性和可審查性。與單一語言模型不同,AI智能體會將復雜問題拆解為多個明確的小任務,每一步都有清晰的邏輯和執行過程,更容易被理解和驗證。
“用戶可以清楚看到智能體是如何逐步推進任務、規劃解決方案的,這有助于增強他們對結果的信心。”他說,在進入現實世界之前,智能體在高度還原真實環境的虛擬世界中先“完成驗證”,這種信任感會進一步加深。