科技日報北京10月10日電 (記者張夢然)美國哈佛大學與西北大學研究團隊合作,開發出一種新型機器學習方法,能夠從無序蛋白質中排序,設計出具有特定性質的內在無序蛋白質(IDPs),從而突破了當前人工智能(AI)工具在解析約30%人類蛋白質結構上的局限。該成果發表于最新一期《自然·計算科學》。
這類蛋白質因其不折疊成固定三維結構而長期難以被建模,像“阿爾法折疊”等先進AI系統雖在結構預測方面表現卓越,卻無法有效處理這類高度動態的分子。然而,IDPs在細胞信號傳導、分子傳感和交聯等關鍵生物過程中發揮著核心作用,其功能異常也與癌癥、神經退行性疾病等多種疾病密切相關,例如α-突觸核蛋白就與帕金森病緊密關聯。
為應對這一挑戰,研究團隊提出了一種結合物理模型與機器學習技術的新路徑。該方法基于“自動微分”技術——一種常用于深度學習中計算導數的算法,用于追蹤輸入變量微小變化對輸出的影響。他們利用這一機制,在分子動力學模擬框架下直接優化氨基酸序列,使其具備預定的物理或功能特性。與依賴大量數據訓練的典型人工智能模型不同,該方法依托已有且足夠精確的物理模擬體系,通過梯度優化高效搜索滿足特定功能需求的蛋白質序列,如形成柔性連接結構或響應環境變化的能力。
團隊強調,目標并非用數據驅動模型替代物理理解,而是將真實的分子行為規律嵌入設計過程,使生成的蛋白質序列不僅具備功能性,而且其設計過程本身就根植于自然界真實的動力學原理。由此設計出的蛋白質是“可微分的”,意味著每一步優化都建立在對系統物理狀態連續、精確調控的基礎上,而非依賴黑箱式的預測。