科技日報記者 張夢然
美國西北大學團隊開發出一種計算工具,能夠從有限的基因表達數據中提取關鍵信息,識別出多種復雜疾病背后的多基因組合。這項技術基于生成式人工智能(AI),為未來的精準醫學和藥物開發提供了強有力工具。研究論文發表在最新的《美國國家科學院院刊》上。
許多疾病是由多種基因共同作用決定的,而不是僅僅一個“壞”基因造成。這種復雜的基因網絡使得科學家難以準確識別哪些基因組合會導致疾病的發生。為了應對這一挑戰,團隊開發了名為TWAVE的新模型。
該模型利用生成式AI技術,模擬健康和患病狀態下的基因表達情況,從而將基因活動的變化與表型變化相對應。它不僅識別參與疾病發展的基因群,還使用優化算法精確定位最可能引發細胞狀態轉變的關鍵基因變化。
目前,廣泛使用的全基因組關聯研究(GWAS)主要尋找與特定性狀相關的單個基因,但它們缺乏統計能力來檢測多個基因之間的協同效應。TWAVE不依賴于基因序列本身,而是聚焦于基因表達水平。團隊使用臨床試驗數據訓練模型,使其能識別代表健康或患病狀態的表達譜。對于部分基因,他們還結合實驗數據,觀察這些基因開啟或關閉時對整個網絡的影響,從而更準確地找到與疾病相關聯的基因網絡。
這種方法具有多重優勢。它繞過了基因序列帶來的隱私問題,而且,基因表達天然包含了環境因素的影響,模型能間接反映外部因素的作用。
為了驗證TWAVE的實際應用效果,團隊在幾種復雜疾病中進行了測試。結果表明,該方法不僅能成功識別已知致病基因,還能發現一些被現有方法忽略的新基因。更重要的是,它揭示出同一種疾病可能在不同人群中由不同的基因組合引起。這一發現為未來實現根據患者個體的遺傳驅動機制進行個性化治療提供了理論依據。
總編輯圈點
在生命科學領域,人工智能正在成為破譯復雜疾病背后基因組合密碼的重要利器。利用傳統方法,科學家難以破解多基因協同的致病機制。而人工智能技術的優點在于,它擅長通過分析海量的基因組數據和臨床數據,挖掘出多基因組合與疾病之間的隱藏關聯。此類科研進展不僅加深了人類對疾病本質的理解,更為疾病的早期診斷、個性化治療提供了有力支撐。這意味著,人工智能正在驅動精準醫學時代加速到來。