病毒,是地球上最小且豐度最高的非細胞生物,不僅對人類健康產生了深遠的影響,也是全球生物地球化學循環的幕后推手,它們如同隱形的“生態工程師”,調控微生物群落結構,驅動碳、氮等元素的全球循環。隨著宏組學技術的迅速發展,發現了海量未知的DNA和RNA病毒。然而,全球約99%的病毒仍處于“黑戶”狀態——未被分類或命名。
日前 ,中國海洋大學海洋生命學院和海德學院教授汪岷團隊傳來好消息,他們基于序列比對和圖論方法,開發了病毒分類新工具VITAP(Viral Taxonomic Assignment Pipeline)。近日,相關研究成果發表在《自然·通訊》上,為病毒組學和病毒生態學研究提供了重要工具。
“進入VITAP系統界面,輸入一段基因序列,命令行瞬間輸出從‘門’到‘屬’的分類結果。這就像給病毒發‘身份證’,流程縮短至幾分鐘。”成果共同通訊作者、海洋生命學院教授梁彥韜向《中國科學報》解釋說。
汪岷團隊成員合影 受訪者供圖
病毒傳統分類遇瓶頸
病毒分類如同給未知星系命名,我們已知的僅是冰山一角。
過去鑒定病毒需要接近完整的基因組,但在現實中,科學家從環境樣本中發現的病毒基因往往是碎片化的,傳統工具難以識別。隨著宏組學技術的發展,病毒基因組數據從2018年的5000多種激增至如今的1000多萬條序列,與此同時,病毒分類標準變化非常快,這讓分類工具“捉襟見肘”,如同用老地圖導航新大陸,結果自然偏差百出。
這些問題限制了我們對環境中復雜病毒群體的深入解析。因此,如何準確細致地對環境病毒進行分類,已成為當今生物學、醫學與生態學研究亟待突破的重要挑戰。
團隊在研究海洋病毒時,也面臨了這一病毒分類難題。“研究病毒,我們首先要知道它的分類情況,屬于哪一科,是什么類型的病毒,從而再去確定它的宿主類型。而傳統的培養方法有很多弊端,培養周期長,效率低,我們想從基因組學的層面,通過算法快速大批量分類病毒,提高準確率和效率。”梁彥韜說。
跨學科協作成為破局關鍵。海洋生物學背景的成員提供生態視角,計算機專家優化算法,國際合作則引入前沿經驗……共同通訊作者、澳大利亞塔斯馬尼亞大學Andrew McMinn教授每周參與線上討論,計算病毒學國際專家David Paez-Espino博士每月共同線上研討,“時差會議”成為常態。“國際視野可以讓我們進步更快,少走彎路。”團隊成員感慨。
從“試錯”到“最優路徑”
2023年初,團隊開啟病毒分類新工具VITAP的研發。最初的設想是用人工智能訓練模型,但病毒數據的高度多樣性讓AI“水土不服”。“病毒沒有像動植物那樣的‘標準證件照’,訓練樣本的匱乏讓AI舉步維艱。”成果第一作者、海洋生命學院博士生鄭凱陽回憶。團隊轉而回歸傳統方法,從序列比對和圖論中尋找突破口。
序列比對如同“人臉識別”,通過基因片段尋找相似病毒;圖論則像構建“社交網絡”,分析病毒間的親緣關系。團隊創新性地將兩者結合,尋找解決問題的“最短路徑”——為每條病毒基因篩選出從門到屬的最佳分類譜系。
為提升準確性,團隊為不同基因賦予權重,“這相當于給病毒基因貼上動態標簽,即便碎片化也能精準溯源。”成果共同第一作者、海德學院孫建華助理教授比喻道。
研發過程充滿“試錯”。例如,針對長基因組病毒,團隊一度陷入“盲人摸象”的困境。“長基因組被‘切碎’后,每段特征模糊,就像把一頭豬分割后,單憑一塊肉很難判斷部位。”鄭凱陽說。
最終,團隊通過動態權重調整,測試國際病毒分類委員會(ICTV)報道的18000多種病毒參考基因組,實現了高置信度分類。測試顯示,VITAP在科級和屬級的分類分析中不僅能保持超過90%的準確率、精度和召回率,還顯示出了優于其他方法的注釋率。具體而言,對于1000bp的短序列,VITAP在所有病毒門中的注釋率均優于其他方法;而在近完整基因組的分類中,VITAP對RNA病毒和大部分DNA病毒也表現出更高的注釋率。
團隊成員合影 受訪者供圖
精準“上戶”背后的生態藍圖
“用戶友好”是VITAP的另一亮點。傳統工具安裝復雜、更新滯后,VITAP則實現“一鍵安裝”和ICTV自動同步。上線后,下載量迅速突破2000次,被廣泛應用于海洋、醫學等領域研究。
VITAP在保證高準確率的前提下,實現了更全面、穩定的病毒分類,并為病毒基因組學、分類學和生態學研究提供了一個高效的自動化新工具,就像給病毒研究裝上了“智能搜索引擎”,讓科學家能更快、更準地給海量病毒“驗明正身”,無論是完整的還是碎片化的基因,都能高效分析。這對理解病毒在自然界的角色、應對公共衛生問題都有重要意義。
未來,團隊計劃引入AI生成新病毒類群,突破現有分類框架的局限。“當前工具只能‘上戶口’,下一步要讓‘黑戶’自立門戶。”鄭凱陽透露。在應用層面,VITAP將助力極地、深海等極端環境病毒研究,快速解析環境中龐大而復雜的病毒群落,了解它們如何影響生態系統;醫學上,可更高效發現與疾病相關的新病毒,輔助流行病追蹤。
“做難而正確的事”是團隊的信條。汪岷鼓勵學生“勇攀高峰,允許失敗”,實驗室文化強調自由探索與合作共享。正如梁彥韜所言,“要想解決重要的科學問題,你就要不斷地去面對困難、克服困難。”
“未來,我們會開發更多病毒學的生物信息工具,致力于南極、北極、馬里亞納海溝、青藏高原等極端環境的病毒研究,構建海洋病毒基因組數據庫。”汪岷說。在全球病毒研究的浪潮中,他們正以“算法”為舟,駛向未知的“病毒宇宙”。
論文相關信息:
https://doi.org/10.1038/s41467-025-57500-7
本文鏈接:中國海洋大學科學家破解病毒“黑戶”難題http://m.sq15.cn/show-11-20480-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。