基因測序是一種新型基因檢測技術,基因測序和分析技術現已應用于生育健康、腫瘤個體化診斷和治療、遺傳病、傳染病檢測、疫苗研發等領域。人類首次完成人類基因組測序耗費了13年,隨著技術的不斷發展,到了2019年,測序時間被縮短到了1天,但這些測序數據的分析卻額外還需要1天。這樣的分析速度仍不足以支撐基因測序真正廣泛推廣到臨床應用上。想要提升分析效率,繼續縮短該階段的時間,這是一個世界級的難題。
近日,四川大學華西醫院生物醫學大數據中心將人類全基因組分析時間從24小時縮短至7分鐘,刷新了基因分析的“中國速度”,具有跨時代的意義。這也意味著,該項研究成果直接加速了基因測序從科研到臨床的進程,未來將有更多精準的基因數據輔助于醫療診斷及治療。
九三學社成都市委社員、華西生物醫學大數據中心于浩澎副研究員負責的這項突破性的研發成果發布后,引起了央視新聞的關注,并進行了專題報道。于浩澎在接受采訪中分享了在基因分析領域追求極致的探索。
于浩澎介紹,按照傳統方案,我們獲取一個人的遺傳變異信息,大概需要24小時?,F在經過我們方案優化,在7分鐘內就可以完成,因為我們進行了兩個方面的突破,一個是計算算力的瓶頸打破,一個是存儲性能的瓶頸打破。之所以能實現時間上質的突破,根本在于打破計算算力和儲存性能的瓶頸。他將其形象地比喻為吃得快的“大嘴巴”和裝得下的“大肚子”:“大嘴巴”實現了大文件的直通讀取和小文件的聚合讀取,數據讀取的效率更高,“大肚子“可以對數據分析的各個作業流程進行融合調度的優化,I/O流更加順暢,從而實現了“吃得更多、消化更快”。
研發團隊在全基因組數據分析加速上,以GATK流程為基礎,經過不斷的流程拆分與重組改寫、不斷的分布式存儲軟硬優化打磨,最終完成了速度的飛躍,實現了30X人類全基因組測序胚系變異分析時間從24小時到7分鐘的極限壓縮,同時保證了分析結果的準確性:和GATK結果高度一致。
于浩澎是九三學社成都市社員,四川大學華西醫院副研究員,華西生物醫學大數據中心數據科學家,主要從事生物信息學、醫療大數據和腎臟疾病相關研究。先后主持國家自然科學基金青年基金、四川省重點研發面上項目,骨干參研國家重點研發計劃、國家自然科學基金重點項目等國家、省、部級重大科技項目6項。近十年在Cell Stem Cell, Nature Communication, Nucleic Acids Research等國際著名學術期刊上發表SCI論著20余篇,其中以第一及通訊作者發表論文5篇,平均影響因子10.7。任四川省生物信息學會委員,Frontiers in Genetics、Genomics Protomeics Bioinformatics等SCI期刊審稿編輯。
于浩澎表示,將繼續努力做好科學研究,揭開基因的神秘面紗,用更精準的基因數據輔助醫療診斷及治療,為醫學進步發展做出更大的貢獻,促進人類的健康福祉。