人體是一個網絡化開放式的復雜巨系統,具有高智能、自組織、自調節、自穩態等特征,通過能量信息傳遞進行新陳代謝,自我更新、自我修復、自行運動、自我繁衍。對人的生命活動本質規律的揭示應該是現代科學技術交叉融合的主攻方向。
就生命科學領域而言,需要揭示三大基本科學問題:解析組成生命體的微觀結構,探索結構之間的關聯關系,揭示結構及其功能的時相性變化規律。
生命活動的本質從以還原論為代表的微觀角度理解,是蛋白質及其他生物大分子的同化作用和異化作用的對立統一運動過程,以生物大分子自我更新、自我復制、自我調節為機制;
從宏觀角度理解,是維系人體生命活動的結構系統在演變中所表征的高智能、自組織、自調節、自穩態,新陳代謝、自我修復、自我繁衍的過程,維系機制是能量信息的網絡化傳遞。
筆者認為,生命科學研究應該是還原論、整體論、信息科學三者的深度融合,以基因組學、蛋白質組學、代謝組學、微生物組學、單細胞圖譜刻畫等為代表的生命科學技術,從超微觀的分子、微觀的生物大分子、亞細胞、細胞、細胞間聯系到組織、器官、系統和整體等多個層面,系統解析人體結構,探索結構間的關聯關系,系統研究組織器官細胞的精細結構及其功能的時空變化,獲取海量的生命活動數據知識,并轉化為數學模型,模擬、復現或再現相關生命活動過程,系統解密生命活動的本質。這是生命科學技術發展的方向和追求的目標。
醫學科學與以大數據、物聯網、人工智能和量子計算為代表的信息技術深度融合,是促進生命科學進步的必然途徑。
生命科學的困境
現代科學技術解決了生命科學領域的部分難題,人類健康維護有了明顯進步,疾病譜發生了改變。
但是,由于至今尚未從整體上系統揭示人類生命活動的本質和規律,使我們在健康領域仍然處于有些老病未解、新病不斷出現的窘境。主要表現在以下方面。
一是現代醫學進步緩慢。后基因組時代,現代醫學對疾病的認知和治療并沒有本質上的突破,比如沃森在2013年甚至宣稱:多少年來想通過基因序列治療癌癥和其他疾病是“沒價值的”。
過度依賴基因層面的治療選項,對某些疾病的治療總體上很可能是退步了,而且增加了很多費用。
二是生命科學研究缺乏公理體系和數學計算。現代自然科學是建立在受控實驗所得到的公理之上,關鍵在于邏輯化和公理化;醫學研究是建立在結構學、功能學和生物實驗觀察之上,這些觀察結果未能實現數理邏輯上的公理化。
數學家在生物學中取得的成功遠不及在物理化學方面,沒有形成計算醫學的研究范式,DNA螺旋依然只能觀測一些二維現象,還未能系統揭示三維、四維的內在分子互作關系上的數理邏輯機制。
三是一些新方法運用不能從根本上促進醫學進步。人類醫學仍然停留在傳統時代,依然在用天然的和化學的物質去對抗治療疾病,對整體生命活動改善有限;
外科手術演變成微創治療,但微創仍是外科手術的一種,這種技術的“發展”是以丟掉組織為代價來治療疾病的。
而現代的互聯網醫學、人工智能醫學只是信息技術本身的進步與拓展,還沒有實現醫學與信息科學的真正融合,形成相互促進式的發展。
需揭示的三大問題
一是解析人體微觀結構。細胞是生命體的核心單元,人體是一個由約37萬億~40萬億個細胞構成的復雜系統。目前微流控細胞分離、單細胞DNA/RNA測序、細胞原位分析、質譜流式細胞分析等技術已經逐漸建立并用于單細胞分析。
單細胞檢測技術會產生包括DNA序列、RNA序列蛋白質等生物分子組成,以及它們的細胞空間位置等海量數據,應對這些數據進行分析, 用生物信息學方法從中篩選出有用的信息來建立細胞結構圖譜數據庫。
如通過目前的形態表征差異來區分不同的細胞,推測人體的細胞類型可能有200到300種不等,但如果用單細胞圖譜刻畫技術,可能會發現有上萬種類型的細胞。
二是探索結構之間的關聯關系。轉錄水平本身在許多情況下不足以用來預測蛋白質表達水平以及解釋基因型與表型的關系。
以復雜系統科學的整體論作為方法論,探索在生物分子、細胞、組織、器官等多個層級結構之間相互作用中“涌現”出的新屬性,系統探索它們之間的關聯關系,有利于提升從微觀層面系統認知健康與疾病的特征,研發具有多靶性系統性調節和干預的新藥。
三是揭示結構及其功能的時相性變化規律。自然界任何物質都是在不斷演變的,人體從受精卵形成時起到生命活動結束,所有組織結構及其功能無不發生時相性的變化。
揭示隨時間變化的生物大分子變構及細胞狀態特征、瞬時屬性、細胞數量等信息,以及不同健康狀況、不同基因型、不同生活方式和生活環境下的生物大分子變構及細胞狀態結構的動態變化規律,是認知生命活動規律的方法和路徑。
采用密集數據驅動的科學范式,挖掘隱藏于高維、高通量多維融合的生物醫學大數據中的新洞見,將生物醫學領域的知識模型轉換為數學模型,以生物醫學大數據作為輸入參數,以人工智能算法對模型進行迭代、訓練,輸出旨在揭示逼近于真實的生命系統結構與功能的時相變化表征。
新的方法論及其科學意義
生命科學研究的方法論是解析生命體微觀系統性、復原宏觀整體性。人體經絡可能是能量信息流縱橫交錯、由表及里的網絡化傳輸模式。維系機體生命活動的能量信息由表及里地傳遞于各系統間、器官間、組織間、細胞間、亞細胞結構間。
能量信息還與體外環境、體表體腔微生態環境進行實時溝通交換。經絡的載體形式可能是:細胞骨架、細胞膜、細胞間鏈接、組織內及組織間結締組織,這種網絡化的物理結構可能是信息能量的傳遞通道(信道)。
人體的這種能量信息網絡(經絡)用現代物理及信息技術應該能夠實現可視化。
刻畫人體能量信息網絡傳遞機制的三大工具為生命大數據、數學模型、人工智能。
生命科學大數據將是揭秘生命活動本質的基礎,將是人類有史以來數據結構最復雜、規模最龐大、內容最豐富的科學大數據。
數學模型是龐雜生命科學大數據數學定量分析和集成的基礎,依據人體生命科學大數據構建的數學模型,有可能揭秘生命科學大數據背后生命活動規律的數理邏輯表達,有效模擬、再現或復現微觀和宏觀生命活動過程,重構生命體四維結構,揭示結構之間的關聯關系和時相性變化規律,以及物質、能量與信息轉化形式。
通過人工智能,自動化自適應構建數字人體模型,以定性定量定位描述生命活動的狀態、健康水平、疾病程度及治療效果和轉歸。
對人體生命系統網絡解析的科學意義包括以下幾個方面。
一是改變生命科學實驗模式。它可能會改變生命科學的實驗研究范式,能減少實驗動物的使用,用數字疾病模型替代動物疾病模型。
二是全球合作共享。關系人類生存、健康和可持續發展的重要科學進展能推動全球生命科學領域的交流合作。
三是全面認知生命。把局部生命物質運動和演化現象,放到人體生命系統網絡的體系中去評價,對精確診斷及治療、維護人類身心健康有極大價值和意義。
四是促進互聯網技術仿生學發展和科學技術全面進步。人體生命系統網絡解析為人工互聯網技術發展提供了仿生學基礎。人體能量信息網絡有可能是最科學、最智能、自組織性最高的網絡模式。人體生命系統網絡解析成果可以引領其他科學技術的快速發展,促進化學、物理學、信息科學、制造業、農業、數學等科學技術領域的全面進步。
(作者系中國工程院院士、九三學社中央委員會副主席)
(本文轉載自《中國科學報》2020-08-26第1版 要聞,原題《生命科學領域實現突破須與信息技術深度融合》)