2026年理論物理所重要科研進展系列(六):細胞表型轉化的年理信息流形
【ZiDongHua 之“自動化學院派”標注關鍵詞:中科院理論物理所,細胞表型轉化,論物理所列細流形生物信息學】
細胞如何從一種狀態轉變為另一種狀態(即細胞表型轉化,Cell Phenotype Transition,研進 CPT),一直是胞表發育生物學、疾病發生(如癌癥轉移)等領域的型轉信息核心問題。近年來,年理單細胞RNA測序技術的論物理所列細流形爆發提供了海量數據,但如何從高維的重科展系基因數據中提取出真正具有物理和幾何意義的動力學規律,始終是研進橫亙在科學家面前的一道難題。
盡管細胞包含成千上萬個基因,胞表但受到底層基因調控網絡的型轉信息嚴格約束,細胞表型轉化的年理實際動力學是被限制在低維流形上的。然而,論物理所列細流形現有的重科展系單細胞數據分析多依賴于降維可視化工具比如t-SNE、UMAP,Diffusion maps,但這些方法在將高維數據投影到二維或三維空間時,雖然盡可能保留了拓撲結構,卻扭曲了流形真實的內在幾何性質。距離和鄰域的扭曲會導致研究者在 2D 圖上憑肉眼觀察到的細胞發育軌跡或分化路徑可能與高維空間中的真實動力學過程完全背離。
針對這一挑戰,本研究提出了一種名為SCIM(Single Cell Information Manifolds,單細胞信息流形)的全新理論框架。該研究首次將“信息幾何(Information Geometry)”引入單細胞演化動力學分析中,利用高斯嵌入神經網絡將單細胞基因表達譜轉化為多元高斯分布,從而在概率空間中自然地定義 Fisher 信息度規,成功為細胞表型轉化的低維流形建立了黎曼度規。該方法突破了傳統降維算法僅能用于可視化的局限,首次實現了對細胞表型轉化流形內蘊幾何屬性的定量監測。
運用這一方法,我們發現流形上低曲率區域的細胞對應于細胞命運決定關鍵期、高度不穩定的過渡態細胞。SCIM首次將RNA速率與Fisher度規相結合,計算出了每個細胞的“信息速度”。作為衡量分布變化快慢的信息速度,可用于表征細胞狀態變化的快慢。研究發現流形上低曲率區域的細胞具有高信息速度,反映了過渡態細胞的動力學性質,并揭示了細胞表型轉化類似于廣義相對論“時空引導物質運動”的特性,即不同體系都體現了“流形幾何結構引導細胞動力學”的規律。
對復雜系統中臨界點的研究至今仍是一個活躍的研究領域。信息幾何及Fisher信息,為刻畫相變過程提供了一種強有力的手段;由于無需預先定義哈密頓量或系綜函數,該方法可輕松適用于非平衡系統。因此,SCIM模型不僅為分析單細胞表型轉化提供了一個理論框架,更有望揭示廣泛的復雜系統轉變過程中所蘊含的深層原理。
相關研究成果以“Geometric Quantification of Cell Phenotype Transition Manifolds with Information Geometry”為題,發表在 Cell Systems 期刊上,為量化復雜生物系統的非平衡動力學提供了全新的數學物理視角。

SCIM框架示意圖
中國科學院理論物理研究所王維康副研究員和北京大學北京國際數學研究中心/數學科學學院/定量生物學中心/國際機器學習中心張磊教授為該論文的共同通訊作者。中國科學院理論物理研究所博士生黃淼和北京大學大數據科學研究中心碩士研究生王宇軒為論文共同一作,論文合作者還包括中國科學院理論物理研究所周海軍研究員,博士生肖和與北京大學數學學院博士生應駿達。
該項研究得到了國家自然科學基金以及理論物理專款,國家重點研發計劃、北京自然科學基金等多項基金項目的支持與資助。
