近日,深圳承啟生物科技有限公司(以下簡稱“承啟生物”)利用自主研發的云平臺Chi-Cloud及高精度算法FANSe3,實現了單機5分鐘分析完成一個全基因組數據集。這使得基因檢測結果向“立等可取”、“又快又準”邁進了一大步,大力推進了精準醫學的普及落地。

  5分鐘,不僅僅是速度

  單機5分鐘解碼全基因組究竟意味著什么?

  在臨床上,醫生往往是和死神賽跑,時間就是生命。從“天”到“分鐘”的速度飛躍,或許就是“生死之別”。對患者來說,尤其是重癥患者,都會希望能夠指導治療方案的基因檢測分析結果,能出得越快越好。而除了出結果的速度,基因檢測高昂的價格也是阻礙精準醫學應用的關鍵因素之一,在測序實驗成本不斷降低的情況下,分析成本逐漸成為了精準醫學檢驗流程中的主要成本板塊。

  龐大數據分析,壁壘重重

  當測序儀運行速度越來越快,測定全基因組只需要1天的時候,人們發現分析成為了新的瓶頸。從原始數據到分析出基因突變,用服務器通常要幾十個小時才能計算完成。即便使用大規模的超算集群、輔以FPGA等專用硬件加速的方案,多數也需數小時,并且要付出成本高昂、不易擴展和改進的代價。當然,亞馬遜、阿里云等云服務廠商也曾經試驗過同時采用超多高性能節點進行極限挑戰,將單任務處理時間壓縮到了15-30分鐘,但在目前的云服務定價體系下,這樣處理能力的系統連續運行一年所需要的費用可達數百萬元甚至更高 -- 這也正是諸多超級計算機雖世界排名前列,但無法對單個普通民眾提供高性價比服務的原因。同時,數據傳輸費用也是傳統云服務商的一大筆開銷。

  自主創新,突破“不可能挑戰”

  由于算法原理的限制,目前常用的國外算法若要保持一定精度,則在速度上已難有質的突破。因此,為了能在保證精準的前提下達到速度突破,承啟生物團隊拋開傳統算法的框架,自主研發了底層算法FANSe系列算法,這是目前國內唯一規?;逃玫娜灾髦R產權的高性能測序比對算法,其準確度在各種實測中大幅度領先國外算法。2017年,承啟生物基于FANSe3開發的新一代私有云平臺Chi-Cloud,就實現了全轉錄組測序數據的秒級分析,并發表在英國著名的權威學術期刊《核酸研究》上。2018年,承啟生物更是創下了“1分鐘解碼2萬個基因信息(全外顯子組)”的世界紀錄。承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud

  近年來,隨著醫學和遺傳學的進展,越來越多的疾病被發現與外顯子區段以外的部分高度相關,因而全基因組測序分析的需求日益增長。經過承啟生物技術團隊不懈的改良優化,對數據量擴大了50倍不止的人全基因組測序數據,現在也實現了單機5分鐘左右得到完整分析結果的“立等可取”的分析速度。

  更值得一提的是,達到這個速度,承啟生物并沒有動用大型服務器,只是使用了一臺高端的家用電腦。所有運算只使用CPU,無需任何GPU、FPGA等專用硬件加速。這意味著基因組測序基礎分析的成本已達到了幾乎忽略不計的程度。在對數據保密性有高要求的一些特殊領域(如軍事、公共安全、特定的醫療場景等),可直接采用這種單機分析的方式,而無需采購和維護大型計算集群,無需連接到互聯網。自主研發、不依賴專用硬件的特性使得各種功能增加與改進十分方便,可擴展性強,且不會受制于特定硬件平臺,從根本上避免了芯片禁運導致的風險。同時,該云平臺兼容目前國內外所有主流測序儀,并針對國產測序儀進行了特別適配和優化,有力地保障了精準醫學的國家安全。

  立等可取,精準醫學近在眼前

  超高速、低成本的分析及更精確的結果解讀,基因檢測即將迎來立等可取的廣泛應用場景,也將對整個行業的發展提供有力支撐。對研究人員而言,可更高效地分析基因組數據,大力推動精準醫學、藥物研發和疾病治療等領域加速發展。對百姓而言,以前緩慢昂貴的精準醫學檢測將變得更快速、實惠,診斷和治療將更有效、便宜;尤其是情況危急的病患,快速準確的基因組分析能在第一時間幫助醫生快速診斷和制定最佳治療方案,將拯救更多生命。


責任編輯:小歐