原標題:北京腦科學與類腦研究所基因組學中心主任張力:國產(chǎn)算力硬件已能很好支持基因組學科研工作
高端芯片進口受限、核心基因數(shù)據(jù)庫禁止國內(nèi)用戶訪問……諸多外部事件,讓基因組學的國產(chǎn)科研方案從備選成為必選。但面對未充分運轉(zhuǎn)的國內(nèi)基因組學生態(tài)體系,科研人如何切換國產(chǎn)科研環(huán)境成為新問題。
近日,北京腦科學與類腦研究所基因組學中心主任張力在接受《中國科學報》專訪時表示,國產(chǎn)算力硬件已能很好地支持基因組學科研工作。而面對國內(nèi)海量基因測序與分析需求,國產(chǎn)軟件將迎來快速發(fā)展的機遇,并逐步實現(xiàn)基因組學計算生態(tài)的自主與可控。
國產(chǎn)算力能夠很好支持基因測序
“國產(chǎn)cpu(中央處理器)和gpu(圖形處理器)在某些直接性能測試中可能不如國外最新產(chǎn)品,但在實際應(yīng)用中,硬件參數(shù)并非決定因素,更重要的是算力設(shè)施對整個基因組學軟件生態(tài)的支撐與持續(xù)優(yōu)化能力?!睆埩娬{(diào),基因組學是數(shù)據(jù)密集型的,其研究核心是海量數(shù)據(jù)的處理和分析,而高性能計算是支撐這一過程的關(guān)鍵技術(shù)。
以全基因組測序為例,每1萬人的原始數(shù)據(jù)就達到1pb(1pb=106gb),經(jīng)初步處理后數(shù)據(jù)量通常會達到5pb。而對這種規(guī)模的數(shù)據(jù)進行處理,某些國產(chǎn)高性能計算平臺已可支撐。
盡管國產(chǎn)算力設(shè)施已能較好支持基因組學研究,但要實現(xiàn)基因組學的自主可持續(xù)發(fā)展,生態(tài)建設(shè)仍是關(guān)鍵。
“軟件大多用的是國外產(chǎn)品,國產(chǎn)軟件不是沒有,但嚴格說,從頂層設(shè)計到應(yīng)用沒有形成一個體系?!睆埩榻B,依托國內(nèi)海量基因測序與分析需求,基于國產(chǎn)硬件完善基因組學軟件工具鏈,可以應(yīng)對可能出現(xiàn)的極端情況。
生態(tài)缺失導致科研成果轉(zhuǎn)化難
建立基因組學的國內(nèi)生態(tài)體系,除能防范供應(yīng)鏈風險外,更重要的是可推進基因組學產(chǎn)業(yè)化應(yīng)用,加快科研成果轉(zhuǎn)化。
張力介紹,北京腦科學與類腦研究所基因組學中心建設(shè)時,從樣本采集到數(shù)據(jù)處理的整個流程都使用國產(chǎn)解決方案,但研究成果落地卻面臨產(chǎn)業(yè)化“鴻溝”。
目前,北京腦科學與類腦研究所承擔著由北京師范大學牽頭的中國學齡兒童腦智發(fā)育隊列的基因組學子任務(wù)。截至今年5月,該中心已完成6000名兒童橫斷隊列全基因組測序,但這些測序數(shù)據(jù)如何與第三方同步、進行產(chǎn)業(yè)化應(yīng)用,卻面臨一系列包括安全、產(chǎn)權(quán)、技術(shù)、運營等在內(nèi)的問題。
“我們的數(shù)據(jù)集不僅在國內(nèi)領(lǐng)先,在全球范圍內(nèi)也非常有競爭力,已有多家藥企表示感興趣。但如何實現(xiàn)數(shù)據(jù)安全共享,國內(nèi)并沒有標準化的解決方案。”張力表示,產(chǎn)業(yè)化難題與基因組學生態(tài)體系不完善密切相關(guān)。
目前,我國正在努力推進建立人類遺傳資源保護和利用體系,通過完善的頂層設(shè)計,綜合產(chǎn)權(quán)、技術(shù)、運營等方面打造創(chuàng)新模式,力圖在人工智能加速藥物研發(fā)的機遇窗口實現(xiàn)我國藥物研發(fā)的“彎道超車”。
生態(tài)發(fā)展需兼容國際主流研究環(huán)境
對于如何加快國內(nèi)基因組學生態(tài)體系建設(shè),張力表示,需從兼容性、完善性和人才培養(yǎng)多方面入手,在兼容國際主流研發(fā)環(huán)境的情況下,逐步構(gòu)建并優(yōu)化國產(chǎn)軟硬件生態(tài)。
“兼容國際主流生態(tài)并不意味著被動跟隨,而是要在保證兼容性的同時,逐步構(gòu)建起具有中國特色的國產(chǎn)生態(tài),并培養(yǎng)一批能夠熟練使用國產(chǎn)軟硬件的技術(shù)人才。”張力說。
他舉例,在與國內(nèi)某廠商合作中,對方曾派出三四十人的團隊就北京腦科學與類腦研究所500多款生物學專業(yè)軟件進行優(yōu)化,以適配該公司提供的算力平臺。
雖然遷移最終完成了,但生物學軟件都在持續(xù)迭代,若不能兼容國際主流生態(tài)或開發(fā)出國產(chǎn)硬件的軟件版本,每個海外軟件新版本遷移都需要投入大量人力和時間,這將導致使用成本大幅上升。
“在當前窗口期,需要在國產(chǎn)兼容生態(tài)上加快完善國產(chǎn)工具鏈,抓住人工智能加速藥物研發(fā)的歷史機遇,逐步建立和推廣中國標準與軟硬件生態(tài)?!睆埩φf。(記者 趙廣立)
【打印本頁】【關(guān)閉窗口】