新聞中心首頁
新華社杭州10月23日電(記者朱涵)百億參數(shù)人類基因組通用基礎模型“Genos”23日在浙江杭州召開的第二十屆國際基因組學大會上正式發(fā)布。
Genos基礎模型相關論文已于22日晚發(fā)表于生物學領域國際期刊《大數(shù)據(jù)科學》(GigaScience)上。記者了解到,在該基礎模型支持下,基因組研究邁向智能分析的時代,推動臨床疾病診斷、個人基因組解讀及前沿科學研究實現(xiàn)突破,助力人類加速讀懂“生命天書”。
該基礎模型由杭州華大生命科學研究院與之江實驗室聯(lián)合研發(fā)完成。杭州華大生命科學研究院院長劉龍奇表示,基因組學領域內的現(xiàn)有模型大多基于一到兩個參考基因組進行訓練,難以捕捉人類豐富的遺傳多樣性。而Genos基礎模型則系統(tǒng)整合了多個權威公開資源,首次匯聚了全球范圍內636個“端粒到端粒”級別的高質量人類基因組作為訓練數(shù)據(jù)。這些數(shù)據(jù)覆蓋了全球不同人群,旨在從源頭減少“數(shù)據(jù)偏見”,更全面地代表人類遺傳多樣性。
目前,在科研領域,Genos基礎模型能僅憑DNA序列“秒級”預測RNA表達譜,極大提升了生物信息分析流程的速度。在直接面向臨床應用的致病性突變解讀任務中,Genos基礎模型達到了92%的準確性,結合之江實驗室021科學基礎模型后,準確率能夠進一步提升至98.3%,為臨床診斷提供了高效工具。
據(jù)介紹,為進一步促進全球科研合作,Genos基礎模型將全面開源開放,同時提供12億和100億參數(shù)兩個版本,滿足不同應用場景的需求。目前,兩個版本的模型權重、架構細節(jié)與完整訓練流程均已公開發(fā)布。
![]() |
![]() |
![]() |
| 焦作網(wǎng)免責聲明: | ||||||||
|
||||||||
新華社杭州10月23日電(記者朱涵)百億參數(shù)人類基因組通用基礎模型“Genos”23日在浙江杭州召開的第二十屆國際基因組學大會上正式發(fā)布。
Genos基礎模型相關論文已于22日晚發(fā)表于生物學領域國際期刊《大數(shù)據(jù)科學》(GigaScience)上。記者了解到,在該基礎模型支持下,基因組研究邁向智能分析的時代,推動臨床疾病診斷、個人基因組解讀及前沿科學研究實現(xiàn)突破,助力人類加速讀懂“生命天書”。
該基礎模型由杭州華大生命科學研究院與之江實驗室聯(lián)合研發(fā)完成。杭州華大生命科學研究院院長劉龍奇表示,基因組學領域內的現(xiàn)有模型大多基于一到兩個參考基因組進行訓練,難以捕捉人類豐富的遺傳多樣性。而Genos基礎模型則系統(tǒng)整合了多個權威公開資源,首次匯聚了全球范圍內636個“端粒到端!奔墑e的高質量人類基因組作為訓練數(shù)據(jù)。這些數(shù)據(jù)覆蓋了全球不同人群,旨在從源頭減少“數(shù)據(jù)偏見”,更全面地代表人類遺傳多樣性。
目前,在科研領域,Genos基礎模型能僅憑DNA序列“秒級”預測RNA表達譜,極大提升了生物信息分析流程的速度。在直接面向臨床應用的致病性突變解讀任務中,Genos基礎模型達到了92%的準確性,結合之江實驗室021科學基礎模型后,準確率能夠進一步提升至98.3%,為臨床診斷提供了高效工具。
據(jù)介紹,為進一步促進全球科研合作,Genos基礎模型將全面開源開放,同時提供12億和100億參數(shù)兩個版本,滿足不同應用場景的需求。目前,兩個版本的模型權重、架構細節(jié)與完整訓練流程均已公開發(fā)布。
|
||||
| 焦作網(wǎng)免責聲明: | ||||||||
|
||||||||
|
|