用好科技資源 支撐創(chuàng)新發(fā)展
2018年、2019年連續(xù)兩年,組學(xué)數(shù)據(jù)庫(kù)權(quán)威雜志《核酸研究》對(duì)前一年的全球基因組數(shù)據(jù)庫(kù)建設(shè)進(jìn)行總結(jié),鮮見(jiàn)地在美英兩個(gè)老牌的數(shù)據(jù)庫(kù)以外,提到了中國(guó)的GSA(組學(xué)原始數(shù)據(jù)歸檔庫(kù))。
“美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information,簡(jiǎn)稱NCBI)和英國(guó)歐洲生物信息學(xué)中心(European Bioinformatics Institute,簡(jiǎn)稱EBI)30多年前已經(jīng)開(kāi)始建立,我們的GSA是2015年底才上線運(yùn)營(yíng)的。”國(guó)家基因組科學(xué)數(shù)據(jù)中心主任鮑一明介紹,中心的組學(xué)數(shù)據(jù)庫(kù)之所以能夠得到權(quán)威雜志的認(rèn)可“點(diǎn)名”,一方面是由于數(shù)據(jù)量增長(zhǎng)快,另一方面是數(shù)據(jù)的可用性、標(biāo)準(zhǔn)化方面的工作均與國(guó)際接軌。
據(jù)了解,針對(duì)我國(guó)基因組學(xué)數(shù)據(jù)“存管用”的實(shí)際需求,解決數(shù)據(jù)孤島等重大問(wèn)題,科技部、財(cái)政部共同支持組建國(guó)家基因組科學(xué)數(shù)據(jù)中心,依托中國(guó)科學(xué)院北京基因組研究所,聯(lián)合中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所和中國(guó)科學(xué)院生物物理研究所共同建設(shè)。中心的科學(xué)數(shù)據(jù)專業(yè)化團(tuán)隊(duì),對(duì)外提供基因組學(xué)數(shù)據(jù)統(tǒng)一存儲(chǔ)、整合挖掘、共享應(yīng)用的一站式數(shù)據(jù)服務(wù)。
順應(yīng)大健康需求,構(gòu)筑自主數(shù)據(jù)基礎(chǔ)
“之前,中國(guó)已成為基因組數(shù)據(jù)產(chǎn)出大國(guó),但未能形成國(guó)家級(jí)公共數(shù)據(jù)資源。”鮑一明介紹,面向國(guó)家大數(shù)據(jù)戰(zhàn)略發(fā)展需求,國(guó)家基因組科學(xué)數(shù)據(jù)中心圍繞人、動(dòng)物、植物、微生物基因組數(shù)據(jù),重點(diǎn)開(kāi)展了數(shù)據(jù)資源及數(shù)據(jù)庫(kù)體系建設(shè),并開(kāi)展了數(shù)據(jù)服務(wù)、系統(tǒng)運(yùn)維、技術(shù)研發(fā)、數(shù)據(jù)挖掘等系列工作。目前,國(guó)家基因組科學(xué)數(shù)據(jù)中心已擁有自主知識(shí)產(chǎn)權(quán)的基因組數(shù)據(jù)匯交、管理與共享系統(tǒng),保障數(shù)據(jù)安全性,支撐并服務(wù)于國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、中科院先導(dǎo)專項(xiàng)等300余個(gè)科研項(xiàng)目的數(shù)據(jù)存儲(chǔ)、管理和共享。
在生命科學(xué)研究領(lǐng)域,研究者獲得的基因組學(xué)數(shù)據(jù),均需上傳到專業(yè)數(shù)據(jù)庫(kù),方可在雜志上發(fā)表。如今,我國(guó)已擁有獲得認(rèn)可的組學(xué)數(shù)據(jù)庫(kù),這將大大提高中國(guó)高水平論文被接收過(guò)程的便捷性。“中國(guó)的學(xué)者不需要再將數(shù)據(jù)‘飄洋過(guò)海’傳輸?shù)胶M猓梢垣@得更加專業(yè)化的中國(guó)式服務(wù)。我們的平臺(tái)已被多家國(guó)際頂級(jí)雜志認(rèn)可,中國(guó)學(xué)者將數(shù)據(jù)提交到GSA系統(tǒng),其發(fā)表的論文已經(jīng)被多個(gè)國(guó)際知名期刊所收錄,這包括CNS(《細(xì)胞》《自然》《科學(xué)》簡(jiǎn)稱)、美國(guó)科學(xué)院院刊等。”鮑一明說(shuō),這為“用好科技資源、支撐創(chuàng)新發(fā)展”提供了基礎(chǔ)。
截至2019年8月,國(guó)家基因組科學(xué)數(shù)據(jù)中心已為國(guó)內(nèi)外150多個(gè)單位提供免費(fèi)數(shù)據(jù)存儲(chǔ)服務(wù),累計(jì)用戶遞交項(xiàng)目信息超過(guò)1200個(gè),用戶提交的測(cè)序數(shù)據(jù)量超過(guò)1.2PB,收集并存儲(chǔ)的數(shù)據(jù)總量超過(guò)4PB,數(shù)據(jù)上傳下載量日均達(dá)到1TB。
與國(guó)際接軌,不做信息孤島
生物信息的數(shù)據(jù)要海量整合后才會(huì)有價(jià)值,割裂的數(shù)據(jù)庫(kù)只完成了“存”卻難以走向“使用”。例如對(duì)人類組學(xué)數(shù)據(jù)的整合和挖掘?qū)⒏娴孬@得人類健康問(wèn)題的解決方案,避免“盲人摸象”。
這正是國(guó)家基因組科學(xué)數(shù)據(jù)中心成立的初衷和建設(shè)的方向。在科學(xué)數(shù)據(jù)共享方面,科技部長(zhǎng)期致力于打破條塊分割,對(duì)相關(guān)部門和行業(yè)長(zhǎng)期持續(xù)積累的數(shù)據(jù)資源,以及對(duì)國(guó)家科技計(jì)劃項(xiàng)目的數(shù)據(jù)進(jìn)行整理、匯交和建庫(kù),同時(shí)提高與國(guó)際科學(xué)數(shù)據(jù)組織的信息交換能力。
2019年,我國(guó)國(guó)家基因組科學(xué)數(shù)據(jù)中心組學(xué)數(shù)據(jù)庫(kù)被國(guó)際著名出版商Elsevier收錄為指定基因數(shù)據(jù)歸檔庫(kù),其權(quán)威性得到國(guó)內(nèi)外100余家學(xué)術(shù)雜志的認(rèn)可。國(guó)家基因組科學(xué)數(shù)據(jù)中心已經(jīng)成為有國(guó)際影響力的基因組科學(xué)數(shù)據(jù)中心。
目前,國(guó)家科技基礎(chǔ)條件平臺(tái)中心正在組織國(guó)家科學(xué)數(shù)據(jù)中心編制五年建設(shè)運(yùn)行實(shí)施方案。未來(lái),國(guó)家基因組科學(xué)數(shù)據(jù)中心將繼續(xù)圍繞基因組科學(xué)研究前沿及數(shù)據(jù)的存管用需求,逐步完善中心組織管理架構(gòu)與運(yùn)行機(jī)制,強(qiáng)化隊(duì)伍建設(shè),培養(yǎng)復(fù)合型數(shù)據(jù)人才;建立數(shù)據(jù)共享、質(zhì)量控制、安全管理等標(biāo)準(zhǔn)與規(guī)范,利用云計(jì)算、人工智能、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù),提升數(shù)據(jù)儲(chǔ)存、管理、挖掘與共享能力;發(fā)展數(shù)據(jù)加密、解密、分級(jí)管理、受控訪問(wèn)等數(shù)據(jù)安全關(guān)鍵技術(shù),建立人類遺傳資源數(shù)據(jù)管理體系,確保國(guó)家重要生物資源數(shù)據(jù)本地化存儲(chǔ)、管理與共享利用。
鮑一明表示,希望經(jīng)過(guò)5年努力,建成匯聚海量科學(xué)數(shù)據(jù)、服務(wù)萬(wàn)家機(jī)構(gòu)、引領(lǐng)大數(shù)據(jù)技術(shù)創(chuàng)新的國(guó)際一流基因組科學(xué)數(shù)據(jù)中心,切實(shí)解決我國(guó)基因組數(shù)據(jù)存管用難、數(shù)據(jù)流失嚴(yán)重、核心基因組科學(xué)信息資源先“出口”再“進(jìn)口”的問(wèn)題,不斷提升我國(guó)在基因組學(xué)大數(shù)據(jù)領(lǐng)域的國(guó)際話語(yǔ)權(quán)。(張佳星)
關(guān)鍵詞: 科技資源
最新資訊
關(guān)于我們 廣告服務(wù) 手機(jī)版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.w4vfr.cn 愛(ài)好者日?qǐng)?bào)網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com