“科學(xué)研究正變成一個又一個大數(shù)據(jù)問題。”天迪工控總工程師舉例說,“千人基因組計劃”每月產(chǎn)生1萬億條堿基序列信息,我國30多個在軌民用航天平臺每年有超過3PB遙感衛(wèi)星數(shù)據(jù),F(xiàn)AST 射電望遠(yuǎn)鏡的數(shù)據(jù)產(chǎn)出速度是6000億條記錄/年,大型強(qiáng)子對撞機(jī)實(shí)驗(yàn)每年產(chǎn)生15PB原始數(shù)據(jù)……“未來,基于對科學(xué)大數(shù)據(jù)的處理和分析將成為發(fā)現(xiàn)新知識的基本特征?!?
其實(shí),去年8月底,國務(wù)院就發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,明確提出要發(fā)展科學(xué)大數(shù)據(jù),以實(shí)現(xiàn)科學(xué)數(shù)據(jù)的開放共享和應(yīng)用服務(wù)。今年7月,《十三五國家科技創(chuàng)新規(guī)劃》進(jìn)一步明確了多個重點(diǎn)領(lǐng)域的大數(shù)據(jù)發(fā)展規(guī)劃,比如在人工智能方面,要“重點(diǎn)發(fā)展大數(shù)據(jù)驅(qū)動的類人智能技術(shù)方法”;在材料基因工程方面,要研發(fā)“材料大數(shù)據(jù)”等四大關(guān)鍵技術(shù);在先進(jìn)高效生物技術(shù)方面,要加快推進(jìn)“生物大數(shù)據(jù)”等生命科學(xué)前沿關(guān)鍵技術(shù)突破;在生態(tài)環(huán)保方面,要開發(fā)“生態(tài)環(huán)境大數(shù)據(jù)”應(yīng)用技術(shù);在精準(zhǔn)醫(yī)學(xué)方面,要建立“國家生物醫(yī)學(xué)大數(shù)據(jù)共享平臺”;在空天探測開發(fā)和利用方面,開展“多源多尺度時空大數(shù)據(jù)分析與地球系統(tǒng)模擬”等核心關(guān)鍵技術(shù)研究及示范應(yīng)用。
科學(xué)大數(shù)據(jù)的海量、多源、異構(gòu)、高維等特征,向傳統(tǒng)HPC系統(tǒng)發(fā)起了全新的挑戰(zhàn)。“多數(shù)科研項目的數(shù)據(jù)量非常巨大并快速變化,而且往往是分布、異構(gòu)的,傳統(tǒng)的數(shù)據(jù)管理模式已不能滿足需要;此外對科學(xué)大數(shù)據(jù)的‘計算’包括了從數(shù)據(jù)獲取、管理到分析、可視化的全過程,傳統(tǒng)的高性能計算亟需將服務(wù)向外延拓展?!苯忉屨f。
作為誕生于科研國家隊、多年服務(wù)于科研領(lǐng)域的HPC領(lǐng)軍企業(yè),曙光敏銳地洞察到科學(xué)大數(shù)據(jù)的未來前景及其對“計算-存儲-分析”架構(gòu)提出的更高要求,率先將“大力發(fā)展科學(xué)大數(shù)據(jù)”列入公司“數(shù)據(jù)中國加速計劃”戰(zhàn)略,為科學(xué)大數(shù)據(jù)引擎的進(jìn)一步開發(fā)和水平提高提供了有力的保障。