1.用戶需求
生命科學(xué)做為21 世紀(jì)最重要的科學(xué)分支之一,高性能計算在生命科學(xué)的研究和發(fā)展中起來非常重要的作用。由于測序技術(shù)的飛速發(fā)展,人類發(fā)現(xiàn)的基因序列數(shù)目按照指數(shù)級增長,那么對于如此數(shù)量龐大的基因進行同源性搜尋,比對,分析,遺傳發(fā)育分析等等,往往伴隨著巨大的數(shù)據(jù)處理量和并行計算量。同時,由于生命科學(xué)的研究對象往往是蛋白質(zhì)和DNA 的大分子,對這些分子的三維結(jié)構(gòu)的預(yù)測,動力學(xué)特性、熱力學(xué)特性、在生命過程中如何發(fā)生作用,這些科學(xué)問題也要借助于高性能計算機。所以高性能計算機在生命科學(xué)研究中,應(yīng)用非常廣泛,扮演著及其重要的角色。
目前隨著計算機技術(shù)的和計算能力的飛速發(fā)展,高性能計算機能滿足生命科學(xué)的海量計算和數(shù)據(jù)分析的需求,高性能計算主要運用在生物信息學(xué)分析、蛋白質(zhì)三維結(jié)構(gòu)研究、新藥研發(fā)、基因序列測序、蛋白質(zhì)三維結(jié)構(gòu)結(jié)晶等各個方面,高性能計算已經(jīng)成為現(xiàn)代生命科學(xué)發(fā)展中必不可少的研究手段。
醫(yī)衛(wèi)信息和數(shù)據(jù)的安全,同樣也是中國國家信息安全的重要內(nèi)容。為了應(yīng)對日益突出的生物安全需求,軍事科學(xué)院曾主持設(shè)計了“生物安全防御系統(tǒng)”。針對新發(fā)傳染病的未來威脅,構(gòu)建國家戰(zhàn)略層面的傳染病偵察和媒介生物控制平臺,從而形成一整套“安全防御系統(tǒng)”。
利用自主可控技術(shù)構(gòu)建生命信息科學(xué)領(lǐng)域的計算、支撐環(huán)境是本方案的宗旨
2. 現(xiàn)存問題
根據(jù)不同的計算特點和模式,生命科學(xué)分為如下應(yīng)用模式:
1) 生物信息學(xué)(序列搜尋比對分析)。
這一領(lǐng)域主要指以蛋白質(zhì)和核算序列為研究對象,對序列進行同源及相似性搜尋、比對、序列分析、遺傳發(fā)育分析等,應(yīng)用軟件數(shù)量巨大(數(shù)十種),各種軟件在同源性分析算法上各有特點。
2) 分子動力學(xué)。
分子動力學(xué)是一套分子模擬方法,該方法在定義原子之間作用勢的基礎(chǔ)上,依靠牛頓力學(xué)來模擬分子體系的運動 ,從而探索體系的動力學(xué)特性和熱力學(xué)特性。
3) 分子對接(藥物設(shè)計)。
計算為主分子對接使依據(jù)配體與受體作用的“鎖-鑰原理”,模擬小分子配體與受體生物大分子相互作用。通過計算,可以預(yù)測兩者間的結(jié)合模式和親和力,從而進行藥物的虛擬篩選。
4) 測序儀離線處理。
DNA測序儀是用于測量DNA(基因)序列的高級試驗儀器,是生命科學(xué)研究中必不可少的儀器設(shè)備、獲得重要科研進展的重要工具。DNA測序儀價格昂貴,其研究過程分為準(zhǔn)備試劑,儀器測序到最后的儀器離線處理,從而獲得科學(xué)家可以辨識的基因序列,在這個的基礎(chǔ)上,科學(xué)家可以利用測量獲得的序列進行拼接、比對、同源性分析等等。
5) 電子顯微鏡圖象處理。
電子顯微鏡是生命科學(xué)研究中不可或缺的高級實驗儀器, 其中基于冷凍電鏡和三維重構(gòu)方法的生物大分子的結(jié)構(gòu)和功能的研究是國際上的研究熱點,而電子顯微鏡所獲得的大量的原始圖象遠遠超過了人- 10 - 的認知范疇,需要借助高性能計算機進行圖象處理,從而獲得人類認知范疇內(nèi)的實驗數(shù)據(jù)和圖象。
6) 質(zhì)譜儀原始資料處理。
在蛋白質(zhì)科學(xué)研究中,科學(xué)家需要通過質(zhì)譜儀和高性能計算機來獲得蛋白質(zhì)的序列信息,從而實現(xiàn)從蛋白質(zhì)一級結(jié)構(gòu)到三級結(jié)構(gòu)的研究。
3. 如何解決
針對上述多種生命科學(xué)的應(yīng)用,本著安全、可靠、高效的原則,方案中選擇64位龍騰服務(wù)器及胖節(jié)點作為計算系統(tǒng);配置高性能的全光纖 SAN存儲系統(tǒng).,通過混搭方式完成生命科學(xué)中的不同作業(yè)流程。
基于龍芯刀片的高性能集群系統(tǒng),不僅具有Cluster架構(gòu)的普適性優(yōu)點,而且更加符合現(xiàn)代高性能計算機對計算密度、能耗、可靠性、易用性等方面的要求,是高性能計算的最佳平臺。
對于峰值性能通常超過數(shù)Tflops的大規(guī)模并行計算機而言,刀片式集群系統(tǒng)在計算密度、功耗散熱、運營成本、維護成本、可靠性等方面,都明顯優(yōu)于其他系統(tǒng),且為系統(tǒng)的擴容升級提供了良好的基礎(chǔ)。
龍芯3A是我國新一代高性能計算機通用CPU,集成了四個64位超標(biāo)量處理器核、4MB的二級Cache、兩個DDR2/3內(nèi)存控制器、兩個高性能HyperTransport控制器,可以滿足生命科學(xué)中對MPI并行性要求較高的計算需求。