神彩官方-神彩争8官方生命科学领域的“超存”挑战:数据如何存储100年?

  • 时间:
  • 浏览:1
  • 来源:大发快三下载安装

大咖介绍:(从左往右)神彩官方-神彩争8官方宋家雨,Dos神彩官方-神彩争8官方tor存储在线总编辑谢长生,华中科技大学武神彩官方-神彩争8官方汉光电国家研究中心教神彩官方-神彩争8官方授曾文君,深圳国家基因库生物信息数据库主任孙 斌,浪潮存储产品线副总经理正文:近日,在DOIT存储峰会上,浪



大咖介绍:(从左往右)

宋家雨,Dostor存储在线总编辑

谢长生,华中科技大学武汉光电国家研究中心教授

曾文君,深圳国家基因库生物信息数据库主任

孙 斌,浪潮存储产品线副总经理

正文:

近日,在DOIT存储峰会上,浪潮存储产品线副总经理孙斌、华中科技大学武汉光电国家研究中心教授谢长生、深圳国家基因库生物信息数据库主任曾文君,同时就基因研究带来的数据存储挑战接受了媒体采访。

基因库建设对于社会发展具有重要意义,而基因库的身前承载的是海量的数据存储。2019年是国家基因库建成的第3周年,现已具备88PB数据存储能力、691万亿次/秒计算能力。截至目前,国家基因库支持着国内外1500多个项目,如此在技术上怎么同时满足哪几种业务的都可以?基因库数据有哪几种不同的价值形式?基因数据在数据存储、数据保护和数据迁移里边临着哪几种技术挑战?让大伙儿儿听听大咖的解答。

宋家雨:基因是另三个小 有点痛 热说说题,它使人类在消病延年的路上不断向前推进,在生命科学基因研究领域,有哪几种样的应用?对存储提出怎么的需求和挑战?

深圳国际基因库生物信息数据库主任 曾文君

曾文君:BT(生物技术)的发展拉着IT在走,在生命科学领域,有个词叫“超存”,将会对存储的要求非常巨大,远超对算力的要求。

另三个小 人的基因组,它的原始大小共就说 我十个 GB左右,蕴藏了150亿个碱基,由A、T、C、G十个 碱基对组成的。在全基因测序过程中,为了保证基因数据的删改性,都可以平行测序150次,当最终测序完成后,全基因组数据将达到最少1150GB左右,只仅仅是另三个小 单体,可想而知在广泛的人口中,这是另三个小 非常庞大的数据量。

整个基因分析研究,分为基因测序、基因数据分析和基因数据归档另三个小 阶段。其一,基因测序的整个过程是不允许被中断的,这就要求支撑测序应用的存储系统,具备极致的稳定性和可靠性;另外,基因测序25微秒收集一幅高清晰图像,对性能要求也超过了现有闪存固态盘的最高波特率,都可以采用很快的傲腾固态盘;其二,基因数据分析工作中,对存储系统的性能、小文件处神彩官方-神彩争8官方置能力提出很高要求;其三,在数据归档阶段,都可以将海量基因数据长期、删改、安全的保存起来,存储系统的采购成本、能耗,是另三个小 很大的挑战。

总的来说,BT(生物技术)的发展拉着IT在走,数据为何存、为何算、为何长期保存,对IT来说,尤其存储来说,是个非常巨大的挑战。大伙儿儿知道“超算”,它是对算力的要求,有刚刚在生命科学领域,有个词叫“超存”,将会对存储的要求非常巨大,远超对算力的要求。

宋家雨:生命科学基因研究身前,面临着海量数据存储和应用的挑战,学术界有哪几种新的存储技术趋势?

华中科技大学武汉光电国家研究中心教授 谢长生

谢长生:“数据怎么存储1150年,是个具有挑战性的问题,有点痛 是基因分析研究你是什么 都可以长期存储的应用。全息存储、玻璃存储、突破光学的超衍……哪几种技术,非常值得大伙儿儿加快波特率去研究。”

计算机和数据专家提出怎么处置数字黑暗时代的命题,是指随着IT硬件的失效和软件的过时,就说 我数字信息在未来将会将会机器和软件程序运行运行无法读取而丢失。“数据怎么存储1150年”,是个具有挑战性的问题。正如现在的基因数据,理论上说应该是永远保存下去的。

针对你是什么 命题,有两种生活主流的未来技术。

首先,最接近产品化的是全息存储技术。用你是什么 技术都可以保存150年。全息存储处置了光盘介质容量小、密度低的问题,目前全息存储技术将会都可以做到单张光盘存储1.5TB容量,再往后发展,目标是8TB,另另三个小 就处置了存储容量的问题。

其次,玻璃盘技术。5微米都可以记一层,2毫米都可以记几百层,就说 我理论上它的容量都可以做到很大,一张盘都可以存150TB,有刚刚玻璃是很稳定的介质,都可以永久保存。

再次,突破光学衍射极限的超分辨光存储技术。该技术用双光束的办法突破了光学衍射物理极限,将光点缩小到现在的1%。你是什么 技术上将会实现了,比现在光盘面密度提高了1150倍,它还都可以多层,实现2个数量级的提高。

哪几种技术,非常值得大伙儿儿加快波特率去研究,将会存储的需求在那里,有点痛 是基因分析研究你是什么 都可以长期存储的应用,在测序都可以求存储高性能、高可靠,长期保存时,要求存储大容量、高性价比,就说 我面对哪几种挑战,大伙儿儿有技术正在应对,有刚刚这都可以时间的听候。

宋家雨:面对生命科学领域的海量数据存储和应用需求,浪潮拥有完善的存储产品线,既有分布式存储都不 集中式存储,客户到底该怎么选者?

浪潮存储产品线副总经理 孙斌

孙斌:到底是使用分布式架构还是集中式架构,往往是由客户的应用类型、应用环境和所都可以的存储性能、容量、成本、功耗等等哪几种因素决定的,大伙儿儿会根据种种需求给出最适合业务应用的处置方案。

大伙儿儿称2019年是新数据时代元年,在新数据时代,都可以有与之对应的新存储之道,浪潮会针对不同行业、不同领域和不同客户应用梳理大伙儿儿的存储处置方案。而生命科学领域,是浪潮非常看重的领域,目前大伙儿儿的客户包括生命科学研究系统、芯片研究企业、高校等等。

大伙儿儿发现生命科学领域所使用的存储的架构,多数是分布式存储,但还有一主次是集中式存储架构。到底是使用分布式架构还是集中式架构,往往是由客户的应用类型、应用环境和所都可以的存储性能、容量、成本、功耗等等哪几种因素决定的,大伙儿儿会根据种种需求给出最适合业务应用的处置方案。

Dostor存储在线总编辑 宋家雨

在新数据时代下,商业、技术、应用、需求等等都不 发展和演变,是Scale-up还是Scale-out,如此另三个小 标准答案所处,关键是在于大伙儿儿要时刻地关注最新的存储技术发展,有刚刚结合最新应用都可以,把存储能力运用到最好,这就说 我 新存储之道。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)