生命科学从细胞的发现到生物工程、基因工程的发展及应用,研究变得更加趋于系统化、规模化、数字化。突出表现之一便是一大批生物基因组测序的完成,催生了生物信息学的迅速发展。高通量测序实验技术以及生物信息学在生命科学研究和人类健康领域的应用,将生物信息转化为数字信息,这些数据来自于大量的生物样本、科研中间数据和实验结果,数据类型以文件为主,通过多次的、多工作组的科学计算。这些数字信息如同开采金矿一样,等待被挖掘出价值。因此,海量生物数据的存储、读取、挖掘处理面临着机遇与挑战。
随着高通量测序实验及生物信息学在人类健康领域的应用,数据呈现出快速的增长,其业务场景特有的多任务分析流程力求自动化实现数据大量的迭代运算和反复读写,对存储系统提出了新的挑战。有效的存取大规模生物数据,将对匹配业务的开展和完成起到提高效率的作用。

分布式集群存储系统,帮助客户解决数据空间和数据持久化。提供弹性的、并发的PB 级统一存储资源池,满足计算集群几十个至上百个节点并发读写、数据共享。其可扩展特性,易于实现非结构化数据快速增长下的逐步扩容。分布式集群存储系统整合生产、科研、仪器的存储需求,达成数据在分析流程各环节中流动,支持流程自动化的实现。

分布式集群存储系统,支持容器化部署,可将客户部分计算分流到存储系统,优化数据流向、降低网络负荷,切实提高生产效率。