“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。大数据存储是将这些数据集持久化到计算机中。
中文名大数据存储
定义大数据存储是指大数据的存储问题
外文名big data storage
主要特点实时性或者近实时性
基本介绍
“大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。这里的“大”有几层含义,它可以形容组织的大小,而更重要的是,它界定了企业中IT基础设施的规模。业内对大数据应用寄予了无限的期望 – 商业信息积累的越多价值也越大 – 只不过我们需要一个方法把这些价值挖掘出来。
随着大数据应用的爆发性增长,它已经衍生出了自己独特的架构,而且也直接推动了存储、网络以及计算技术的发展。毕竟处理大数据这种特殊的需求是一个新的挑战。硬件的发展最终还是由软件需求推动的,就这个例子来说,我们很明显的看到大数据分析应用需求正在影响着数据存储基础设施的发展。
从另一方面看,这一变化对存储厂商和其他IT基础设施厂商未尝不是一个机会。随着结构化数据和非结构化数据量的持续增长,以及分析数据来源的多样化,此前存储系统的设计已经无法满足大数据应用的需要。存储厂商已经意识到这一点,他们开始修改基于块和文件的存储系统的架构设计以适应这些新的要求。在这里,我们会讨论哪些与大数据存储基础设施相关的属性,看看它们如何迎接大数据的挑战。[1]
对比
大数据存储和传统的数据存储的不同
大数据应用的一个主要特点是实时性或者近实时性。
类似的,一个金融类的应用,能为业务员从数量巨大种类繁多的数据里快速挖掘出相关信息,能帮助他们领先于竞争对手做出交易的决定。
数据通常以每年增长50%的速度快速激增,尤其是非结构化数据。随着科技的进步,有越来越多的传感器采集数据、移动设备、社交多媒体等等,所以数据只可能继续增长。
总而言之,大数据需要非常高性能、高吞吐率、大容量的基础设备。[2]
相关推荐
最新文章