海量非结构化数据“超可用”在哪儿?这是爱数给出的答案

数据大爆炸时代,海量非结构化数据管理需要一种全新的智慧。

11月2日,爱数举办了一场线上发布会,发布了全新的AnyBackup Family 7海量非结构化数据超可用解决方案。关注爱数的都知道,AnyBackup是爱数的一张王牌产品,它通过先进的CDM、CDP、双活、备份集技术以及BCS服务,联合各类数字化技术,在数据超级多、系统超级复杂、环境超级异构的挑战下,更普适性地助力企业和组织从数据到平台再到应用的可用性建设。

而这一次的发布,爱数更加强调了“快”,快到超乎想象。这让我们充满了好奇,究竟能有多快?

除了这个疑问以外,还有一点值得强调,那就在今年的七月份,爱数刚刚发布了全新的企业内容管理平台AnyShare Family 7。在短短的几个月连续对两大产品线进行升级,足见爱数对数据管理市场的拓展能力和决心。

那么,这一次,爱数AnyBackup Family 7的超可用能力在哪儿?快在哪儿?透过本文,我们来寻找答案。顺便管中窥豹,来看看高密集推陈出新的背后,爱数数据管理的大智慧。

海量非结构化数据,管理很难

我们常常说非结构化数据管理难题,很多人可能体会不到。以个人为例,现在,随着移动端发展,我们每个人都有大量的音频、视频、照片存在手机里,积累的多了,有的人怕手机丢失,这就产生了非结构化数据管理难题。不少人上传到网盘、QQ空间以做备份。

当然,这只是一个简单的比喻,因为,企业级数据的管理可比个人难多了。个人数据丢了也没什么大事,企业数据丢了将将造成重大经济损失。

而且,现在,非结构数据存在于各行各业,比如,银行的票据影像、医院的PACS影像、档案馆的档案数字化文件、制造业的设计图纸以及生产质量数据等等,都是典型的非结构化数据。

数据量有多大?据IDC 预测,到2025 年全球产生的数据量将会增长到175ZB,其中超过80%-90%的数据都会是处理难度较大的非结构化数据。这就意味着,对非结构化数据的处理,将是每一家企业都必须重点突破的课题。

接下来,我们再从几个具体例子来看看非结构化数据的管理难题。

比如在金融行业,金融行业的数据主要是身份证扫描件、现场照片、纸质文件的扫描件等电子影像,虽然文件大小只有几十KB,但增量大,每天能增加1-2TB。而且金融行业需要在规定的时间内完成备份,有的企业采用NDMP的备份方案,备份速度只有几十MB/s。在数据恢复方面,一般需要1-2天,如果需要紧急恢复,则需要大量人工。

某省级的档案馆的数据管理也存在问题。现在国家正在建设数字档案馆,档案馆主要是数字化文件,传统备份方案备份速度仅有 2-3 MB/s,而且曾经因为网络抖动的问题,将近1年时间内都无法完成全备。数据恢复方面,1M、100KB、40KB 大小的海量小文件的备份性能会急剧下降,有时甚至会降至0。此外,还存在数据利用难、查询难的问题。

制造企业也十分典型,制造业主要包括生产工艺、产品说明、图纸、采购合同等数据,由于数据量太大,备份常常需要七十多个小时,有时迫于无奈,只能选择备份部分核心数据。而且大批量恢复速度慢,且无法精准恢复单个文件。

以上几个案例都在指向,海量非结构化数据下的数据管理亟需新的备份方式。

AnyBackup Family 7,“超”在哪?

承接上文,有人可能说了,关于数据管理、NDMP、对象存储等不都是解决方案吗?

这些传统的非结构化数据管理解决方案弊端很多,比如,NDMP不支持海量场景,传统的NAS存储复制可能被单一品牌存储绑,对象存储是生产或者归档存储,不能完成数据备份,因为只能存储最新的数据,不能保存历史数据。

爱数AnyBackup Family 7都能避免这些问题,并能以“超快”“超可用”优势有效解决备份慢、恢复慢、备份数据不可查询三座压在备份恢复头上的大山。能有多快?我们一一解释。

备份快,AnyBackup Family 7,采用CDM的方式,通过多线程、多客户端技术,实现对海量并发数据的读取,能提高文件读取效率,打破单文件性能读取的瓶颈。此外,通过永久增量,解决了NDMP不能备份的问题,实现一次性备份,帮助客户节约大量的备份时间和带宽资源。还有一个关键问题,传统解决方案需要将非结构化数据进行合成后再存储,AnyBackup Family 7可实现对原生数据的部分复制,0合成时间,大大提升了备份效率。

恢复快,AnyBackup Family 7提供了多个场景的数据恢复的方式,针对原机实现完整恢复、挂载恢复、细粒度恢复,恢复速度快,其中,细粒度恢复可以单独恢复选定的数据。同时,AnyBackup Family 7也可针对高端行业的开发测试、容灾站点提供挂载恢复和自动恢复功能,给开发测试和数据在异机查询带来极大便利。

多种恢复方式,AnyBackup Family 7提供的自动恢复、挂载恢复、细粒度精准恢复在内的多种恢复方式,给予客户更大选择空间,让客户可以根据需求选择恢复方式,这种灵活性也是“快”的体现。

那具体有多快?通过数据来说明。这么说吧,传统方式1小时只能完成备份36万个文件,AnyBackup Family 7在1小时可以内可以完成1千万个文件的备份,是传统灾备方案效率的27.8倍。面对1PB且单个文件大小约1MB左右的数据,传统方案备份恢复完成需要155天,爱数则可以实现数据分钟级可用,达到了传统方案的10000倍。

爱数,在数据服务赛道坚定前行

不得不说,爱数选择了一个很好的赛道。并且能在这个赛道上,稳扎稳打,一步一个脚印地大踏步向前走。

当前,各个行业都在迎来数字化转型浪潮。此过程中,数据成为新的生产资料,挖掘数据的价值,提高企业管理和决策水平已成共识,整个行业进入数据智能时代。

赛道选择对了,然后呢?当然是自身要有真实力,尤其是产品方面,要有丰富的产品体系去打“组合战”,覆盖更多的场景,并且能够根据技术发展趋势去升级创新。这两点,爱数都做到了。

现在,爱数拥有丰富的产品系列,AnyBackup灾备云、AnyShare智能内容云、AnyRobot日志云、AnyDATA洞察云等等,每一个单独拿出来都是能单打独斗的“利器”,组合在一起,又打造出非结构数据智能化管理的综合性解决方案,覆盖数据应用的方方面面,展示出爱数在数据管理领域的综合实力。

当然,产品线丰富的同时,也会给创新升级带来挑战,因为,一旦某个产品创新方面掉队,就会出现短板。

当前,爱数不遗余力地实现整个产品线的同步升级,在开篇提到的爱数AnyShare Family 7的全新发布,其功能更加丰富,更加有效地解决海量非结构化数据的内容管理问题。再加上这次的AnyBackup Family 7,两大产品几乎同步升级,联合打造出全新的突破方案——海量小文件高性能备份恢复解决方案,进而保证爱数整体的数据服务能力。

凭借深入的市场服务,爱数业务覆盖面快速扩展,拥有政府、企业、医疗、教育、金融等诸多领域的20000+客户。在数据服务上,爱数用明确的市场动作表明,我们是一家纵横市场多年的企业,将不断加深“大数据基础设施提供商”的身份,稳固智能数据服务领导者地位。

总结全文,海量数据时代,数据备份、恢复、查询,每一个单独拿出来都是一个宏大的课题,而且这个课题的难度会随着智能化趋势而增加。在挑战中看出机遇,坚守数据服务市场,这对爱数来说,是唯一的目标,而且,我们能很明显的看到,爱数为实现这一目标所做的每一步的正确性,包括这次AnyBackup Family 7全新发布,随着时间的推移,我们会看到它的价值。我们坚信,数据大市场,未来虽然遥远,但爱数的表现一定是超可期的。