揭秘揭秘科研大数据平台的真实价值

大数据究竟有多大?

大数据其实是“海量数据”。大数据之所以成为大数据,首先就是他的体量非常巨大。随着21世纪的来临,我们迎来了数据信息大爆炸的时代。移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网、移动互联网、物联网、车联网、GPS、医学影像、安全监控、金融、电信都在疯狂产生着数据。

在量化描述海量数据之前,我们先来看一下数字数据的单位:众所周知,数据的最小基本单位是bit,并以1024为单位递进分别为bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

若用1粒沙代表1B数据,1PB(相当于1000TB)相当于1公里长、50米宽的沙滩,而1.2ZB的数据就如同一片浩瀚的沙漠。

在大多数人都还只知道TB的时候,我们在数字数据单位上已经升级了7个数量级,达到了DB时代。2011 年,全球数据生产量就已经达到了惊人的1.8ZB;预计2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)。人类产生的数据量大约每两年翻一番,这个速度在2020 年之前会继续保持下去。

大数据的应用

如今,一个大规模生产、分享和应用数据的时代正在开启。我们惊讶地发现,谷歌可以通过搜索记录的内容和频次预测H1N1流感病毒的爆发;淘宝的“猜你喜欢”藏着找寻多日的货品;亚马逊的推荐书目正是一本读者孜孜以求的冷僻书籍;更让人跌破眼镜的是Netflix公司,这个起家于连锁DVD租赁店的新兴视频网站在分析了观众观看网络视频节目时快进、慢进和重播的特性之后,摇身一变,成为影视制作公司,专门拍摄“投其所好”式的作品并赚得盆满钵满。

种种现象似乎表明当今社会已经拥有了一种非凡的创新能力,即:以某种前所未有的方式,通过对海量数据进行分析,提供有巨大价值的产品和服务,由此可见,除了数据量巨大这一特性之外,对海量数据背后的深层挖掘和使用才是大数据真正的实力和魅力所在。

科研大数据平台的价值

铺垫了这么久,还是要拿出我们压箱底的王牌解决方案来才行,才能让大家都能感受一下大数据这个“新玩意”,到底能为我们带来多少实实在在的改变和惊喜。

对于很多科研单位来说,伴随着数十年的行业积淀,大量的研发数据、试验数据、内部文档、各类报表等数据时间跨度大、数量浩渺、存储分散,对于这些数据的管理、存储和继承应用等一直是行业内部的巨大难题,更不要谈对于这些数据进行有效的分析挖据和深入应用了。数据仿佛点点河湾和涓涓小河,星罗密布却毫无章法,亟待通过开凿“数据运河”,使之汇聚成为数据的汪洋大海。

与此同时,大部分企业内部均流转着几个甚至十几个涉及企业管理各个业务方面、各个数据层级的应用系统,但是大多数系统间相互隔离,数据有重叠、有外延,甚至多维度,如果任由各个系统间的数据如一盘散沙般各自为战,仿佛守着一个紧紧锁住的宝库,财富虽触手可及,却仍然让人束手无策。

相信你也知道了,大数据就是宽阔的“数据运河”,也是开启宝库的“金钥匙”。

科研大数据平台在数据的层面上,平台收集现有所内全部现存科研数据、应用系统数据,通过数据梳理、整合、分析、挖掘等功能,建立一个大体量、包罗万象的底层“数据海洋”。

同时,平台也为这个海量“数据海洋”建设一套精准的“导航定位系统”,不管海面如何辽阔,仍然能用最短的时间、最便捷的方式寻找到所关注的那一小片海域。举个例子来看,如果在平台中输入一个人员的编码,可以查询你可以想到的全部数据:包括人员基本信息、参与的项目、全部出差安排、全部财务往来、设备借出存有、名下实验数据、名下任务进程等等。

在科研工作的层面上,平台将借助现有工作、任务的流转形式,打通各个应用系统壁垒,实现系统间业务“一键”轻松流转,彻底告别“重复创建烦、系统协同难”的现象,通过追踪项目信息,可以了解项目全部进展,人员安排、财务状况、工期序时进度、产生数据、工程质量等各项内容。

除此之外,科研大数据平台可以更好的发挥大体量数据的优势,不仅可以实时且快捷地拿到自己有用的、关心的各类数据,也能为各个业务部门和实施部门“量身定做”决策支持功能,这样一来,所有人都能借助平台的力量,尝到科研大数据的真实价值。