elasticsearch应用之大数据领域的三个核心问题

如何存储数据

  传统的关系型数据库(Mysql,Oracle,Access等),主导了上个世纪的数据存储模式,但当数据量达到PB级,甚至TB级时,关系型数据库表现出了难以解决的瓶颈问题。为了解决海量数据存储和分布式计算问题,Google Lab提出了Map/Reduce 和 Google File System(GFS)解决方案,Hadoop做为其中一个优秀的实现框架迅速获得了业界的承认和普遍应用。但Hadoop的存储模式,决定了其并不支持对数据的实时检索和计算。还有其余的替代方案吗?为什么不尝试下Elasticsearch的分布式存储功能?web

如何检索数据

  在互联网时代的今天,信息的价值很大程度上取决于其是否可实时传播和获取。在庞大的数据仓库中,如何快速获取少许有用的数据是必需要解决的问题。数据的实时获取能力取决于数据的存储格式。有什么简单易用的实时数据获取方案吗?为什么不尝试下Elasticsearch的实时搜索功能?sql

如何展示数据

  存储数据和检索数据是最终目的吗?固然不是!数据的真正价值和最终目的是为商业决策提供有力支撑。为此,必须挖掘出数据的内在规律,并用友好的形式呈如今极可能并不懂技术的决策者面前。什么样的数据展示形式最有说服力,最容易为决策者所接受和理解,毫无疑问是:图和表。正所谓:千言万字不如一张图!有什么现成的数据挖掘和可视化方案吗?为什么不尝试下基于Elasticsearch的可视化平台,Kibana?数据库