Opentsdb简介(一)

原文:http://www.jianshu.com/p/0bafd0168647ios


一、OpenTSDB介绍

1.一、OpenTSDB是什么?主要用途是什么?

官方文档这样描述:OpenTSDB is a distributed, scalable Time Series Database (TSDB) written on top of HBase;web

翻译过来就是,基于Hbase的分布式的,可伸缩的时间序列数据库。数据库

主要用途,就是作监控系统;譬如收集大规模集群(包括网络设备、操做系统、应用程序)的监控数据并进行存储,查询。安全

1.二、介绍continue

存储到OpenTSDB的数据,是以metric为单位的,metric就是1个监控项,譬如服务器的话,会有CPU使用率、内存使用率这些metric;服务器

OpenTSDB使用HBase做为存储,因为有良好的设计,所以对metric的数据存储支持到秒级别;网络

OpenTSDB支持数据永久存储,即保存的数据不会主动删除;而且原始数据会一直保存(有些监控系统会将较久以前的数据聚合以后保存)架构

二、OpenTSDB存储相关的概念

介绍这些概念的时候,咱们先看一个实际的场景。异步

譬如假设咱们采集1个服务器(hostname=qatest)的CPU使用率,发现该服务器在21:00的时候,CPU使用率达到99%分布式

下面结合例子看看OpenTSDB存储的一些核心概念性能

1)Metric:即平时咱们所说的监控项。譬如上面的CPU使用率

2)Tags:就是一些标签,在OpenTSDB里面,Tags由tagk和tagv组成,即tagk=takv。标签是用来描述Metric的,譬如上面为了标记是服务器A的CpuUsage,tags可为hostname=qatest

3)Value:一个Value表示一个metric的实际数值,譬如上面的99%

4)Timestamp:即时间戳,用来描述Value是何时的;譬如上面的21:00

5)Data Point:即某个Metric在某个时间点的数值。

                        Data Point包括如下部分:Metric、Tags、Value、Timestamp

                       上面描述的服务器在21:00时候的cpu使用率,就是1个DataPoint

保存到OpenTSDB的,就是无数个DataPoint。

下面讲一下,OpenTSDB是如何保存DataPoint的。

三、OpenTSDB的设计

仍是以例子来讲明,譬如保存这样的1个DataPoint:

metric:proc.loadavg.1m

timestamp:1234567890

value:0.42

tags:host=web42,pool=static

3.一、简单的设计

那么,若是是通常的设计,会怎么作呢,可能就是:RowKey=metric|timestamp|value|host=web42|pool=static,Column=v,Value=0.42

这是最简单的设计,那接下来看看,OpenTSDB是怎么作的吧。

3.二、OpenTSDB的方案

OpenTSDB使用HBase存储,核心的存储,是有两张表,tsdb和tsdb-uid

3.2.一、表tsdb

tsdb是保存数据的,看看该表的设计


tsdb的表结构

1)RowKey的设计

RowKey其实和上面的metric|timestamp|value|host=web42|pool=static相似;

可是区别是,OpenTSDB为了节省存储空间,将每一个部分都作了映射。

在OpenTSDB里面有这样的映射,metric-->3字节整数、tagk-->3字节整数、tagv-->3字节整数

上图的映射关系为,proc.loadavg.1m-->05二、host-->00一、web42-->02八、pool-->04七、static-->001

2)column的设计

为了方便后期更进一步的节省空间。OpenTSDB将一个小时的数据,保存在一行里面。

因此上面的timestamp1234567890,会先模一下小时,得出1234566000,而后获得的余数为1890,表示的是它是在这个小时里面的第1890秒;

而后将1890做为column name,而0.42即为column value

3.2.二、表tsdb-uid


表tsdb-uid

这里其实保存的就是一些metric,tagk,tagv的一些映射关系。

四、OpenTSDB的整体架构


openTSDB架构

Servers:就是服务器了,上面的C就是指Collector,能够理解为OpenTSDB的agent,经过Collector收集数据,推送数据;

TSD:TSD是对外通讯的无状态的服务器,Collector能够经过TSD简单的RPC协议推送监控数据;另外TSD还提供了一个web UI页面供数据查询;另外也能够经过脚本查询监控数据,对监控数据作报警

HBase:TSD收到监控数据后,是经过AsyncHbase这个库来将数据写入到HBase;AsyncHbase是彻底异步、非阻塞、线程安全的Hbase客户端,使用更少的线程、锁以及内存,能够提供更高的吞吐量,特别对于大量的写操做。

五、简单的应用

5.一、安装和部署

OpenTSDB是以HBase做为存储的,那么,首先你得部署个Hbase。就好像对想要娶老婆生小孩的屌丝来讲,首先,你得有个女友。

接下来OpenTSDB的安装和部署,这个官方文档已经说得很详细,也是比较简单的,几乎是一键部署。

5.二、监控数据收集

OpenTSDB已经自带了收集监控数据的一些脚本。主要由2个部分组成,TCollector和一些具体的collectors。

TCollector是1个客户端进程,它主要是收集具体的collectors收集到的监控数据,而后负责将数据推送到TSDB;

TCollector会处理和TSD的链接和协议处理,具体的collectors负责收集数据便可

目前OpenTSDB提供了一些已实现的collectors


collectors

在一个服务器上部署1个TCollector以后,它会把这些collectors启动起来,collectors收集到监控数据以后,输出到stdout,TCollector接收后推送到OpenTSDB

5.三、监控数据查看

TSD除了接收数据以外,还提供了一个web页面供数据查询。不过页面的样式确实有点难以接受;


查询条件面板

查询结果面板

5.四、报警

目前OpenTSDB只是收集数据,并无作报警。

或者说,OpenTSDB自己就是一个基于HBase的数据库,TCollector是数据收集器,报警不属于它的范畴。报警的话,能够接入到Nagios。

六、总结

这篇文章只是简单介绍一下OpenTSDB是什么东西,简单地谈了一下存储和架构,以及应用起来是如何的。接下来还有不少东西能够继续写。

譬如:

1)关于RowKey设计的更多东西(数据压缩、查询性能、数据均衡性、设计方案的缺点、metric和tagk长度)

2)OpenTSDB的更多特性(Aggregation、Interpolation 、Downsampling、Metadata、Tree)

可能接下来的文章再继续了。

做者:沉默剑士连接:http://www.jianshu.com/p/0bafd0168647來源:简书著做权归做者全部。商业转载请联系做者得到受权,非商业转载请注明出处。