Ruby语言支持语法级别的系统,框架,甚至语言自己的方法复写,通常叫作元编程(meta programming), 此基础之上还有一些术语为mixin,方法的动态定义,运行时类改写等等,这些技术和机制可让语言自己就能实 现其余语言须要字节码才能实现的功能,例如探针须要hook HttpRequest
中的request
方法,就能够经过下面的方式实现:html
Rubyclass HttpRequest def request_new puts 'before request' result = request_old puts 'after request' result end alias_method :request_old, :request alias_method :request, :request_new end
这里只是展现其中一种最简单的方法,还有不少其余方法,好比咱们想彻底放弃原有的方法的话,那就能够直接覆盖掉这个方法了。web
某些框架如Rails提供pub-sub机制,这种状况下探针只须要订阅特定类型的消息,而后进行数据再加工就能够了。对于Rails,这个比较简单:数据库
rubymodule ActionController class PageRequest def call(name, started, finished, unique_id, payload) Rails.logger.debug [name, started, finished, unique_id, payload].join(' ') end end end ActiveSupport::Notifications.subscribe('process_action.action_controller', ActionController::PageRequest.new) # 每次访问就可以订阅到‘process_action.action_controller’的消息: # # process_action.action_controller 2012-04-13 01:08:35 +0300 2012-04-13 01:08:35 +0300 af358ed7fab884532ec7 { # controller: "Devise::SessionsController", # action: "new", # params: {"action"=>"new", "controller"=>"devise/sessions"}, # format: :html, # method: "GET", # path: "/login/sign_in", # status: 200, # view_runtime: 279.3080806732178, # db_runtime: 40.053 # }
这样咱们就能拿到这个request
的数据了,订阅消息类型还请本身查阅相关框架的文档。编程
Rack绝对是个好东西,它把几乎全部的web框架和server沟通的接口定义好了,并且是如此的简洁,就是一个call方法。 一个最简单的Rack应用以下:ruby
ruby# configu.ru class App def call [200, {"Content-Type" => "text/html"}, ["hello world"]] end end run app # rackup
只须要这个call方法就搞定了,而多层的rack middleware
也只是嵌套着调用call
方法,全部要hook的话,这里就够了, 不过由于这里基本就是根了,须要注意抓取的数据量及堆栈信息,太长的话会影响性能的。session
数据库层基本都是对orm框架的hook,在每一个查询的结果输出中都会有执行的时间信息,超过阀值则调用数据库自己的查询 语句优化工具,并保存输出结果。至于hook的方法就是【1】中或者采用【2】中的方法,若是框架支持的话。app
外部服务就是对访问外部http请求的http_client相似的库进行hook,也就是按照【1】中的方法,对发起request
的方法进行hook。框架
后台任务机制同上面几项,只不过是在非http server
的进程中运行,数据抓取的机制同样,但分类不一样, 须要探针在运行过程当中,判断数据抓取的对象状态,即web事务中仍是非web事务中,非web事务都统一存 储到后台任务的数据容器中。工具
Thread Profiler就是一个增强版的事务采集器,能够设定采样周期和采样频率,将周期内的事务请求进行数据的聚合处理, 而后统计出在这个周期内的堆栈调用占比信息,而后能够根据此信息找出时间占比或者调用次数最多的方法,而后有针对性的 进行优化。性能
以上所述,还只是一些最根本的原理性知识,细节的点还有不少,好比如何进行数据的本地存储和处理,以及线程间的数据冲突处理, 还有基于fork的多进程server的进程间的数据传输,在之后的文章中,会针对每一项都作出详细的解释,还请你们持续关注。