云原生ASP.NET Core程序的可监测性和可观察性

分布式应用程序很复杂,给开发人员调试和修复生产问题带来了一系列挑战。尽管微服务架构可帮助维持一支规模较小,能够自主工做并专一于独立业务团队,但因为其分布式性质,它带来了新的挑战。例如,在业务交易过程当中出现问题的状况下,须要端到端跟踪请求,该请求可能跨越多个服务和基础架构。 解决问题时可能遇到的挑战有:git

  • 管理已知和未知故障
  • 故障也是分布式的
  • 传统监控系统不适用

这是可监测性和可观察性出现的地方。可监测性记录应用程序的整体运行情况,而可观察性则能够帮助您更深刻地了解上下文数据。在.NET大会上,我和Cecil 已经深刻讨论了云原生应用程序中的可监测性和可观察性。github

https://www.bilibili.com/vide...api

以上视频中,咱们着眼于可观察性和可监测性的关键点,例如日志(Logging),衡量指标(Metrics),链路追踪(Tracing),并深刻分析了运行情况检查(Health checks)。架构

图片1.png

如下是视频中讨论的一些基本概念:app

运行情况检查(Health checks)

微服务实现了运行情况检查,最理想的状况是使用HTTP endpoints,以便各类实时监控系统能够查询状态。 运行情况检查端点至少应作出如下响应:框架

  • 系统正在运行吗?
  • 它能够执行任务吗?

在Kubernetes世界中,这些分别直接转换为liveness和readiness。 它们定义在Kubernetes的YAML部署配置文件中。分布式

图片2.png

  • liveness路径是Kubernetes按期查询以检查故障的端点。 Kubernetes提供了liveness探针来监测失败的应用程序,并在它们不返回成功代码时从新启动它们。
  • readiness路径是Kubernetes查询以了解服务什么时候就绪,能够开始接受流量的终端。 当全部注册的检查都成功时,它将返回HTTP状态代码200。

ASP.NET Core提供用于向可监测性系统报告运行情况的中间件和库,来提供运行情况检查。 相关文档请查阅ASP.NET Core中的运行情况检查ide

日志

不管您使用什么工具调查生产环境中的问题,最终都会是以日志的形式反应问题的根本缘由。 在分布式环境中,您须要确保日志记录包含有助于调试的深刻信息。 能够从一个集中的地方查询它们。 每一个日志记录都须要有一个关联ID,以便进行跟踪以了解全局。微服务

结构化日志

使用结构化日志,您能够将序列化的对象添加到日志中,日志监视系统能够高效地查询这些对象。 例如,您能够根据customerID或trasnsactionID查询整个事务日志。 在ASP.NET Core应用程序中,可使用提供结构化日志记录的Serilog。请查阅.NET Core和ASP.NET Core中的日志入门,以及Serilog了解结构化日志。工具

集中式日志和关联ID

在传统应用程序中,日志文件存储在本地计算机上。在分布式环境中,把日志记录在某一台计算机中的纯文本文件中是没有帮助的。生成日志的应用程序可能没法访问本地磁盘,或者当容器在虚拟机中移动时,本地磁盘多是高度瞬态的。因为在Cloud-native应用程序中使用基于文件的日志会遇到一些问题,所以首选集中式日志。日志由应用程序收集并传送到一个集中的日志应用程序,该应用程序对日志进行索引和存储。这类系统天天能够接收数十GB的日志。Serilog提供了向集中式系统(如Azure Application Insights,Azure Monitor的一项功能)写入日志事件的接收器。在构建跨多个服务的日志记录时,遵循一些标准作法也颇有帮助。例如,在事务开始时生成一个关联ID,而后将其记录到与该事务相关的每条消息中,这样能够更容易地从集中式日志系统中搜索全部相关消息。

分布式跟踪

图片3.png

分布式跟踪等效于现代云和微服务体系结构的调用堆栈,并添加了性能分析器。分布式跟踪或分布式请求跟踪有助于端到端查看请求,并使您可以从总体上识别问题。跟踪能够为您提供有关问题的详细答案,例如事件发生在何时?它花了多少时间?为何要花这么长时间?哪些微服务处理了它?等等,像openzipkin / zipkin之类的开源分布式跟踪系统,在该领域很是流行。

为您的应用程序启用分布式跟踪就跟将相应的分布式跟踪提供商的SDK添加到每一个微服务中同样简单。例如,在您的应用中安装并配置了Application Insights SDK后,SDK依赖关系自动收集器会自动收集流行框架,库和技术的跟踪信息。

在几个不一样的系统和工具之间,须要有一套标准以便于观察。OpenTelemetry标准化了不一样的应用程序和框架如何收集和发出可观测性遥测。OpenTelemetry提供了一个与供应商无关的规范、一组api、sdk和工具以及用于可观测性遥测(分布式跟踪、度量等)的集成。查看博客文章OpenTelemetry .net reachs v1.0以获取详细信息。

动手模块

咱们已经构建了一系列模块来帮助您学习构建.NET微服务和云原生技术。 查看如下模块,这些模块将帮助您了解可监测性和可观察性相关技术。