15 分钟无门槛构建服务器性能监控系统

网友投稿 257 2022-11-13

15 分钟无门槛构建服务器性能监控系统

服务器监控是每个互联网厂商都重视并且想要尽可能做好的事情,从数据收集、数据处理、数据可视化最终再到实时监控告警,这一系列复杂的流程可能耗费企业大量的人力和时间,以至于某些时候因为其复杂性高无法达到预期的监控效果。而当事故发生时才发现,由于监控体系的不完善造成了很多不必要的损失, 让我们追悔莫及。

为了解决企业的此类烦恼,七牛云推出了快速构建服务器性能监控报警的解决方案。七牛云开源的日志/信息采集工具 logkit 配合七牛云 Pandora 大数据工作流引擎和时序数据库服务,可以方便地对大量服务器的海量性能指标数据进行全方位监控。而整个部署和使用的流程,您完整体验的时间仅需15分钟。

监控的内容

logkit 目前收集的机器性能指标主要包括十大模块, 上百个指标

system 模块: 监控 load1、load5、load15、用户数、cpu 核数以及系统启动时间等. processes 模块: 监控处于各种状态的进程数量, 比如运行中/暂停/可中断/空闲/挂起等状态的进程数量等等. netstat: 监控处于各种状态的网络连接数, 比如syn send/syn recv 等状态的网络连接数. net: 监控网络设备的状态,比如收发包的数量、收发包的字节数等. mem: 监控内存的实时状态. swap: 监控 swap 分区的状态,比如换入、换出、使用率、空闲大小等. cpu: 监控 CPU 的实时状态,包括cpu 用量,中断时间占比等. kernel: 监控内核中断次数、上下文切换次数、fork 的进程数等. disk: 监控磁盘的使用情况, 包括磁盘用量、inode 使用情况等. diskio: 监控磁盘读写状态, 包括读写次数、总用时等.

各项指标的详细介绍请参考 logkit 系统信息采集模块介绍和配置

监控效果图

部署完成后,您可以直接载入我们为您构建的监控模板,最终看到的效果图如下。

1. 模板变量

2. 全局概览

3. CPU Usage 信息

4. 系统 load 值与进程

5. 内存用量

6. kernel 信息

7. CPU 的状态

8. 网络相关

TCP

ICMP、IPV4

UDP

这张图中可以看到 udp 数据报 以及 udp 错误数目等,如错误数过多,表示网络状况不佳。

各个网卡的状态

9. 交换分区状态

10. 磁盘用量

磁盘的重要性毋庸置疑,磁盘爆满可能会对服务产生毁灭性打击,无疑也是需要监控的重点。

磁盘 IO

磁盘使用情况

快速开始

下面就 Pandora 提供的组件来搭建一个运维监控应用,搭建这个应用只需要四步。

注意,为了顺利使用 Pandora 的各项服务,第一,需要一个已经实名认证的七牛账户;第二,申请开通 Pandora 的使用权限;

第一步:下载&启动 logkit

从 logkit下载页面 下载对应操作系统的 logkit 应用程序。logkit 的详细配置可以参考 logkit Wiki, 当然如果没有特殊需求,只需要使用默认的配置即可。启动 logkit,输入以下命令

./logkit -f logkit.conf

第二步:配置 metric 采集收集器

借助 logkit 的可视化配置界面,可以很方便的配置需要采集的 metric 信息,在浏览器中输入配置的 url 访问 logkit 管理中心(默认为 配置 Grafana 数据源

在七牛应用市场打开 Grafana 应用,然后按照以下步骤配置:

创建应用

应用名称:账号内唯一应用名称,且只能满足以下条件:(1. 只能包含字母、数字和减号,首尾字符只能为字母或数字。 2. 字符长度不能超过 30)应用别名:供显示使用的标题名。

注意,因为 Grafana App 具有公网域名,所以建议设置一个高强度的密码(此密码在进入 Grafana App 后可以修改)。

4.访问 Grafana 进入 Grafana 页面

注意,该 Grafana App 是暴露在公网上的,可收藏地址用于后续访问。

配置 TSDB 数据源

在 Grafana 中使用 Pandora TSDB 之前,我们需要先添加数据源。

第四步: 导入 Grafana dashboard 配置文件

下载 Grafana dashboard 配置文件

将下载的 dashboard 导入 Grafana

至此,您就可以看到一张酷炫的可视化运维监控图啦,当然没有报警的监控是不完整的,下面我们配置一下监控的告警。

配置 Grafana 告警

就在Grafana上,我们为您提供了完善的报警功能。

更多关于 Grafana 告警功能的配置可以参考 Grafana 告警文档

至此,一个详细的服务器性能监控系统搭建完成啦,快去体验吧!

附其他高级用法

logkit 详细配置文档 Grafana 配置文档 自研组件监控 配置 nginxMetric 监控 配置 php-fpm 监控

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:基于区块链的医疗健康服务平台DHC介绍
下一篇:关于log4j日志扩展
相关文章

 发表评论

暂时没有评论,来抢沙发吧~