0xFE

运维之道 本站总阅读量

ftrace初识和short-live进程查看

ftrace初识 和 short-live进程查看 ftrace 也就是 function trace,对内核debug 或者 问题排查,性能优化的时候可以用到。刚接触,遂记录于此,是Linux 内核提供的一个debug接口框架,有很强大的功能,希望以后能通过此工具解决实际问题。 本文记录下ftrace的相关基础内容,并简单的应用,来查看服务器上的瞬时进程,也就是short-live进程。 ......

NUMA架构相关总结

背景 工作中接触到DPDK相关知识,在提高DPDK性能上,使用NUMA架构是一个调优点,之前日常运维的过程中也了解过NUMA相关的运维知识,遂总结本文供自己参考。本文主要参考《NUMA架构下的性能挑战》演讲,以及互联网上相关优秀的文章。 SMP到NUMA CPU就像一个高速公路,不停的从Memory中加载数据,计算数据,再写回Memroy。数据读取和写回的速度,是制约系统性能的一个关键因素。......

线上HTTPS性能问题排查

故障现象 CPU空闲率突然从85%降到30%左右,出现资源不足的告警。当前线上Nginx集群CPU出现瓶颈,可能对请求处理带来较大的延时,好在10min左右故障自动恢复,本文将记录故障时的排查过程,以供读者参考。 故障排查 CPU使用率告警后,第一时间上服务器上确认情况,CPU使用率确实突然使用了70%以上且都是cpu.user用户空间的使用。 通过perf top命令查看发现bn_sqr......

使用Systemtap监视TCP连接队列溢出

本文是我接触到systemtap后的使用入门记录文档,主要分安装和使用stp监视连接队列溢出的演示 安装 debuginfo下载官网 官网下载内核对应的debuginfo rpm包,本地安装: kernel-debuginfo-2.6.32-504.23.4.el6.x86_64.rpm kernel-debuginfo-common-x86_64-2.6.32-504.23.4.el6......

[转载]动态追踪技术漫谈

本文让我了解到动态追踪技术,转载让更多的读者了解到并解决实际问题。 原文链接:动态追踪技术漫谈 什么是动态追踪 我很高兴能在这里和大家分享动态追踪技术(Dynamic Tracing)这个主题,对我个人来说也是一个很激动人心的话题。那么,什么是动态追踪技术呢? 动态追踪技术其实是一种后现代的高级调试技术。它可以帮助软件工程师以非常低的成本,在非常短的时间内,回答一些很难的关于软件系统方面......

Kubernetes集群搭建

本文为centos系统搭建k8s 1.17.3版本的搭建步骤整理 搭建前建议初步了解k8s功能,了解集群master和node节点的功能 k8s集群架构图 节点信息和系统初始化 机器信息 k8s-master: 10.211.55.6 k8s-node1: 10.211.55.7 k8s-node2: 10.211.55.8 设置主机名 123hostnamectl set-host......

[随记]升级openssl以支持HTTP2

服务器环境 12345CentOS release 6.8 (Final)2.6.32-642.6.2.el6.x86_64OpenSSL 1.0.1e (不支持ALPN)nginx/1.10.0Nginx满足支持HTTP2,但是openssl版本太低,需要升级。 升级openssl 123456789101112cd ~wget --no-check-certificate https:/......

Bind自动空区empty-zones

配置的反解析未生效,为什么? 明明配置上了呀! empty-zones简述 named中提供了许多空白区域,在每个视图开始加载时会自动根据配置生成这些空白区域。自动空区的目的时防止递归服务器向其他DNS服务器发送很多无意义的查询,保证递归服务器在这些区域直接返回即时和权威的NXDOMAIN响应。 BIND 9.9及更高版本的用户将在未指定empty-zones-enable(默......

Linux信号和常见几种信号捕捉举例

信号是Linux系统进程间通信的一种方式,本文总结运维过程常见的几种信号。 软中断信号(signal,又简称为信号)用来通知进程发生了异步事件。进程之间可以互相通过系统调用kill发送软中断信号。内核也可以因为内部事件而给进程发送信号,通知进程发生了某个事件。注意,信号只是用来通知某进程发生了什么事件,并不给该进程传递任何数据。 收到信号的进程对各种信号有不同的处理方法: 第......

内存紧凑导致cpu.sys高-case分析

反馈CPU sys占用较高,排查下发现 !!! 现象 12.18日,业务反馈服务器cpu idle特别低,之后十几分钟自行恢复,突然又重新复现idle低的现象,希望排查下原因。 排查过程 登陆服务器,使用top发现cpu.sys占用60%左右,导致cpu idle低。 通过perf top发现占用cpu最多的函数 pageblock_pfn_to_page()。 该函数为内......