如何监控 Linux 服务器状态?
<p>Linux 服务器我们天天打交道,特别是 Linux 工程师更是如此。为了保证服务器的安全与性能,我们经常需要监控服务器的一些状态,以保证工作能顺利开展。</p><p>本文介绍的几个命令,不仅仅适用于服务器监控,也适用于我们日常情况下的开发。</p>
<h4 id="1-watch">1. watch</h4>
<p>watch 命令我们的使用频率很高,它的基本作用是,按照指定频率重复执行某一条指令。使用这个命令,我们可以重复调用一些命令来达到监控服务器的作用。</p>
<p>默认情况下,watch 命令的执行周期是 2 秒,但我们可以使用 <code>-n</code> 选项来指定运行频率,比如我们想要每隔 5 秒执行 date 命令,可以这么执行:</p>
<pre><code>$ watch -n 5 date
</code></pre>
<p>一台服务器肯定有多人在用,特别是本部门的小伙伴。对于这些小伙伴有没浑水摸鱼,我们可以使用一些命令来监控他们。</p>
<p>我们可以每隔 10 秒执行 who 命令,来看看都有谁在使用服务器。</p>
<pre><code>$ watch -n 10 who
Every 10.0s: who butterfly: Tue Jan 23 16:02:03 2019
shs :0 2019-01-23 09:45 (:0)
dory pts/0 2019-01-23 15:50 (192.168.0.5)
alvin pts/1 2019-01-23 16:01 (192.168.0.15)
shark pts/3 2019-01-23 11:11 (192.168.0.27)
</code></pre>
<p>如果发现系统运行很慢,我们可以调用 uptime 命令来查看系统平均负载情况。</p>
<pre><code>$ watch uptime
Every 2.0s: uptime butterfly: Tue Jan 23 16:25:48 2019
16:25:48 up 22 days,4:38,3 users,load average: 1.15, 0.89, 1.02
</code></pre>
<p>一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量。</p>
<pre><code>$ watch -n 5 'ps -ef | wc -l'
Every 5.0s: ps -ef | wc -l butterfly: Tue Jan 23 16:11:54 2019
245
</code></pre>
<p>想动态知道服务器内存使用情况,可以重复执行 free 命令。</p>
<pre><code>$ watch -n 5 free -m
Every 5.0s: free -m butterfly: Tue Jan 23 16:34:09 2019
total used free sharedbuff/cache available
Mem: 5959 776 3276 12 1906 4878
Swap: 2047 0 2047
</code></pre>
<p>当然不仅仅是这些,我们还可以重复调用很多命令来对服务器一些关键参数进行监控,</p>
<h4 id="2-top">2. top</h4>
<p>使用 top 命令我们可以知道系统的很多关键参数,而且是动态更新的。默认情况下,top 监控的是系统的整体状态,如果我们只想知道某个人的使用情况,可以使用 <code>-u</code> 选项来指定这个人。</p>
<pre><code>$ top -u alvin
top - 16:14:33 up 2 days,4:27,3 users,load average: 0.00, 0.01, 0.02
Tasks: 199 total, 1 running, 198 sleeping, 0 stopped, 0 zombie
%Cpu(s):0.0 us,0.2 sy,0.0 ni, 99.8 id,0.0 wa,0.0 hi,0.0 si,0.0 st
MiB Mem : 5959.4 total, 3277.3 free, 776.4 used, 1905.8 buff/cache
MiB Swap: 2048.0 total, 2048.0 free, 0.0 used. 4878.4 avail Mem
PID USER PRNI VIRT RES SHR S%CPU%MEM TIME+ COMMAND
23026 alvin 20 0 46340 7820 6504 S 0.0 0.1 0:00.05 systemd
23033 alvin 20 0149660 3140 72 S 0.0 0.1 0:00.00 (sd-pam)
23125 alvin 20 0 63396 5100 4092 S 0.0 0.1 0:00.00 sshd
23128 alvin 20 0 16836 5636 4284 S 0.0 0.1 0:00.03 zsh
</code></pre>
<p>在这个结果里,你不仅仅可以看到 alvin 这个用户运行的所有的进程数,也可以看到每个进程所消耗的系统资源(CPU,内存),同时依然可以看到整个系统的关键参数。</p>
<h4 id="3-ac">3. ac</h4>
<p>如果你想知道每个用户登录服务器所使用的时间,你可以使用 ac 命令。这个命令需要你安装 <code>acct</code> 包(Debian)或 <code>psacct</code> 包(RHEL,Centos)。</p>
<p>如果我们想知道所有用户登陆服务器所使用的时间之和,我们可以直接运行 ac 命令,无需任何参数。</p>
<pre><code>$ ac
total 1261.72
</code></pre>
<p>如果我们想知道各个用户所使用时间,可以加上 <code>-p</code> 选项。</p>
<pre><code>$ ac -p
shark 5.24
alvin 5.52
shs 1251.00
total 1261.76
</code></pre>
<p>我们还可以通过加上 <code>-d</code> 选项来查看具体每一天用户使用服务器时间之和。</p>
<pre><code>$ ac -d | tail -10
Jan 11total 0.05
Jan 12total 1.36
Jan 13total 16.39
Jan 15total 55.33
Jan 16total 38.02
Jan 17total 28.51
Jan 19total 48.66
Jan 20total 1.37
Jan 22total 23.48
Today total 9.83
</code></pre>
<h4 id="小结">小结</h4>
<p>我们可以使用很多命令来监控系统的运行状态,本文主要介绍了三个:<strong>watch</strong> 命令可以让你重复执行某一条命令来监控一些参数的变化,<strong>top</strong> 命令可以查看某个用户运行的进程数以及消耗的资源,而 <strong>ac</strong> 命令则可以查看每个用户使用服务器时间。你经常使用哪个命令呢?欢迎留言讨论!</p>
<hr>
<p>公众号:良许Linux</p>
<img src="https://pic.downk.cc/item/5e618d2f98271cb2b8f65fe8.jpg">
<h3 id="有收获希望老铁们来个三连击给更多的人看到这篇文章">有收获?希望老铁们来个三连击,给更多的人看到这篇文章</h3><br><br>
来源:https://www.cnblogs.com/yychuyu/p/13056012.html
頁:
[1]