Linux系统管理常用命令
1、进程管理
1.1 进程管理
1.1.1 进程简介
进程是正在执行的一个程序或命令,每一个进程都是一个运行的实体,都有自己的地址空间,并占用一定的系统资源。
1.1.2 进程管理的作用
判断服务器健康状态 top命令
查看系统中所有进程 ps命令和pstree命令
杀死进程
1.2 进程查看
1.2.1 查看系统中所有进程
$ ps aux 查看系统中所有进程,使用BSD操作系统格式 常用格式
$ ps -le 查看系统中所有进程,使用Linux标准命令格式
USER 该进程是由哪个用户产生的
PID 进程的ID号
%CPU 该进程占用的CPU资源的百分比,占用越高,进程越耗费资源
%MEM 该进程占用物理内存的百分比,占用越高,进程越耗费资源
VSZ 该进程占用虚拟内存的大小,单位KB
RSS 该进程占用实际物理内存的大小,单位KB
TTY 该进程是在哪个终端中运行的。其中tty1-tty7代表本地控制台终端,tty1-tty6是本地字符界面终端,tty7是图形终端。pts/0-255代表虚拟终端
STAT 进程状态。常见的有:R运行;S睡眠;T停止;s饱汉子进程;+位于后台
START 该进程的启动时间
TIME 该进程占用CPU的运算时间,注意不是系统时间
COMMAND 产生此进程的命令名 重要!!
1.2.2 查看系统健康状态
$ top [选项]
-d 指定top命令每隔几秒更新。默认是3秒
在top命令的小胡模式当中可以执行的命令:
?或h 显示交互模式的帮助
P 以CPU使用率排序,默认就是此项
M 以内存的使用率排序
N 以PID排序
q 退出top
第一行信息为任务队列信息
12:26:46 系统当前时间
up 1 day,13:32 系统的运行时间,本机已经运行1天13小时32分钟
2users 当前登录了2了用户
load average:0.00,0.00,0.00 系统在之前1分钟,5分钟,15分钟的平均负载。一般认为小于1时,负载较小;如果大于1,系统已经超出负荷。1代表1个核。
第二行信息为进程信息
Tasks:95total 系统中的进程总数
1 running 正在运行的进程数
94 sleeping 睡眠的进程
0 stopped 正在停止的进程
0 zombie 僵尸进程。如果不是0,需要手工检查僵尸进程。
第三行信息为CPU信息
Cpu(s): 0.1%us 用户模式占用的CPU百分比
0.1%sy 系统模式占用的CPU百分比
0.0%ni 改变过优先级的用户进程占用的CPU表粉笔
99.7%id 空闲CPU的CPU百分比
0.1%wa 等待输入/输出的进程的占用CPU百分比
0.0%hi 硬中断请求服务占用的CPU百分比
0.1%si 软中断请求服务占用的CPU百分比
0.0%st st(Steal time)虚拟时间百分比。就是当有虚拟机时,虚拟CPU等待时机CPU的时间百分比
第四行信息为物理内存信息
Mem:625344k total 物理内存的总量,单位KB
571504k used 已经使用的物理内存数量
53840k free 空闲的物理内存的数量,我们使用的是虚拟机,总共只分配了628MB内存,所以只有53MB的空闲内存了
65800k buffers 作为缓冲的内存数量
第五行信息为交换分区(swap)信息
Swap : 524280k total 交换分区(虚拟内存)的总大小
0k used 已经使用的交换分区的大小
524280k free 空闲交换分区的大小
409280k cached 作为缓存的交换分区的大小
1.2.3查看进程树
$ pstree -pu
-p 显示进程的PID
-u 显示进程的所属用户
1.3 终止进程
1.3.1 kill命令
$ kill -l 查看可用的进程信号
1 SIGHUP 该信号让进程立即关闭,然后重新读取配置文件之后重启
2 SIGINT 程序终止信号,用于终止前台进程。相当于输出Ctrl+C快捷键
8 SIGFPE 在发生致命的算术运算错误时发生,不仅包括浮点运算错误,还包括溢出及除数为0等其他所有的算数错误
9 SIGKILL 用来立即结束程序的运行,本信号不能被阻塞、处理和忽略。一般用来强制终止进程
14 SIGALRM 时钟定时信号,计算的是实际的时间或时钟时间,alarm函数使用该信号
15 SIGTERM 正常结束进程的信号,kill命令的默认信号,优势如果进程已经发生问题,这个信号是无法正常终止进程的,我们才会尝试SIGKILL信号,也就是信号9
18 SIGCONT 该信号可以让暂停的进程恢复执行,本信号不能被阻断
19 SIGTOP 该信号可以暂停前台进程,相当于输入Ctrl+Z快捷键。本信号不能被阻断
$ kill -1 22654 重启进程
$ kill -9 22368 强制杀死进程
1.3.2 killall命令
$ killall [选项] [信号] 进程名 按照进程名杀死进程
-i 交互式,询问是否要杀死某个进程
-I 忽略进程名的大小写
1.3.3 pkill命令
$ pkill [选项] [信号] 进程名 按照进程名终止程序
-t 终端号 按照终端号踢出用户
按照终端号踢出用户
$ w 使用w命令查询本机已经登录的用户
$ pkill -t -9 pts/1 强制杀死pts/1虚拟终端登陆的进程
2、工作管理
2.1 把进城放入后台
tar -zcf etc.tar.gz /etc &
$ top 在top命令执行的过程中,按下Ctrl+Z快捷键
2.2 查看后台的工作
jobs -l
-l 显示工作的PID
注:“+”号带边最近一个放入后台的工作,也是工作回复时,默认恢复的工作。“-”号带边倒数第二个放入后台的工作
2.3 将后台暂停的工作恢复到前台执行
$ fg %工作号
参数:
%工作号 %可以省略,但是注意工作号和PID的区别
2.4 把后台暂停的工作恢复到后台运行
$ bg %工作号
注:后台回复执行的命令,是不能和前台有交互的,否则不能恢复到后台执行。
3、系统资源查看
3.1 vmstat命令监控系统资源
$ vmstat [刷新延时 刷新次数]
例如
$ vmstat 1 3
3.2 dmesg开机时内核检测信息
$ dmesg
例如
$ dmesg | grep CPU
3.3 free命令查看内存使用状态
$ free -bkmg
-b 以字节为单位
-k 以KB为单位,默认就是以KB为单位显示
-m 以MB为单位显示
-g 以GB为单位显示
缓存和缓冲的区别
简单来说缓存(cache)是用来加速数据从硬盘中“读取”的,而缓冲(buffer)是用来加速数据“写入”硬盘的。
3.4 查看CPU信息
$ cat /proc/cpuinfo
3.5 uptime命令
$ uptime 显示系统的启动时间和平均负载,也就是top明林的第一行。w命令也可以看到这个数据
3.6 查看系统与内核相关信息
$ uname -ars
-a 查看系统所有相关信息
-r 查看内核版本
-s 查看内核名称
判断当前系统的位数
$ file /bin/ls
查看当前Linux系统的发型版本
$ lsb_release -a
3.7 列出进程打开或使用的文件信息
$ lsof [选项] 列出进程调用或打开的文件的信息
-c 字符串 只列出以字符串开头的进程打开的文件
-u 用户名 只列出某个用户的进程打开的文件
-p pid 列出某个PID进程打开的文件
4、系统定时任务
4.1 crond服务管理与访问控制
$ service crond start
$ chkconfig crond on
一般不需要设置,一般的机器都是安装了这个服务并自启动的
4.2 用户的crontab设置
$ crontab -elr
-e 编辑crontab定时任务
-l 查询crontab任务
-r 删除当前用户所有的crontab任务
$ crontab -e 进入crontab便捷界面,会打开vim编辑你的工作
* * * * * 执行的任务
第1个“*” 一小时当中的第几分钟 0-59
第2个“*” 一天当中的第几小时 0-23
第3个“*” 一个月当中的第几天 1-31
第4个“*” 一年当中的第几月 1-12
第5个“*” 一周当中的星期几 0-7(0和7都代表星期日)
45 22 * * * 命令 在每天的22点45分执行命令
0 17 * * 1 命令 在每周1的17点0分执行命令
0 5 1,15 * * 命令 在每月1号和15号的5点0分执行命令
40 4 * * 1-5 命令 在每周1到周5的4点40分执行命令
*/10 4 * * * 命令 在每天4点,每隔10分钟执行一次命令
0 0 1,15 * 1 命令 在每月1号和15号,每周1的0点0分执行命令(注:星期几和几号最好不要同时出现,因为他们定义的都是天,非常容易)
* 代表任何时间。比如第1个“*”就代表一小时中每分钟都执行一次的意思
, 代表不连续的时间。比如“0 8,12,16 * * * 命令”,就代表每天的8点0分,12点0分,16点0分都执行一次命令
- 代表连续的时间范围。比如“0 5 * * 1-6”,代表在周一到周六的5点0分执行命令
*/n 代表每隔多久执行一次命令。比如“*/10 * * * * 命令”,代表每隔10分钟执行一次命令。
举例
*/5 * * * * /bin/echo “11” >> /tmp/test
5 5 * * 2 /sbin/shutdown -r now
0 5 1,10,15 * * /root/sh/autobak.sh 备份脚本
1、进程管理