linux社区爱心援助Linux认证系列教程业界动态站务新闻公司招聘建议留言网址大全LPI专题CISCO专题
设为首页
加入收藏
管理团队
JSP  
JAVA  
PERL  
 您的位置:首页 > article > Linux入门与提高 > 使用与技巧 >
栏目导栏
资料搜索
热门文章
·VMware Tools的安装步骤
·应用Linux下两种中文输入法
·GRUB FOR DOS 引导安装LINUX和
·linux下BT软件介绍
·Linux中用ALSA驱动声卡流程详解
·Linux 170个常见问题的详细解答
·什么是ISO文件?
·虚拟机软件vmware使用教程--使
·BabyLinux制作过程详解
·Linux挂接(mount)命令的使用方
·Linux必学的网络操作命令
·ffmpeg命令使用详解
·Linux操作系统Ifconfig命令详细
·在Linux下制作工资表
·vmware下的fedora 6的vmware t
最新文章
·CentOS5安装apache和svk使用域
·Ubuntu Linux系统Sudo命令无效
·Uboot对非Linux kernel的引导
·Fedora和XP双系统中网卡Realte
·解决Linux操作系统下部分文件乱
·双系统安装Linux之后找不到Win
·Linux操作系统上安装Flash Med
·设置Tomcat在Linux操作系统中自
·Linux操作系统下创建DBCA报错的
·Redhat Enterprise Linux磁带机
·Linux系统下用一条命令批量修改
·实用技巧:Linux下命令排列、调
·关于Linux操作系统中VI编辑器字
·Linux VI编辑器中的复制与粘贴
·Linux系统下触摸屏的简单使用和
Google
 
Linux系统“死机”时怎么办?
[ 作者:  加入时间:2008-02-18 20:31:02  来自:Linux联盟收集整理 ]
 

如果问题能够再现,那么问题已经解决 80% 了。对于操作系统核心而言,如果有问题的再现方法,那么可以说是已经解决 99% 了。经常遇到的问题是系统可以正常运行一段时间,然后死机。如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了。

wkiLinux联盟
如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的。如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 Alt-Sysrq-T 获得进程系统堆栈信息,按下 Alt-Sysrq-M 获得内存分配信息,按下 Alt-Sysrq-W 获得当前寄存器信息。

wkiLinux联盟
linux/Documentation/sysrq.txt。另外,最好关闭终端的自动 blank 功能,这样系统死的时候至少能从屏幕上看到一些信息。设置方法是:

wkiLinux联盟
# echo 1 > /proc/sys/kernel/sysrq

# setterm -blank

wkiLinux联盟
这两个设置最好加到系统启动脚本中 (比如 /etc/rc.d/rc.local),保证每次启动都能得到运行。

wkiLinux联盟
如果很不幸,键盘也死悄悄了,(更为不幸的是,这种情况很常见),那么也不是只有等死一个办法,这时可以用串口终端 (serial console)将系统信息发送

wkiLinux联盟
到另一台系统上,这样可以通过对这些信息分析来定位问题。设置方法如下:

wkiLinux联盟
准备工作

wkiLinux联盟
1. 一台被监视的服务器,一台进行监视工作的PC。

wkiLinux联盟
2. 一根串口直连线。

wkiLinux联盟
配置

wkiLinux联盟
1. 在服务器上,加入一个新的 grub 项目,增加核心参数 "console=ttyS0 console=tty1",如:

wkiLinux联盟
kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0

console=tty1

wkiLinux联盟
2. 在服务器上,修改 /etc/sysconfig/syslog,加入 klogd 选项 "-c 7",保证更多内核信息得到输出。如:

wkiLinux联盟
KLOGD_OPTIONS="-x -c 7"

wkiLinux联盟
3. 重新启动服务器

wkiLinux联盟
4. 用串口直连线连接两台机器,测试:

wkiLinux联盟
1) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 输出。

wkiLinux联盟
2) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相应内核信息输出。

wkiLinux联盟
3) 在PC上运行 "cat /dev/ttyS0",在服务器上运行 "modprobe loop",看 PC 上是否有相应内核信息输出。

wkiLinux联盟
5. 如果测试通过,那么在 PC 上运行:cat /dev/ttyS0 | tee /tmp/result

wkiLinux联盟
另外,也可以用 Windows 超级终端获得串口信息。

wkiLinux联盟
that's it.

wkiLinux联盟
此外,一些核心支持 LKCD, netdump 等调试功能,也可以一试。

wkiLinux联盟
剩下的,就只有靠经验和运气了,一般造成 Linux 系统死机的原因有:

wkiLinux联盟
系统硬件问题 (SCSI 卡,主板,RAID 卡,网卡,硬盘...)

外围硬件问题 (终端切换器,网络...)

软件问题

驱动 bug (去找更新的驱动试试)

核心系统 bug (去 LKML 上看看,或换个核心试试)

系统设置

wkiLinux联盟
最后,google一把。有时候你可以直接输入 "Linux 系统死机怎么办?"

wkiLinux联盟
PE6650 经常死机",看有没有人遇到过和你同样的问题。即使没有找到,也是一个有助于分析问题的信息,至少说明你的系统可能有和其他人不同之处。

wkiLinux联盟
调查 Linux 系统死机问题,这既是科学又是艺术,牵扯到众多的硬件软件知识和经验,是一个不断学习的过程。

Linux联盟收集整理 ,转贴请标明原始链接,如有任何疑问欢迎来本站Linux论坛讨论
评论】【加入收藏夹】【 】【打印】【关闭
※ 相关链接
 ·嵌入式Web视频点播系统实现方法  (2008-02-18 10:46:59)
 ·Linux下防范缓冲区溢出攻击的系统安全策略  (2008-02-18 09:47:41)
 ·linux实用命令详解  (2008-02-18 09:41:19)
 ·通过监控Linux运行进程来保证系统安全  (2008-02-18 09:39:56)
 ·Linux系统下搭建VNC远程控制软件  (2008-02-18 09:35:08)
 ·探查Linux系统DNS服务器运行状况  (2008-02-18 09:33:10)
 ·如何开发一个虚拟域名系统  (2008-02-15 10:47:29)
 ·solaris系统安全配置  (2008-02-15 10:24:23)
 ·Linux操作系统的口令文件安全问题详解  (2008-02-15 10:12:46)
 ·Linux操作系统下源码阅读工具ctags+vim中ctags的安装  (2008-02-15 10:02:50)