linux服务器非人为重启,有哪些原因导致服务器非人为重启呢?怎么查看重启的原因呢?

2,769 views
Skip to first unread message

H7amster Xi

unread,
Mar 9, 2011, 11:01:17 PM3/9/11
to sh...@googlegroups.com
今天俺的服务器非人为重启,系统用的ubuntu,有可能的原因有哪些呢?怎么才能查看服务器重启的原因呢?
谢谢^_^

Xi Shen

unread,
Mar 9, 2011, 11:35:19 PM3/9/11
to sh...@googlegroups.com
如果是拔掉电源,我想你是什么记录也看不到的。


2011/3/10 H7amster Xi <h7am...@gmail.com>:


> 今天俺的服务器非人为重启,系统用的ubuntu,有可能的原因有哪些呢?怎么才能查看服务器重启的原因呢?
> 谢谢^_^
>

--
Best Regards,
Xi Shen (David)

http://twitter.com/davidshen84/

小马xiaoma

unread,
Mar 9, 2011, 11:38:56 PM3/9/11
to sh...@googlegroups.com
99%是硬件的原因,如果服务器用了3年以上,建议你换服务器。

H7amster Xi

unread,
Mar 9, 2011, 11:42:20 PM3/9/11
to sh...@googlegroups.com
请问一下的大虾,上面那如果是硬件的原因怎么去排查这些原因,能够断定是硬件哪个部分出错了?

Kevin Zou

unread,
Mar 9, 2011, 11:46:57 PM3/9/11
to sh...@googlegroups.com
看日志吧,如果非电源问题,一般都有日志报警出现在/var/log/message中,你搜搜kernel panic、out of memory  、 I/O error 什么的,如果有Remote Centrol 卡什么的也可以查查上面的设备日志。



2011/3/10 H7amster Xi <h7am...@gmail.com>



--
++++++++++++KevinZou++++++++++++++
                          kissi...@gmail.com
                          twtter:      @kissingwolf
++++++++++++++++++++++++++++++++++
最初你不喜欢监狱
然后你适应了监狱
最后你离开了监狱就活不下去
这就叫体制化

H7amster Xi

unread,
Mar 9, 2011, 11:56:00 PM3/9/11
to sh...@googlegroups.com
 我看看用demsg有这几个错误,能从这里面看出什么问题吗?
[   42.846665] ACPI Error: No handler for Region [IPMI] (ffff88041e045240) [IPMI] (20100428/evregion-369)
[   42.846672] ACPI Error: Region IPMI(0x7) has no handler (20100428/exfldio-293)
[   42.846682] ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._GHL] (Node ffff88042fc1ed40), AE_NOT_EXIST
[   42.846710] ACPI Error (psparse-0537): Method parse/execution failed [\_SB_.PMI0._PMC] (Node ffff88042fc1ecc0), AE_NOT_EXIST
[   42.846735] ACPI Exception: AE_NOT_EXIST, Evaluating _PMC (20100428/power_meter-773)

Terry Wang

unread,
Mar 13, 2011, 8:43:54 PM3/13/11
to Shanghai Linux User Group
光看下面这写ACPI相关错误是无法判断原因的。

dmesg是最后一次启动时的信息,得查之前(重启的大致时间范围内)的系统日志。

On Mar 10, 3:56 pm, H7amster Xi <h7ams...@gmail.com> wrote:
> 我看看用demsg有这几个错误,能从这里面看出什么问题吗?
> [ 42.846665] ACPI Error: No handler for Region [IPMI] (ffff88041e045240)
> [IPMI] (20100428/evregion-369)
> [ 42.846672] ACPI Error: Region IPMI(0x7) has no handler
> (20100428/exfldio-293)
> [ 42.846682] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PMI0._GHL] (Node ffff88042fc1ed40), AE_NOT_EXIST
> [ 42.846710] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PMI0._PMC] (Node ffff88042fc1ecc0), AE_NOT_EXIST
> [ 42.846735] ACPI Exception: AE_NOT_EXIST, Evaluating _PMC
> (20100428/power_meter-773)
>

> 在 2011年3月10日 下午12:46,Kevin Zou <kissingw...@gmail.com>写道:
>
>
>
>
>
>
>
> > 看日志吧,如果非电源问题,一般都有日志报警出现在/var/log/message中,你搜搜kernel panic、out of memory 、
> > I/O error 什么的,如果有Remote Centrol 卡什么的也可以查查上面的设备日志。
>

> > 2011/3/10 H7amster Xi <h7ams...@gmail.com>
>
> > 请问一下的大虾,上面那如果是硬件的原因怎么去排查这些原因,能够断定是硬件哪个部分出错了?


>
> >> 在 2011年3月10日 下午12:38,小马xiaoma <cnxia...@gmail.com>写道:
>
> >> 99%是硬件的原因,如果服务器用了3年以上,建议你换服务器。
>

> >>> 在 2011年3月10日 下午12:01,H7amster Xi <h7ams...@gmail.com> 写道:
> >>> > 今天俺的服务器非人为重启,系统用的ubuntu,有可能的原因有哪些呢?怎么才能查看服务器重启的原因呢?
> >>> > 谢谢^_^
>
> > --
> > ++++++++++++KevinZou++++++++++++++

> > kissingw...@gmail.com

way

unread,
Mar 23, 2011, 5:36:20 AM3/23/11
to sh...@googlegroups.com, Terry Wang
电源,风扇,如果有稳压模块的话,也可能是稳压模块。

2011/3/14 Terry Wang <imt...@gmail.com>:

Sherlock

unread,
Apr 3, 2011, 8:26:16 AM4/3/11
to sh...@googlegroups.com, H7amster Xi
你机器上有IPMI的模块?

2011/3/10 H7amster Xi <h7am...@gmail.com>



--
==========
      InitX
==========
Reply all
Reply to author
Forward
0 new messages