XenServer 6.5 падает на ровном месте

292 views
Skip to first unread message

Dmitrij Nemirskij

unread,
Apr 7, 2015, 3:32:11 AM4/7/15
to xen-h...@googlegroups.com
Приветствую!

Господа, вчера столкнулся на с падением ноды на ровном месте.
На сервере пару виртуалок, одна win 8.1, вторая win2012 r2
В краш дампах не разбираюсь совершенно, но смутило несколько записей
в:
xen-crashdump-analyser.log
DEBUG     Dumping structures to 'dom0.structures.log'
INFO    Found domain 1
DEBUG     Logging to 'dom1.log'
INFO      4 VCPUs
DEBUG     Vcpu0 pointer = 0xffff8300ab7da000
DEBUG     Vcpu1 pointer = 0xffff8300ab7d9000
DEBUG     Vcpu2 pointer = 0xffff8300ab7d8000
DEBUG     Vcpu3 pointer = 0xffff8300ab7d7000
DEBUG     Dom1 vcpu0 was not active
WARN  Cannot get kernel page table address - VCPU assumed down
DEBUG     Dom1 vcpu1 was not active
WARN  Cannot get kernel page table address - VCPU assumed down
DEBUG     Dom1 vcpu2 was not active
WARN  Cannot get kernel page table address - VCPU assumed down
DEBUG     Dom1 vcpu3 was active on pcpu0
ERROR Cannot get kernel page table address from active VCPU
DEBUG     Dumping structures to 'dom1.structures.log'
INFO    Found domain 2
DEBUG     Logging to 'dom2.log'
INFO      1 VCPUs
DEBUG     Vcpu0 pointer = 0xffff8300ab7d5000
DEBUG     Dom2 vcpu0 was active on pcpu1
ERROR Cannot get kernel page table address from active VCPU
DEBUG     Dumping structures to 'dom2.structures.log'
DEBUG Successfully printed 3 domains
INFO  COMPLETE

в dom1.log
WARN  Cannot get kernel page table address - VCPU assumed down
WARN  Cannot get kernel page table address - VCPU assumed down
WARN  Cannot get kernel page table address - VCPU assumed down
ERROR Cannot get kernel page table address from active VCPU
Domain 1: (4 vcpus)
  Flags: HVM UNPAUSED
  Paging assistance:  HAP external translate refcounts
  Max Pages: 1048832 (4.001GB, 4097.000MB, 4195328KB)
  Current Pages: 1048577
  Shared Pages: 0
  Handle: 7f766410-df65-ae1b-6d71-115bc5956bcb
  VCPU0:
        Pause Count: 0, Flags: 0x0
        Not running:  Last run on PCPU3
        Struct vcpu at ffff8300ab7da000
        VCPU in kernel mode
  VCPU1:
        Pause Count: 0, Flags: 0x4  Blocked_in_Xen
        Not running:  Last run on PCPU6
        Struct vcpu at ffff8300ab7d9000
        VCPU in kernel mode
  VCPU2:
        Pause Count: 0, Flags: 0x0
        Not running:  Last run on PCPU5
        Struct vcpu at ffff8300ab7d8000
        VCPU in kernel mode
  VCPU3:
        Pause Count: 0, Flags: 0x0
        Unknown runstate
        Struct vcpu at ffff8300ab7d7000
        VCPU in kernel mode

  Console Ring:
    No Symbol Table

в dom2.log
 ERROR Cannot get kernel page table address from active VCPU
Domain 2: (1 vcpus)
  Flags: HVM UNPAUSED
  Paging assistance:  HAP external translate refcounts
  Max Pages: 524544 (2.001GB, 2049.000MB, 2098176KB)
  Current Pages: 524289
  Shared Pages: 0
  Handle: df4cac67-d577-2c5e-7108-279428061104
  VCPU0:
        Pause Count: 0, Flags: 0x1  Blocked
        Unknown runstate
        Struct vcpu at ffff8300ab7d5000
        VCPU in kernel mode

  Console Ring:
    No Symbol Table

Заметил что падает при старте виртуалок

George Shuklin

unread,
Apr 7, 2015, 6:56:38 PM4/7/15
to xen-h...@googlegroups.com
Про процитированное ничего сказать не могу. Для начала включить netconsole на dom0, если не будет ничего внятного - включать отладочный режим в xen'е на последовательный порт. Будет страшно жутко тормозить, зато напишет всё, что думает о происходящем.

Из моего опыта - может быть банальный OOM из-за кривого балунинга dom0 и жадных гостей, или баг в драйверах зена с dom0-ой стороны.
--
Вы получили это сообщение, поскольку подписаны на группу "xen-hosting".
Чтобы отменить подписку на эту группу и больше не получать от нее сообщения, отправьте письмо на электронный адрес xen-hosting...@googlegroups.com.
Чтобы настроить другие параметры, перейдите по ссылке https://groups.google.com/d/optout.

Dmitrij Nemirskij

unread,
Apr 8, 2015, 2:24:19 AM4/8/15
to xen-h...@googlegroups.com
Ну собственно разобрался, как оказалось, все из за того что я изменил приоритет процессора до макс, после чего удачно про это забыл, а всплыло только после того как отправил виртуалку в перезагрузку.
Собственно тема в конце описывается этот баг http://discussions.citrix.com/topic/359694-random-reboots-after-upgrade-to-65/page-4

8 апреля 2015 г., 1:54 пользователь George Shuklin <george....@gmail.com> написал:
Reply all
Reply to author
Forward
0 new messages