Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Proxmox: disperazione!

501 views
Skip to first unread message

Void

unread,
Jun 29, 2017, 12:21:54 PM6/29/17
to
Ciao a tutti, c'è qualcuno esperto di Proxmox che ha voglia di darmi una
mano?

Su un server con un po' di VM ho dato un:

# pvecm create ProxCluster01

Da lì la fine. Non posso fare più praticamente nulla dall'interfaccia
grafica (spegnere/riaccendere VM...). Ho visto che la /etc/pve è
diventare read only (capisco che P non può aggiornare lo stato delle VM
ad es.), ma non riesco a rimontarla in RW.

# pvecm expected 1
Cannot initialize CMAP service

# systemctl status corosync.service; journalctl -xn
● corosync.service - Corosync Cluster Engine
Loaded: loaded (/lib/systemd/system/corosync.service; enabled)
Active: failed (Result: exit-code) since gio 2017-06-29 17:53:24
CEST; 23min ago
Process: 139199 ExecStart=/usr/share/corosync/corosync start
(code=exited, status=1/FAILURE)

giu 29 17:52:23 proxmox corosync[139206]: [QB ] server name: cmap
giu 29 17:52:23 proxmox corosync[139206]: [SERV ] Service engine
loaded: corosync configuration service [1]
giu 29 17:52:23 proxmox corosync[139206]: [QB ] server name: cfg
giu 29 17:52:23 proxmox corosync[139206]: [SERV ] Service engine
loaded: corosync cluster closed process group service v1.01 [2]
giu 29 17:52:23 proxmox corosync[139206]: [QB ] server name: cpg
giu 29 17:52:23 proxmox corosync[139206]: [SERV ] Service engine
loaded: corosync profile loading service [4]
giu 29 17:53:24 proxmox corosync[139199]: Starting Corosync Cluster
Engine (corosync): [FAILED]
giu 29 17:53:24 proxmox systemd[1]: corosync.service: control process
exited, code=exited status=1
giu 29 17:53:24 proxmox systemd[1]: Failed to start Corosync Cluster Engine.
giu 29 17:53:24 proxmox systemd[1]: Unit corosync.service entered failed
state.
-- Logs begin at mar 2017-06-27 09:06:48 CEST, end at gio 2017-06-29
18:16:44 CEST. --
giu 29 18:16:32 proxmox pmxcfs[128357]: [dcdb] crit: cpg_initialize
failed: 2
giu 29 18:16:32 proxmox pmxcfs[128357]: [status] crit: cpg_initialize
failed: 2
giu 29 18:16:38 proxmox pmxcfs[128357]: [quorum] crit: quorum_initialize
failed: 2
giu 29 18:16:38 proxmox pmxcfs[128357]: [confdb] crit: cmap_initialize
failed: 2
giu 29 18:16:38 proxmox pmxcfs[128357]: [dcdb] crit: cpg_initialize
failed: 2
giu 29 18:16:38 proxmox pmxcfs[128357]: [status] crit: cpg_initialize
failed: 2
giu 29 18:16:44 proxmox pmxcfs[128357]: [quorum] crit: quorum_initialize
failed: 2
giu 29 18:16:44 proxmox pmxcfs[128357]: [confdb] crit: cmap_initialize
failed: 2
giu 29 18:16:44 proxmox pmxcfs[128357]: [dcdb] crit: cpg_initialize
failed: 2
giu 29 18:16:44 proxmox pmxcfs[128357]: [status] crit: cpg_initialize
failed: 2

Qualche idea?

Ciao,
Void

gandalf.co...@gmail.com

unread,
Jun 30, 2017, 5:20:12 AM6/30/17
to
Il giorno giovedì 29 giugno 2017 18:21:54 UTC+2, Void ha scritto:
> Ciao a tutti, c'è qualcuno esperto di Proxmox che ha voglia di darmi una
> mano?

Scrivi sul forum, sono veloci nelle risposte e certamente competenti (rispondono gli sviluppatori)

Comunque, secondo me hai attivato il cluster, che ti ha creato la /etc sotto "etcd" e di conseguenza hai perso il quorum, se non hai altri server parte del cluster.

PVE clusterizzato senza quorum non ti fa fare nulla. Devi disattivare il quorum di peacemaker (non ricordo il comando)

Void

unread,
Jun 30, 2017, 5:51:28 AM6/30/17
to
Il 30/06/2017 11:20, gandalf.co...@gmail.com ha scritto:


> Scrivi sul forum, sono veloci nelle risposte e certamente competenti (rispondono gli sviluppatori)

Sì, ma ho poi risolto poco fa, grazie! Tra l'altro sai/sapete se ci sono
corsi di formazione validi su questo prodotto: va bene la documentazione
e l'esperienza sul campo, ma oltre?


> Comunque, secondo me hai attivato il cluster, che ti ha creato la /etc sotto "etcd"

Hmmm, sì, io volevo proprio attivare un cluster, ma cosa intendi con
"che ti ha creato la /etc sotto etcd"?


> PVE clusterizzato senza quorum non ti fa fare nulla. Devi disattivare il quorum di peacemaker (non ricordo il comando)

In altri casi avevo risolto con un semplice "pvecm expected 1".

Questa volta invece ho risolto seguendo un post che avevo trovato ieri,
ma di cui volevo essere sicuro.

If you're sure about you're not using any clustering feature and
you have a corosync.conf file by a mistake, you can remove the corosync
configuration file with following steps:

First of all, bakcup your current proxmox sqlite config:

$ sudo cp /var/lib/pve-cluster/config.db /root/config.db.backup

Stop the pve-cluster service:

$ sudo systemctl stop pve-cluster.service

Remove the row with named corosync.conf from sqlite tree table:

$ sudo sqlite3 /var/lib/pve-cluster/config.db
sqlite> DELETE FROM tree WHERE name='corosync.conf';
sqlite> .quit

Restart the server

REF:
https://linux-tips.com/t/couldnt-start-virtual-machines-after-proxmox-4-1-upgrade/317/2


Adesso però se volessi creare un cluster quale sarebbe la strada
migliore? Proverò di nuovo con un "pvecm create ProxCluster01
", adesso che ho "l'antidoto", ma se anche così non funziona?


Ciao e buona giornata,
Void

Marco Gaiarin

unread,
Jun 30, 2017, 5:50:02 PM6/30/17
to
Mandi! Void
In chel di` si favelave...

> Su un server con un po' di VM ho dato un:
> # pvecm create ProxCluster01

E non ti ha dato nessun errore? Nei log non ti ha lasciato scritto nulla?


> giu 29 17:53:24 proxmox systemd[1]: Failed to start Corosync Cluster Engine.

ok, corosync non parte. Ma non saprei proprio dirti perchè...

--
- in Italia cosa rischia uno che tortura?
- ...Se è una tortura e via, poco... Se ha anche scaricato musica da
Internet, quattro anni Sergio Staino (Bobo e figlia, maggio 2004)

Void

unread,
Jul 1, 2017, 4:59:52 AM7/1/17
to
Il 30/06/2017 14:15, Marco Gaiarin ha scritto:

> E non ti ha dato nessun errore? Nei log non ti ha lasciato scritto nulla?

Ho riprovato ma con gli stessi risultati, ci ha solo pensato un po' di più:

# pvecm create ProxCluster01
Job for corosync.service failed. See 'systemctl status corosync.service'
and 'journalctl -xn' for details.
command 'systemctl restart corosync' failed: exit code 1

# systemctl status corosync.service
● corosync.service - Corosync Cluster Engine
Loaded: loaded (/lib/systemd/system/corosync.service; enabled)



Active: failed (Result: exit-code) since sab 2017-07-01 10:56:40
CEST; 13s ago


Process: 31106 ExecStart=/usr/share/corosync/corosync start
(code=exited, status=1/FAILURE)






lug 01 10:55:40 lxorsvrt04 corosync[31117]: [SERV ] Service engine
loaded: corosync configuration service [1]


lug 01 10:55:40 lxorsvrt04 corosync[31117]: [QB ] server name: cfg



lug 01 10:55:40 lxorsvrt04 corosync[31117]: [SERV ] Service engine
loaded: corosync cluster closed process group service v1.01 [2]


lug 01 10:55:40 lxorsvrt04 corosync[31117]: [QB ] server name: cpg



lug 01 10:55:40 lxorsvrt04 corosync[31117]: [SERV ] Service engine
loaded: corosync profile loading service [4]


lug 01 10:55:40 lxorsvrt04 corosync[31117]: [QUORUM] Using quorum
provider corosync_votequorum


lug 01 10:56:40 lxorsvrt04 corosync[31106]: Starting Corosync Cluster
Engine (corosync): [FAILED]


lug 01 10:56:40 lxorsvrt04 systemd[1]: corosync.service: control process
exited, code=exited status=1


lug 01 10:56:40 lxorsvrt04 systemd[1]: Failed to start Corosync Cluster
Engine.


lug 01 10:56:40 lxorsvrt04 systemd[1]: Unit corosync.service entered
failed state.



# journalctl -xn


-- Logs begin at mar 2017-06-27 09:06:48 CEST, end at sab 2017-07-01
10:56:56 CEST. --


lug 01 10:56:44 lxorsvrt04 pmxcfs[31092]: [dcdb] crit: cpg_initialize
failed: 2


lug 01 10:56:44 lxorsvrt04 pmxcfs[31092]: [status] crit: cpg_initialize
failed: 2


lug 01 10:56:50 lxorsvrt04 pmxcfs[31092]: [quorum] crit:
quorum_initialize failed: 2


lug 01 10:56:50 lxorsvrt04 pmxcfs[31092]: [confdb] crit: cmap_initialize
failed: 2


lug 01 10:56:50 lxorsvrt04 pmxcfs[31092]: [dcdb] crit: cpg_initialize
failed: 2


lug 01 10:56:50 lxorsvrt04 pmxcfs[31092]: [status] crit: cpg_initialize
failed: 2


lug 01 10:56:56 lxorsvrt04 pmxcfs[31092]: [quorum] crit:
quorum_initialize failed: 2


lug 01 10:56:56 lxorsvrt04 pmxcfs[31092]: [confdb] crit: cmap_initialize
failed: 2
lug 01 10:56:56 lxorsvrt04 pmxcfs[31092]: [dcdb] crit: cpg_initialize
failed: 2
lug 01 10:56:56 lxorsvrt04 pmxcfs[31092]: [status] crit: cpg_initialize
failed: 2


Ciao,
Void

Void

unread,
Jul 1, 2017, 5:09:04 AM7/1/17
to
Il 01/07/2017 10:59, Void ha scritto:

>> E non ti ha dato nessun errore? Nei log non ti ha lasciato scritto
nulla?
> Ho riprovato ma con gli stessi risultati, ci ha solo pensato un po'
di più:

Ripercorrendo la procedura di ripristino al riavvio ottengo questo:

Jul 1 11:05:40 proxmox systemd[1]: Starting The Proxmox VE cluster
filesystem...
Jul 1 11:05:41 proxmox systemd[1]: Started The Proxmox VE cluster
filesystem.
Jul 1 11:05:41 proxmox systemd[1]: Starting Corosync Cluster Engine...
Jul 1 11:05:41 proxmox corosync[35532]: [MAIN ] Corosync Cluster
Engine ('2.4.2'): started and ready to provide service.
Jul 1 11:05:41 proxmox corosync[35532]: [MAIN ] Corosync built-in
features: augeas systemd pie relro bindnow
Jul 1 11:05:41 proxmox corosync[35534]: [TOTEM ] Initializing
transport (UDP/IP Multicast).
Jul 1 11:05:41 proxmox corosync[35534]: [TOTEM ] Initializing
transmit/receive security (NSS) crypto: aes256 hash: sha1
Jul 1 11:05:41 proxmox corosync[35534]: [TOTEM ] The network interface
[192.168.8.54] is now up.
Jul 1 11:05:41 proxmox corosync[35534]: [SERV ] Service engine
loaded: corosync configuration map access [0]
Jul 1 11:05:41 proxmox corosync[35534]: [QB ] server name: cmap
Jul 1 11:05:41 proxmox corosync[35534]: [SERV ] Service engine
loaded: corosync configuration service [1]
Jul 1 11:05:41 proxmox corosync[35534]: [QB ] server name: cfg
Jul 1 11:05:41 proxmox corosync[35534]: [SERV ] Service engine
loaded: corosync cluster closed process group service v1.01 [2]
Jul 1 11:05:41 proxmox corosync[35534]: [QB ] server name: cpg
Jul 1 11:05:41 proxmox corosync[35534]: [SERV ] Service engine
loaded: corosync profile loading service [4]
Jul 1 11:05:41 proxmox corosync[35534]: [QUORUM] Using quorum provider
corosync_votequorum
Jul 1 11:05:41 proxmox corosync[35534]: [QUORUM] Quorum provider:
corosync_votequorum failed to initialize.
Jul 1 11:05:41 proxmox corosync[35534]: [SERV ] Service engine
'corosync_quorum' failed to load for reason 'configuration error:
nodelist or quorum.expected_votes must be configured!'
Jul 1 11:05:41 proxmox corosync[35534]: [MAIN ] Corosync Cluster
Engine exiting with status 20 at service.c:356.

C'è quindi qualcosa di sporco nella configurazione: iniziamo da qui...


Void

gandalf.co...@gmail.com

unread,
Jul 1, 2017, 7:59:48 AM7/1/17
to
Il giorno sabato 1 luglio 2017 11:09:04 UTC+2, Void ha scritto:
> C'è quindi qualcosa di sporco nella configurazione: iniziamo da qui...

Probabilmente se avessi scritto sul forum, avresti risolto già
dall'altro ieri capendo anche perchè non ha funzionato........
0 new messages