Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Debian 12.4 Kernel Panic durante spegnimeto

6 views
Skip to first unread message

Alessandro Baggi

unread,
Dec 19, 2023, 7:00:05 AM12/19/23
to
Un saluto cordiale a tutta la lista.

Ho un problema durante lo spegnimento del mio PC. Ho una Debian 12.4. In
poche parole ogni tanto quando lancio uno shutdown -h now o un reboot
ottengo un bel kernel panic. É casuale e capita circa due/tre volte al mese.

È da quando ho installato la 12 che questo accade mentre quando ero
sulla 11 non accadeva. Credevo fosse un problema dei primi kernel di
debian (l'ho installata appena uscita) ma il problema persiste quindi mi
viene da pensare che sia un problema hardware?

Su questa PC ho un i9-10850k (leggermente in OC ma con Vcore auto),
scheda madre ASUS Prime Z490-A, 16 GB ddr4, per scheda video una vecchia
Nvidia 1050ti, 2 nvme e due ssd sata (tutti i dischi li uso da meno di
un anno) e alimentatore ASUS ROG Gold da 850W (anche l'alimentatore è
recente e l'ho installato prima del passaggio alla 12.4).

Cosa ci gira: Debian 12.4. Ho configurato 4 mdadm device tipo raid 1,
ho qualche macchina virtuale e qualche servizio come apache2, smb. Tutto
il software è installato tramite repository di debian eccetto per
chrome. Nessun flatpak o snap. Filesystem ext4 e xfs. Cmq niente di esotico.

Nota: ho provato ad installare sempre sugli stessi dischi e con la
stessa configurazione ubuntu e AlmaLinux ma non ho riscontrato errori di
nessun tipo.

L'ultima volte è stato ieri sera verso le 21. Ho provato a leggere i log
con journalctl --system --since="2023-12-18 20:00:00" e le ultime righe
prima del boot odierno sono:


systemd[1]: Shutting down.
systemd-shutdown[1]: Syncing filesystems and block devices.
systemd-shutdown[1]: Sending SIGTERM to remaining processes...
systemd-journald[461]: Received SIGTERM from PID 1 (systemd-shutdow).
systemd-journald[461]: Journal stopped
-- Boot c86eb14c26cd47f1b95d903d39dc419c --

non ho riscontrato errori e dalle riga Boot riporta il boot di oggi.

Non so dove posso trovare altri log relativi al kernel panic ( a dirla
tutta non so se salva i messaggi del panic che si verifica durante uno
shutdown)

Durante l'utilizzo della macchina non ho nessun problema. Ho provato a
lanciare qualche sessione di Prime95 per stressare ram e cpu ma va tutto
bene. Ho stressato un po i dischi ma nessun problema.

I driver della scheda video sono da contrib. Essendo un po vecchia la
scheda video non vorrei cominciasse a dare i primi problemi. Ma anche in
questo caso durante l'utilizzo nessun problema.

Purtroppo non ho l'immagine con i messaggi del panic....lo so....

Qualcuno ha qualche suggerimento su cos'altro indagare?

Grazie a tutti.

Un saluto e buone festività.

Giuseppe Sacco

unread,
Dec 21, 2023, 4:20:03 AM12/21/23
to
Ciao Alessandro,

Il giorno mar, 19/12/2023 alle 12.53 +0100, Alessandro Baggi ha scritto:
> Un saluto cordiale a tutta la lista.
>
> Ho un problema durante lo spegnimento del mio PC. Ho una Debian 12.4. In
> poche parole ogni tanto quando lancio uno shutdown -h now o un reboot
> ottengo un bel kernel panic. É casuale e capita circa due/tre volte al mese.
[...]
> Non so dove posso trovare altri log relativi al kernel panic ( a dirla
> tutta non so se salva i messaggi del panic che si verifica durante uno
> shutdown)

Mi sa che l'unica cosa che puoi fare è una foto allo schermo, oppure usare un
cavo seriale collegato ad un altro computer e impostare la console su
seriale.

Difatti i casi di oops durante lo shutdown, se avvengono con il journald già
spento, non sono nel log. Come ad esempio questo:
https://github.com/systemd/systemd/issues/14829

Ciao,
Giuseppe

Alessandro Baggi

unread,
Dec 21, 2023, 5:50:05 AM12/21/23
to
Ciao Giuseppe e grazie per la risposta.

> Mi sa che l'unica cosa che puoi fare è una foto allo schermo, oppure usare un
> cavo seriale collegato ad un altro computer e impostare la console su
> seriale.
>

Sono riuscito a fare una foto dello schermo del kernel panic ma il
messaggio è molto più lungo di quello che appare nell'immagine. Domanda:
posso allegare la foto in ML oppure devo usare qualche altro servizio?

> Difatti i casi di oops durante lo shutdown, se avvengono con il journald già
> spento, non sono nel log. Come ad esempio questo:
> https://github.com/systemd/systemd/issues/14829
>

Sto facendo qualche prova rimuovendo hardware dal PC. Ti dico questo
perche ricevo:

PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
devive [10ec-8168]....

Il device [10ec-8168] corrisponde ad una scheda di rete TPLink. Ho
rimosso la scheda e vedo se ottengo un kernel panic.

inoltre il dmesg mi da anche:

pcieport 0000:00:1b.0: DPC: error containment capabilities: Int Msg #0,
RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+
pcieport 0000:00:1c.4: DPC: error containment capabilities: Int Msg #0,
RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+
pcieport 0000:00:1d.0: DPC: error containment capabilities: Int Msg #0,
RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+



Devo dire che durante queste prove, ho ottenuto 3 kernel panic in 3
spegnimenti consecutivi.

Cmq se il problema continua, provo a disintallare i driver nvidia con
successiva rimozione della vecchia Nvidia GTX 1050ti e invierò
aggiornamenti in lista.

Non vorrei arrivare a conclusioni affrettate ma ho paura che sia la
scheda madre. In passato mi ha dato problemi con le porte sata. Ora ha
cominciato con le PCI-E. Vedremo dove portano questi test.

Alessandro Baggi

unread,
Dec 21, 2023, 6:30:05 AM12/21/23
to

> Mi sa che l'unica cosa che puoi fare è una foto allo schermo, oppure
> usare un
> cavo seriale collegato ad un altro computer e impostare la console su
> seriale.
>
Ho caricato l'immagine su postimg e sarà disponibile per 7 giorni. Di
seguito il link:

https://i.postimg.cc/HnpDpmj1/20231220-204617.jpg

Un saluto, Alessandro.

Alessandro Baggi

unread,
Dec 21, 2023, 6:40:04 AM12/21/23
to


Il 21/12/23 12:25, Alessandro Baggi ha scritto:
Sono riuscito a catturare tutta la schermata del panic con un video. Ho
preso le immagini significative in quest'ordine: debug1, debug2, debug3.

In queste tre immagini dovrebbe esserci il trace del kernel panic.

Di seguito il link alla galleria:

https://postimg.cc/gallery/y68sgvD

Saranno attive per 7 giorni.

Un saluto, Alessandro.

Giuseppe Sacco

unread,
Dec 22, 2023, 2:50:04 AM12/22/23
to
Ciao,

Il giorno gio, 21/12/2023 alle 12.39 +0100, Alessandro Baggi ha scritto:
[...]
> Sono riuscito a catturare tutta la schermata del panic con un video. Ho
> preso le immagini significative in quest'ordine: debug1, debug2, debug3.
> In queste tre immagini dovrebbe esserci il trace del kernel panic.
> Di seguito il link alla galleria:
> https://postimg.cc/gallery/y68sgvD
>

per quel poco che capisco, si tratta del codice di spegnimento del kernel,
nella parte dell'array multidisk che va a interrompere le scritture su tutti
i dischi dell'array.

Potresti provare a segnalare il problema direttamente sul kernel. Ci sono
problematiche simili alla tua, come questa:
https://bugzilla.kernel.org/show_bug.cgi?id=217733

Ciao,
Giuseppe

Alessandro Baggi

unread,
Dec 22, 2023, 3:40:04 AM12/22/23
to
Ciao Giuseppe,


> per quel poco che capisco, si tratta del codice di spegnimento del kernel,
> nella parte dell'array multidisk che va a interrompere le scritture su tutti
> i dischi dell'array.
>

Si, ho notato che nel trace ci sono riferimenti ad md.

> Potresti provare a segnalare il problema direttamente sul kernel. Ci sono
> problematiche simili alla tua, come questa:
> https://bugzilla.kernel.org/show_bug.cgi?id=217733
>

Interessante ma mi chiedo, se fosse un bug del kernel non dovrebbero
esserci molte più segnalazioni al riguardo? Non credo siamo gli unici ad
avere una debian installata su MD device o che usano MD device. Cmq
prima di aprire un nuovo bug farò qualche altro test. Tra qualche giorno
aggiorno il mio server di backup dalla 11 alla 12 con device MD e
vediamo se ho lo stesso problema (proverò a collegare anche la scheda
video in questione per replicare la problematica che ho sulla
"workstation").

Io sto continuando con i test hardware. Ieri ho tolto la scheda di rete
ma il problema si è ripresentato. Ho proceduto con la rimozione della
scheda video. In questo processo ho prima disinstallato i driver nvidia
dei repo di debian e riavviato un paio di volte. Ad ogni riavvio ho
avuto kernel panic. Quindi il problema si è verificato con i driver
nvidia di debian e i driver nouveau. Scollego la scheda video e i kernel
panic sono finiti (almeno per il momento). Ora mi chiedo e se dico una
cappellata correggimi: è possibile che la scheda video (essendo
collegata sullo slot PCI-E) o i driver causino problemi ai device MD da
generare un kernel panic? Te lo chiedo perche i due dischi primari sono
due nvme in raid1 in modalità PCI-E (che se attivati in PCI-E mode
disabilatano alcune porte SATA).

Grazie ancora.

Alessandro.

Davide Prina

unread,
Dec 24, 2023, 5:30:03 AM12/24/23
to
Alessandro Baggi ha scritto:

> Ho un problema durante lo spegnimento del mio PC. Ho una Debian 12.4. In
> poche parole ogni tanto quando lancio uno shutdown -h now o un reboot
> ottengo un bel kernel panic. É casuale e capita circa due/tre volte al mese.

non so se possa centrare, ma prova ad usare systemctl

per spegnere
# systemctl halt
# systemctl poweroff

Il secondo fa le stesse cose del primo comando, ma in più toglie "corrente"

se non si spegne si può usare l'opzione
--force

se vuoi schedularlo usa l'opzione
--when

per riavviare
# systemctl reboot

Inoltre proverei anche:
$ systemctl is-system-running

per verificare se il sistema è in funzione normalmente o è degradato

per vedere se c'è qualcosa di annomalo
$ systemctl status
$ systemctl status --failed

per maggiori dettagli
$ man systemctl

Ciao
Davide

--
La mia privacy non è affar tuo
https://noyb.eu/it
- You do not have my permission to use this email to train an AI -
If you use this to train your AI than you accept to distribute under AGPL
license >= 3.0 all the model trained, all the source you have used to
training your model and all the source of the program that use that model

Alessandro Baggi

unread,
Jan 11, 2024, 10:10:04 AMJan 11
to
Ciao Davide,
grazie per la risposta e mi scuso per non aver risposto subito ma ho
avuto dei problemi.

> non so se possa centrare, ma prova ad usare systemctl
>
> per spegnere
> # systemctl halt
> # systemctl poweroff
>
> Il secondo fa le stesse cose del primo comando, ma in più toglie "corrente"
>
> se non si spegne si può usare l'opzione
> --force
>
> se vuoi schedularlo usa l'opzione
> --when
>
> per riavviare
> # systemctl reboot
>
> Inoltre proverei anche:
> $ systemctl is-system-running
>
> per verificare se il sistema è in funzione normalmente o è degradato
>
> per vedere se c'è qualcosa di annomalo
> $ systemctl status
>

Grazie per i suggerimenti.
Come detto nelle email precedenti, pensado che il problema fosse
derivato dalla scheda video avevo rimosso la scheda video (una vecchia
GTX 1050ti) e usato quella della CPU e come riportato i kernel panic non
si sono più verificati. Non contento ho voluto fare qualche test e avevo
reinstallato la scheda video usando i driver proprietari dal sito di
NVIDIA (configurazione che sto usando al momento). Il problema sembrava
risolto ma poi inaspettatamente ad uno shutdown un kernel panic (solo 1
dalla data della tua risposta).

Sempre per supportare la mia tesi sui problemi della scheda video ho
notato che con XFCE dopo che lo schermo va in standby per inattività,
quando lo riattivo vedo simboli strani al posto delle lettere sullo
schermo fino al movimento del mouse. Non vorrei che la scheda video
creasse artefatti a causa di un danno e mi generi il problema allo
spegnimento.

Secondo te è possibile?

Un grazie ancora e scusate il ritardo.

Saluti.

Davide Prina

unread,
Jan 14, 2024, 6:10:03 AMJan 14
to
Alessandro Baggi ha scritto:

> derivato dalla scheda video avevo rimosso la scheda video (una vecchia
> GTX 1050ti) e usato quella della CPU e come riportato i kernel panic non
> si sono più verificati. Non contento ho voluto fare qualche test e avevo
> reinstallato la scheda video usando i driver proprietari dal sito di
> NVIDIA (configurazione che sto usando al momento). Il problema sembrava
> risolto ma poi inaspettatamente ad uno shutdown un kernel panic (solo 1
> dalla data della tua risposta).

ma hai lo stesso problema anche con i driver liberi?
Io userei quelli.

Tieni conto che versioni nuove di Linux possono far cambiare le API
esposte rendendo il tutto incompatibile con quelle delle versioni
precedenti. Se tu hai una vecchia scheda può essere che i driver
proprietari non vengano più aggiornati per quella tua scheda e questo
potrebbe essere la causa del problema.

Altro caso potrebbe essere che c'è un bug nella nuova versione di
Linux... puoi cercare nei bug report se trovi qualcosa.

Alessandro Baggi

unread,
Jan 15, 2024, 3:50:05 AMJan 15
to


Il 14/01/24 12:00, Davide Prina ha scritto:
>
> ma hai lo stesso problema anche con i driver liberi?
> Io userei quelli.

Ho provato con nouveau e con quelli il problema si presenta di più.

>
> Tieni conto che versioni nuove di Linux possono far cambiare le API
> esposte rendendo il tutto incompatibile con quelle delle versioni
> precedenti. Se tu hai una vecchia scheda può essere che i driver
> proprietari non vengano più aggiornati per quella tua scheda e questo
> potrebbe essere la causa del problema.
>

Per essere sincero, il problema mi si presenta con Debian 12. Ho provato
anche altre distro tra cui Ubuntu (sempre driver sito Nvidia) e anche
AlmaLinux e il problema non si presenta. A questo punto sembra
riconducibile ad una problematica del kernel di Debian.

> Altro caso potrebbe essere che c'è un bug nella nuova versione di
> Linux... puoi cercare nei bug report se trovi qualcosa.
>

Cercherò.

Grazie per la risposta.

Un saluto Alessandro.
0 new messages