Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Debian Testing - Hilfe bei der Auswertung von SMART

112 views
Skip to first unread message

Jens Liebmann

unread,
Oct 28, 2019, 5:40:02 AM10/28/19
to
Hallo Liste,

auf meinem noch recht neuen Thinkpad Carbon X1 mit Debian Testing
bekomme ich seit letzten Donnerstag täglich eine Meldung mit einer
zunehmenden Anzahl nicht näher bezeichneten Einträgen für Fehler.


This message was generated by the smartd daemon running on:

host name: debian03
DNS domain: jens

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, number of Error Log entries increased from 473 to
475

Device info:
SAMSUNG MZVLB1T0HALR-000L7, S/N:S3TPNX0K912413, FW:4L2QEXA7, 1.02 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Sun Oct 13 07:37:00
2019
CEST
Another message will be sent in 24 hours if the problem persists.


Auf der Suche was diese Fehler sein sollen komme ich allerdings nicht
weiter, denn die Ausgaben von smartctl stehen dazu nach meiner Meinung
im Widerspruch.


root@debian03:/home/jens# smartctl -H /dev/nvme0
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.3.0-1-amd64] (local
build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke,
www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED


root@debian03:/home/jens# smartctl -a /dev/nvme0
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.3.0-1-amd64] (local
build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke,
www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number: SAMSUNG MZVLB1T0HALR-000L7
Serial Number: S3TPNX0K912413
Firmware Version: 4L2QEXA7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 1.024.209.543.168 [1,02 TB]
Unallocated NVM Capacity: 0
Controller ID: 4
Number of Namespaces: 1
Namespace 1 Size/Capacity: 1.024.209.543.168 [1,02 TB]
Namespace 1 Utilization: 325.909.024.768 [325 GB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: 002538 8981bddced
Local Time is: Sun Oct 27 21:34:55 2019 CET
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x001f): Comp Wr_Unc DS_Mngmt Wr_Zero
Sav/Sel_Feat
Maximum Data Transfer Size: 512 Pages
Warning Comp. Temp. Threshold: 81 Celsius
Critical Comp. Temp. Threshold: 82 Celsius

Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.02W - - 0 0 0 0 0 0
1 + 6.30W - - 1 1 1 1 0 0
2 + 3.50W - - 2 2 2 2 0 0
3 - 0.0760W - - 3 3 3 3 210 1200
4 - 0.0050W - - 4 4 4 4 2000 8000

Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 37 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 8.398.680 [4,30 TB]
Data Units Written: 13.226.557 [6,77 TB]
Host Read Commands: 47.529.271
Host Write Commands: 82.483.195
Controller Busy Time: 282
Power Cycles: 244
Power On Hours: 264
Unsafe Shutdowns: 77
Media and Data Integrity Errors: 0
Error Information Log Entries: 473
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 37 Celsius
Temperature Sensor 2: 38 Celsius

Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
^^^^^^^^^^^^^^^^^

Was kann ich tun um diese 2 Aussagen in Übereinstimmung zu bringen?

--
Jens Liebmann

Stefan Baur

unread,
Oct 28, 2019, 5:50:02 AM10/28/19
to
Am 28.10.19 um 10:20 schrieb Jens Liebmann:
> Was kann ich tun um diese 2 Aussagen in Übereinstimmung zu bringen?

Mach doch erst mal das, was in der Meldung von Dir verlangt wird:
"For details see host's SYSLOG."

Gruß
Stefan

Martin Reising

unread,
Oct 28, 2019, 6:00:02 AM10/28/19
to
On Mon, Oct 28, 2019 at 10:20:09AM +0100, Jens Liebmann wrote:
> The following warning/error was logged by the smartd daemon:
>
> Device: /dev/nvme0, number of Error Log entries increased from 473 to
> 475
.....
> === START OF SMART DATA SECTION ===
> SMART overall-health self-assessment test result: PASSED
>
> SMART/Health Information (NVMe Log 0x02)
> Critical Warning: 0x00
> Temperature: 37 Celsius
> Available Spare: 100%
> Available Spare Threshold: 10%
> Percentage Used: 0%
> Data Units Read: 8.398.680 [4,30 TB]
> Data Units Written: 13.226.557 [6,77 TB]
> Host Read Commands: 47.529.271
> Host Write Commands: 82.483.195
> Controller Busy Time: 282
> Power Cycles: 244
> Power On Hours: 264
> Unsafe Shutdowns: 77
> Media and Data Integrity Errors: 0
> Error Information Log Entries: 473
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

Mit smartctl -x /dev/nvme0 sollte er dir zumindest einen Teil der 473
Error Information Log Entries zeigen; nicht das ich mit diesen
Einträgen was anfangen könnte:

Error Information Log Entries: 15

Error Information (NVMe Log 0x01, max 64 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 15 0 0x000d 0x4004 0x000 0 0 -
1 14 0 0x0011 0x4004 0x000 0 0 -
2 13 0 0x000c 0x4004 0x000 0 0 -
3 12 0 0x000f 0x4004 0x000 0 0 -
4 11 0 0x000c 0x4004 0x000 0 0 -
5 10 0 0x001c 0x4004 0x000 0 0 -
6 9 0 0x0016 0x4004 0x000 0 0 -
7 8 0 0x0017 0x4004 0x000 0 0 -
8 7 0 0x0009 0x4004 0x000 0 0 -
9 6 0 0x0012 0x4004 0x000 0 0 -
10 5 0 0x001c 0x4004 0x000 0 0 -
11 4 0 0x000d 0x4004 0x000 0 0 -
12 3 0 0x0009 0x4004 0x000 0 0 -
13 2 0 0x0016 0x4004 0x000 0 0 -
14 1 0 0x0007 0x4004 0x000 0 0 -
signature.asc

Jens Liebmann

unread,
Oct 28, 2019, 6:00:02 AM10/28/19
to
Am Montag, den 28.10.2019, 10:40 +0100 schrieb Stefan Baur:

Hallo Stefan

> Mach doch erst mal das, was in der Meldung von Dir verlangt wird:
> "For details see host's SYSLOG."

Das ist ja der Sinn der Frage:
Wo nach suchen in der Vielzahl von Einträgen dort.
Ich bin, was derartige Hintergründe betrifft, autodidaktischer Laie

--
Jens Liebmann

Stefan Baur

unread,
Oct 28, 2019, 6:10:03 AM10/28/19
to
Am 28.10.19 um 10:56 schrieb Jens Liebmann:
sudo zgrep -i smart /var/log/syslog*

wirft Dir aus dem aktuellen Syslog und den bereits rotierten alten
Syslogs alles aus, was (GROSSkleinschreibungsunabhängig) auf "smart"
matcht. Muss mit sudo bzw. root erfolgen, da normale User kein Leserecht
aufs Syslog haben.

Gruß
Stefan

Jens Liebmann

unread,
Oct 28, 2019, 6:50:02 AM10/28/19
to
Am Montag, den 28.10.2019, 11:00 +0100 schrieb Stefan Baur:

Hallo Stefan
Hallo Martin
>
> sudo zgrep -i smart /var/log/syslog*

Danke euch beiden.
Ich stelle die Ausgabe heute Abend auf paste.debian.net. Denn erstens
habe ich den Carbon zu Hause, und dann sehe ich auf dem Laptop hier
dass das Ergebnis bestimmt ziemlich umfangreich werden wird.

--
Jens Liebmann

Jens Liebmann

unread,
Oct 28, 2019, 11:20:03 AM10/28/19
to
Am Montag, den 28.10.2019, 10:20 +0100 schrieb Jens Liebmann:

Hallo,

hier die angekündigten Befehlsausgaben von


smartctl -x /dev/nvme0

https://paste.debian.net/1111398/

Da gibt es keine Informationen zu Fehlern.


zgrep -i smart /var/log/syslog*

https://paste.debian.net/1111399/


Hier fällt mir auch nichts auf was auf mögliche Fehler hindeutet.

--
Jens Liebmann

Stefan Baur

unread,
Oct 28, 2019, 11:30:02 AM10/28/19
to
Am 28.10.19 um 16:19 schrieb Jens Liebmann:
>
> zgrep -i smart /var/log/syslog*
>
> https://paste.debian.net/1111399/
>
>
> Hier fällt mir auch nichts auf was auf mögliche Fehler hindeutet.

/var/log/syslog.2.gz:Oct 27 07:39:05 debian03 smartd[1028]: Device:
/dev/nvme0, number of Error Log entries increased from 469 to 471
/var/log/syslog.2.gz:Oct 27 07:39:05 debian03 smartd[1028]: Sending
warning via /usr/share/smartmontools/smartd-runner to root ...
/var/log/syslog.2.gz:Oct 27 07:39:05 debian03 smartd[1028]: Warning via
/usr/share/smartmontools/smartd-runner to root: successful

/var/log/syslog.2.gz:Oct 26 11:20:58 debian03 smartd[1061]: Device:
/dev/nvme0, number of Error Log entries increased from 467 to 469
/var/log/syslog.2.gz:Oct 26 11:20:58 debian03 smartd[1061]: Device:
/dev/nvme0, state written to
/var/lib/smartmontools/smartd.SAMSUNG_MZVLB1T0HALR_000L7-S3TPNX0K912413.nvme.state

/var/log/syslog.3.gz:Oct 26 07:36:16 debian03 smartd[903]: Device:
/dev/nvme0, number of Error Log entries increased from 465 to 467
/var/log/syslog.3.gz:Oct 26 07:36:16 debian03 smartd[903]: Sending
warning via /usr/share/smartmontools/smartd-runner to root ...

Was steht denn in der
/var/lib/smartmontools/smartd.SAMSUNG_MZVLB1T0HALR_000L7-S3TPNX0K912413.nvme.state,
die hier erwähnt wird?

Falls

less
/var/lib/smartmontools/smartd.SAMSUNG_MZVLB1T0HALR_000L7-S3TPNX0K912413.nvme.state

nichts brauchbares auswirft, weil es Binärkram ist, dann:

hexdump -C
/var/lib/smartmontools/smartd.SAMSUNG_MZVLB1T0HALR_000L7-S3TPNX0K912413.nvme.state
| less

Vielleicht bist Du auch gerade auf diesen Bug gestoßen:
<https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=900244>

Gefunden mit Google-Suchbegriff:
Device: /dev/nvme0, number of Error Log entries increased

Gruß
Stefan

Jens Liebmann

unread,
Oct 28, 2019, 1:20:02 PM10/28/19
to
Am Montag, den 28.10.2019, 16:28 +0100 schrieb Stefan Baur:

Hallo Stefan

> Was steht denn in der
> /var/lib/smartmontools/smartd.SAMSUNG_MZVLB1T0HALR_000L7-
> S3TPNX0K912413.nvme.state,
> die hier erwähnt wird?
>

# smartd state file
mail.4.count = 11
mail.4.first-sent-time = 1570945020
mail.4.last-sent-time = 1572249517
nvme-err-log-entries = 475

>
> Vielleicht bist Du auch gerade auf diesen Bug gestoßen:
> <https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=900244>

Mit meinem Schulenglisch, das auch noch mehr als 30 Jahre alt ist,
komme ich nicht sehr weit. Ich schließe lediglich, dass es da nicht um
Probleme mit der Festplatte/SSD an sich geht. Das würde mich schon
beruhigen, denn der Laptop ist erst ein 1/4 Jahr alt und die Samsung
SSD auch kein unbedingtes Billigteil.

--
Jens Liebmann
0 new messages