Um zu testen, ob die Fehler in der USB-Anbindung liegen k�nnten, habe
ich sowohl mit dem onboard USB-1.1 und einer USB-2.0-Karte getestet:
root [~] lspci | grep USB
00:04.2 USB Controller: Intel Corporation 82371AB/EB/MB PIIX4 USB (rev 01)
00:0c.0 USB Controller: NEC Corporation USB (rev 43)
00:0c.1 USB Controller: NEC Corporation USB (rev 43)
00:0c.2 USB Controller: NEC Corporation USB 2.0 (rev 04)
Die badblocks-Fehler blieben bestehen. Zus�tzlich habe ich noch mit
einem eingeschleiften USB-Hub getestet, auch er ver�nderte nichts am
Ergebnis. Ich kann anhand der Fehlermeldungen aber nicht ausschlie�en,
dass es keine USB-�bertragungsfehler sind, daf�r fehlt mir das
Detailwissen.
Die Tests wurden mit einem Linux-Rechner gemacht. Aus diesem Grund
kann ich die SeaTools auch nicht nutzen (laufen nur unter Windows, die
Seagate DOS-Tools testen keine externen Festplatten).
Aus /var/log/syslog:
May 13 10:47:22 wallace kernel: scsi 2:0:0:0: Direct-Access Seagate FreeAgent Go 102D PQ: 0 ANSI: 4
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] 625142448 512-byte hardware sectors: (320 GB/298 GiB)
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Write Protect is off
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Mode Sense: 1c 00 00 00
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Assuming drive cache: write through
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] 625142448 512-byte hardware sectors: (320 GB/298 GiB)
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Write Protect is off
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Mode Sense: 1c 00 00 00
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Assuming drive cache: write through
May 13 10:47:22 wallace kernel: sda: sda1
May 13 10:47:22 wallace kernel: sd 2:0:0:0: [sda] Attached SCSI disk
May 13 10:47:22 wallace kernel: sd 2:0:0:0: Attached scsi generic sg0 type 0
May 13 10:47:22 wallace kernel: usb-storage: device scan complete
May 13 10:50:18 wallace kernel: sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
May 13 10:50:18 wallace kernel: sd 2:0:0:0: [sda] Sense Key : Aborted Command [current]
May 13 10:50:18 wallace kernel: sd 2:0:0:0: [sda] Add. Sense: No additional sense information
May 13 10:50:18 wallace kernel: end_request: I/O error, dev sda, sector 6160384
May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Unhandled sense code
May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Sense Key : Medium Error [current]
May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Add. Sense: Data phase error
May 13 10:50:33 wallace kernel: end_request: I/O error, dev sda, sector 6160400
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770050
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770051
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770052
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770053
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770054
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770055
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770056
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770057
May 13 10:50:33 wallace kernel: Buffer I/O error on device sda, logical block 770058
May 13 10:53:47 wallace kernel: sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
May 13 10:53:47 wallace kernel: sd 2:0:0:0: [sda] Sense Key : Aborted Command [current]
May 13 10:53:47 wallace kernel: sd 2:0:0:0: [sda] Add. Sense: No additional sense information
May 13 10:53:47 wallace kernel: end_request: I/O error, dev sda, sector 6160384
May 13 10:54:01 wallace kernel: sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
May 13 10:54:01 wallace kernel: sd 2:0:0:0: [sda] Sense Key : Aborted Command [current]
May 13 10:54:01 wallace kernel: sd 2:0:0:0: [sda] Add. Sense: No additional sense information
May 13 10:54:01 wallace kernel: end_request: I/O error, dev sda, sector 6160400
May 13 10:54:01 wallace kernel: __ratelimit: 21 callbacks suppressed
[...]
Meine Fragen:
* Kann jemand anhand der Fehlermeldungen erkennen, ob es sich um
Fehler der Platte oder um USB-�bertragungsfehler (o.�.) handelt?
* Wenn es bad blocks sind, sind sie ein Mangel oder muss man eine
bestimmte Anzahl hinnehmen (so wie defekte Pixel bei Bildschirmen)?
* Ich habe geh�rt, moderne Festplatten verbergen defekte Sektoren in
Reservesektoren, so dass man eigentlich gar keine bad blocks finden
d�rfte. Hei�t das, dass schon alle Reservesektoren aufgebraucht sind
oder verwechlse ich da etwas?
* Falls es ein Mangel ist, muss der H�ndler die Platte zur�cknehmen
oder muss ich den Tausch schon jetzt �ber Seagate abwickeln? Die
Platte ist, wie gesagt, erst einen Tag alt.
[fup2 de.comp.hardware.laufwerke.festplatten]
Danke, Martin
Martin Klaiber schrieb:
> gewohnheitsm��ig schnell noch badblocks gestartet: 147 bad blocks in
> einem engen Bereich (3080192-3095807 von 312571224) wurden gefunden.
> May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Sense Key : Medium Error [current]
> May 13 10:50:33 wallace kernel: sd 2:0:0:0: [sda] Add. Sense: Data phase error
> Meine Fragen:
>
> * Kann jemand anhand der Fehlermeldungen erkennen, ob es sich um
> Fehler der Platte oder um USB-�bertragungsfehler (o.�.) handelt?
Ich hab das passende als Zitat stehen lassen: Medium Error ist
eindeutig. Zur Sicherheit: mach ein
dd if=/dev/zero of=/dev/sda seek=1500 bs=1M und guck, ob wieder an der
selben Stelle die Fehler auftreten. USB Fehler w�rden willk�rlich
auftreten, Medium Errors immer an den selben Sektoren.
> * Wenn es bad blocks sind, sind sie ein Mangel oder muss man eine
> bestimmte Anzahl hinnehmen (so wie defekte Pixel bei Bildschirmen)?
Nene, die Platten haben internes Defekt-Management, nach au�en hin (also
das, was das Betriebssystem sieht) darf die Platte exakt 0 schlechte
Bl�cke haben.
> * Ich habe geh�rt, moderne Festplatten verbergen defekte Sektoren in
> Reservesektoren, so dass man eigentlich gar keine bad blocks finden
> d�rfte. Hei�t das, dass schon alle Reservesektoren aufgebraucht sind
> oder verwechlse ich da etwas?
Ne, exakt so ist es.
Installier das Paket "smartmontools", da ist das Programm
smartctl -data -A /dev/sda
drin, welches Dir mit dem Parameter "-A" die SMART-Werte der Platte
ausgibt. Dort steht auch drin, wie viele der Reservesektoren schon
verwendet werden und ob die Reserve schon zur Neige geht. Bei Fragen
einfach die komplette Ausgabe von dem Befehl hier in die Gruppe posten.
> * Falls es ein Mangel ist, muss der H�ndler die Platte zur�cknehmen
> oder muss ich den Tausch schon jetzt �ber Seagate abwickeln? Die
> Platte ist, wie gesagt, erst einen Tag alt.
Gegen so ein defektes Teil kann sich der H�ndler nicht str�uben, da ist
es am einfachsten, in den Laden zu gehen und ein neues Exemplar zu
holen. Vielleicht magst Du ja auch den Hersteller wechseln.
Wenn Du Dich an den Hersteller wendest, dann bekommst Du nur eine
reparierte Platte zur�ck. Die kann schon ewig gelaufen sein und ist
definitiv schlechter als eine Originalverpackte.
Lass Dich nicht drauf ein, dass der Laden die Platte einschicken will;
Poche auf die Kulanz und verlange eine neue, auch wenn Du keinen
Rechtsanspruch hast.
Gru�,
cp
Es sind verschiedene Fehler. Vielleicht gibt es Probleme bei der
Stromversorgung (das ist doch so eine platte ohne eigenes Netzteil die
illegal viel Strom aus dem USB-Port zieht oder?).
> * Wenn es bad blocks sind, sind sie ein Mangel oder muss man eine
> bestimmte Anzahl hinnehmen (so wie defekte Pixel bei Bildschirmen)?
Vmtl. bekommt man Kulanz. Ein echter Mangel sind ein paar defekte Blocks
wohl eher nicht.
> * Ich habe geh�rt, moderne Festplatten verbergen defekte Sektoren in
> Reservesektoren, so dass man eigentlich gar keine bad blocks finden
> d�rfte. Hei�t das, dass schon alle Reservesektoren aufgebraucht sind
> oder verwechlse ich da etwas?
Die Platten haben Reservesektoren und die sind sicher bei dir auch noch
nicht aufgebraucht. Das Ersetzen passiert aber nur unter bestimmten
Umstaenden. Beim Schreiben auf so einen Block sagt der Host explizit,
dass er die alten Daten nicht mehr braucht und der Block kann sofort
ersetzt werden. Beim Lesen (wenn die Daten auch mit Fehlerkorrektur und
Lesewiederholungen nicht rekonstruiert werden konnten) darf die Platte
das nicht machen weil sonst unbemerkt Daten verloren gehen wuerden. In
diesem Fall bleibt der defekte Block an Ort und Stelle und dem Host wird
ein Lesefehler gemeldet.
Micha
> Es sind verschiedene Fehler. Vielleicht gibt es Probleme bei der
> Stromversorgung (das ist doch so eine platte ohne eigenes Netzteil die
> illegal viel Strom aus dem USB-Port zieht oder?).
Ja, die Platte hat auch gar keinen Anschluss f�r ein Netzteil. Leider
gibt es bei Seagate keinerlei brauchbare technische Daten dazu. Im web
fand ich einen Test der besagt, dass die Leistungsaufnahme zwischen 1,3
und 3 Watt liegt. Beim Anlaufen gibt es keine Probleme und sie liest
auch einwandfrei, bis sie eben in diesen Bereich der bad blocks kommt.
Danach liest sie auch wieder einwandfrei bis zum Plattenende.
Es gibt die Platte aber auch noch als Mac-Modell mit Firewire- statt
USB-Anschluss. W�re vermutlich die bessere L�sung gewesen, habe ich
aber erst nach dem Kauf gesehen. Mal schauen, vielleicht kann ich sie
umtauschen. Mit Firewire habe ich unter Linux bisher weniger Probleme
gehabt als mit USB. Oder gibt es etwas, das gegen das Mac-Modell unter
Linux spricht?
> Die Platten haben Reservesektoren und die sind sicher bei dir auch noch
> nicht aufgebraucht. Das Ersetzen passiert aber nur unter bestimmten
> Umstaenden. Beim Schreiben auf so einen Block sagt der Host explizit,
> dass er die alten Daten nicht mehr braucht und der Block kann sofort
> ersetzt werden. Beim Lesen (wenn die Daten auch mit Fehlerkorrektur und
> Lesewiederholungen nicht rekonstruiert werden konnten) darf die Platte
> das nicht machen weil sonst unbemerkt Daten verloren gehen wuerden. In
> diesem Fall bleibt der defekte Block an Ort und Stelle und dem Host wird
> ein Lesefehler gemeldet.
Ok. Danke f�r die gute Erkl�rung,
Martin
> Zur Sicherheit: mach ein dd if=/dev/zero of=/dev/sda seek=1500 bs=1M
Ich m�chte die Platte ungern beschreiben, solange nicht klar ist, dass
ich sie behalte. M�chte vermeiden, dass behauptet wird, ich h�tte sie
beim Schreiben besch�digt, oder so was. Habe leider schon zu viele von
diesen "Fachverk�ufern" getroffen, die sich solche Begr�ndungen aus den
Fingern saugen.
> und guck, ob wieder an der selben Stelle die Fehler auftreten. USB
> Fehler w�rden willk�rlich auftreten, Medium Errors immer an den selben
> Sektoren.
Ich habe sie mit mehreren USB-Karten/-Ports getestet und die Fehler
waren immer an der selben Stelle. Das ist ja auch ziemlich eindeutig.
> smartctl -data -A /dev/sda
root [~] smartctl -data -A /dev/sda
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Smartctl: Device Read Identity Failed (not an ATA/ATAPI device)
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.
Neuer Versuch mit Option verypermissive:
root [~] smartctl -data -A -T verypermissive /dev/sda
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Smartctl: Device Read Identity Failed (not an ATA/ATAPI device)
SMART support is: Ambiguous - ATA IDENTIFY DEVICE words 82-83 don't show if SMART supported.
Checking for SMART support by trying SMART ENABLE command.
Error SMART Enable failed: Invalid argument
SMART ENABLE failed - this establishes that this device lacks SMART functionality.
SMART Disabled. Use option -s with argument 'on' to enable it.
Ok, dann also einschalten:
root [~] smartctl -s on -T verypermissive /dev/sda
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
unable to fetch IEC (SMART) mode page [unsupported field in scsi command]
Hm, und was hei�t das nun? Unterst�tzt die Platte nicht die g�ngigen
SMART-Kommandos? Oder ist mein smartmontools zu alt (ist aus Debian
Etch)? Das Ergebnis ist bei beiden USB-Anschl�ssen gleich (intel 82371
und NEC), d�rfte also kein USB-Problem sein.
> Gegen so ein defektes Teil kann sich der H�ndler nicht str�uben, da ist
> es am einfachsten, in den Laden zu gehen und ein neues Exemplar zu
> holen. Vielleicht magst Du ja auch den Hersteller wechseln.
Ja, vielleicht sollte man tats�chlich ein anderes Modell w�hlen. Sie
scheint ja nicht ganz unproblematisch zu sein.
Danke erstmal f�r Deine Analyse,
Martin
Eine Ausdruck einer "smartctl -a ..." Ausgabe reicht bei solchen
Verk�ufern meistens aus :-)
Durch das �berschreiben werden die bad blocks normalerweise auf
Reservesektoren umgeleitet und sind dann verschwunden. Wenn man das
nicht m�chte, sollte man das �berschreiben lassen, und ggf. GNU ddrescue
verwenden, um nur die nicht defekten Sektoren zu l�schen.
>> smartctl -data -A /dev/sda
>
> root [~] smartctl -data -A /dev/sda
> smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
> Home page is http://smartmontools.sourceforge.net/
>
> Smartctl: Device Read Identity Failed (not an ATA/ATAPI device)
>
> [...]
>
> Hm, und was hei�t das nun? Unterst�tzt die Platte nicht die g�ngigen
> SMART-Kommandos? Oder ist mein smartmontools zu alt (ist aus Debian
> Etch)? Das Ergebnis ist bei beiden USB-Anschl�ssen gleich (intel 82371
> und NEC), d�rfte also kein USB-Problem sein.
>
�ber USB k�nnen ATA SMART Kommandos nicht direkt �bertragen werden. Es
geht aber �ber ein ATA pass-through SCSI Kommando. Dabei m�ssen
smartctl, der Linux kernel und der USB-Chip im Seagate Geh�use
mitspielen (http://smartmontools.wiki.sourceforge.net/USB)
Zumindest "Seagate FreeAgent Desk" unterst�tzt das SAT Protokoll
vermutlich gilt das auch f�r "FreeAgent Go".
Mit "smartctl -d sat,12 ..." statt "-d ata" sollte es klappen,
allerdings erfordert dies mindestens smartctl 5.37.
(Danke f�r jedes Feedback f�r unsere Kompatibilit�tsliste unter
http://smartmontools.wiki.sourceforge.net/overview_USB-Support)
Ein Build der aktuellen Version direkt aus dem CVS ist ein 5-Zeiler,
vorausgesetzt die Linux Distro bringt autoconf, automake, cvs und g++
mit: http://smartmontools.sourceforge.net/download.html#CVSInstall
Gru�
Christian
... was nach USB-Spezifikation nicht zulaessig ist.
> Beim Anlaufen gibt es keine Probleme und sie liest
> auch einwandfrei, bis sie eben in diesen Bereich der bad blocks kommt.
> Danach liest sie auch wieder einwandfrei bis zum Plattenende.
Dann liegt es vermutlich schon an der Platte selbst.
> Es gibt die Platte aber auch noch als Mac-Modell mit Firewire- statt
> USB-Anschluss. W�re vermutlich die bessere L�sung gewesen, habe ich
> aber erst nach dem Kauf gesehen. Mal schauen, vielleicht kann ich sie
> umtauschen. Mit Firewire habe ich unter Linux bisher weniger Probleme
> gehabt als mit USB. Oder gibt es etwas, das gegen das Mac-Modell unter
> Linux spricht?
Nein, die Platte da drin wird die gleiche sein. Vermutlich muss man nur
ein Windows-kompatibles Dateisystem draufmachen und fertig.
Micha
> Eine Ausdruck einer "smartctl -a ..." Ausgabe reicht bei solchen
> Verk�ufern meistens aus :-)
LOL :-)
> Durch das �berschreiben werden die bad blocks normalerweise auf
> Reservesektoren umgeleitet und sind dann verschwunden.
Naja, wenn das normal ist, dann ist ja alles ok. Ich will nur nicht
eine defekte Platte haben, zumal es auch gar nicht meine ist und f�r
Backup-Zwecke verwendet werden soll. Eine gewisse Datensicherheit w�re
also nicht unflott.
Ich kann leider selbst nicht einsch�tzen, wie kritisch diese bad blocks
sind. 147 von 312571224 sind ja verschwindend wenig und w�rden f�r sich
genommen �berhaupt nicht st�ren. Dass es eine 320-GB-Platte wurde ist
mehr oder weniger Zufall. Eine 160-GB- oder 250-GB-Platte h�tte es auch
getan. Um das bi�chen Platzverlust geht es also nicht. Wenn es aber ein
Hinweis auf rasch fortschreitenden weiteren Verlust ist, dann w�re das
nat�rlich ein KO-Kriterium. Das kann ich aber nicht einsch�tzen.
> Mit "smartctl -d sat,12 ..." statt "-d ata" sollte es klappen,
> allerdings erfordert dies mindestens smartctl 5.37.
> (Danke f�r jedes Feedback f�r unsere Kompatibilit�tsliste unter
> http://smartmontools.wiki.sourceforge.net/overview_USB-Support)
> Ein Build der aktuellen Version direkt aus dem CVS ist ein 5-Zeiler,
> vorausgesetzt die Linux Distro bringt autoconf, automake, cvs und g++
> mit: http://smartmontools.sourceforge.net/download.html#CVSInstall
Ich habe der Einfachheit halber den 5.38-tarball genommen, ich hoffe
das ist ok f�r Dich (beim Auschecken aus dem cvs vert�ddle ich mich
dauernd und habe gerade etwas wenig Zeit). Die Installation verlief
problemlos. Hier die Werte der Platte:
root [~] smartctl -d sat,12 -A /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 118 081 006 Pre-fail Always - 168793584
3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 38
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 1406
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 6
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 33
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 001 001 000 Old_age Always - 570
188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 074 062 045 Old_age Always - 26 (Lifetime Min/Max 18/26)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 17
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 30
194 Temperature_Celsius 0x0022 026 040 000 Old_age Always - 26 (0 18 0 0)
195 Hardware_ECC_Recovered 0x001a 062 054 000 Old_age Always - 168793584
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 6
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 6
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Ich kann mit den Daten allerdings nichts anfangen :-/ Kann mich da
bitte jemand beraten? Danke.
Ein Aufruf mit -a bringt noch weitere Fehlermeldungen, und zwar
einige dieser Form:
Error 538 occurred at disk power-on lifetime: 2 hours (0 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 fc 79 5e 00 Error: UNC at LBA = 0x005e79fc = 6191612
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 08 f8 79 5e 40 00 00:14:54.809 READ DMA EXT
25 00 08 f8 79 5e 40 00 00:14:52.433 READ DMA EXT
25 00 08 f8 79 5e 40 00 00:14:50.034 READ DMA EXT
25 00 08 f8 79 5e 40 00 00:14:47.658 READ DMA EXT
25 00 08 f8 79 5e 40 00 00:14:45.248 READ DMA EXT
Was mir daran auff�llt ist der LBA 6191612. Er liegt in der N�he der
Sektoren, die von badblocks als defekt erkannt wurden (der in syslog
dokumentierte Bereich reichte aber nur von 6160384 bis 6191608).
Sind das die defekten Sektoren? Und was hei�t Error 538? Hei�t das,
dass m�glicherweise 538 defekte Sektoren vorhanden sind? Der �lteste
Fehler, den smartctl -a meldet, ist Error 534, die Fehlermeldung sieht
ganz �hnlich aus wie obige, nur dass die Zeit nat�rlich ein bi�chen
fr�her liegt.
TIA, Martin
Schwer zu sagen. Neue Platten haben aber f�r gew�hnlich keinen (nicht
umgeleiteten) bad block.
>
>> Ein Build der aktuellen Version direkt aus dem CVS ist ein 5-Zeiler,
>> vorausgesetzt die Linux Distro bringt autoconf, automake, cvs und g++
>> mit: http://smartmontools.sourceforge.net/download.html#CVSInstall
>
> Ich habe der Einfachheit halber den 5.38-tarball genommen, ich hoffe
> das ist ok f�r Dich (beim Auschecken aus dem cvs vert�ddle ich mich
> dauernd und habe gerade etwas wenig Zeit). Die Installation verlief
> problemlos. ...
5.38 ist reicht f�r SAT, nur die Protokolle f�r JMicron und Sunplus USB
Bridges erfordern die aktuelle Version.
Wie ist die USB ID (idVendor und idProduct) dieser USB-Platte? Unter
Linux zu ermitteln mit 'lsusb -v'.
> ... Hier die Werte der Platte:
>
> root [~] smartctl -d sat,12 -A /dev/sda
> smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
> Home page is http://smartmontools.sourceforge.net/
>
> === START OF READ SMART DATA SECTION ===
> SMART Attributes Data Structure revision number: 10
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
> 1 Raw_Read_Error_Rate 0x000f 118 081 006 Pre-fail Always - 168793584
> 3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0
> 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 38
> 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
Noch kein umgeleiteter Sektor.
> ...
> 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 6
> 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 6
6(?) Sektoren wurden als fehlerhaft erkannt und stehen zur Umleitung an.
>
> Ein Aufruf mit -a bringt noch weitere Fehlermeldungen, und zwar
> einige dieser Form:
>
> Error 538 occurred at disk power-on lifetime: 2 hours (0 days + 2 hours)
> When the command that caused the error occurred, the device was active or idle.
>
> After command completion occurred, registers were:
> ER ST SC SN CL CH DH
> -- -- -- -- -- -- --
> 40 51 00 fc 79 5e 00 Error: UNC at LBA = 0x005e79fc = 6191612
>
> Commands leading to the command that caused the error were:
> CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
> -- -- -- -- -- -- -- -- ---------------- --------------------
> 25 00 08 f8 79 5e 40 00 00:14:54.809 READ DMA EXT
> ...
>
> Was mir daran auff�llt ist der LBA 6191612. Er liegt in der N�he der
> Sektoren, die von badblocks als defekt erkannt wurden (der in syslog
> dokumentierte Bereich reichte aber nur von 6160384 bis 6191608).
>
> Sind das die defekten Sektoren? Und was hei�t Error 538? Hei�t das,
> dass m�glicherweise 538 defekte Sektoren vorhanden sind?
Das sind durch vermutlich defekte Sektoren verursachte Lesefehler.
Ingesamt wurden 538 Fehler in das Log geschrieben. Das kann aber auch
538 mal ein Fehler beim Lesen desselben Sektors gewesen sein.
Leider ist in dem alten Fehlerlog nur Platz f�r 5 Eintr�ge.
Ich w�rde mal einen vollst�ndigen SMART Selbsttest (-t long) starten und
nach dessen Ende den Selbsttest Log auslesen (-l selftest). Dort wird
der erste gefundene bad block angezeigt.
Gru�
Christian
>> Um das bi�chen Platzverlust geht es also nicht. Wenn es aber ein
>> Hinweis auf rasch fortschreitenden weiteren Verlust ist, dann w�re
>> das nat�rlich ein KO-Kriterium. Das kann ich aber nicht einsch�tzen.
> Schwer zu sagen. Neue Platten haben aber f�r gew�hnlich keinen (nicht
> umgeleiteten) bad block.
Ok, Danke.
> Wie ist die USB ID (idVendor und idProduct) dieser USB-Platte? Unter
> Linux zu ermitteln mit 'lsusb -v'.
idVendor 0x0bc2 Seagate RSS LLC
idProduct 0x2100
> Ich w�rde mal einen vollst�ndigen SMART Selbsttest (-t long) starten und
> nach dessen Ende den Selbsttest Log auslesen (-l selftest). Dort wird
> der erste gefundene bad block angezeigt.
Die Option -l selftest wurde nicht angenommen:
=======> INVALID ARGUMENT TO -t: selftest
=======> VALID ARGUMENTS ARE: offline, short, long, conveyance, select,M-N, pending,N, afterselect,[on|off], scttempint,N[,p] <=======
Aber die Option -a brachte folgende neue Informationen:
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 7 6191612
Deine Vermutung war also wohl richtig, dass die 538 Fehlermeldungen in
erster Linie Lesefehler ein und desselben Sektors sind.
Was hei�t denn "read failure"? Einfach nur, dass mindestens ein Sektor
nicht gelesen werden konnte?
Und was bedeutet das "Remaining 90%"? Dass noch 90% Ersatzsektoren
verf�gbar sind, oder etwas in der Art?
Und dann kommt noch Folgendes im log, mit dem ich nichts anfangen kann:
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Danke f�r Deine Hilfe und sorry f�r die sp�te Antwort, ich hatte leider
viel um die Ohren,
Martin
> Die Option -l selftest wurde nicht angenommen:
> =======> INVALID ARGUMENT TO -t: selftest
^
Mmh, wer lesen kann, ist klar im Vorteil ;-)
Ok, also -l selftest klappt, bringt aber nur die Info, die ich schon
gepostet hatte.
Danke f�r die Info, ist jetzt eingetragen:
http://smartmontools.wiki.sourceforge.net/overview_USB-Support
Mit der aktuellen CVS Version von smartctl sollte diese Platte auch ohne
'-d sat' funktionieren.
>
> Aber die Option -a brachte folgende neue Informationen:
>
> SMART Self-test log structure revision number 1
> Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
> # 1 Extended offline Completed: read failure 90% 7 6191612
>
> Deine Vermutung war also wohl richtig, dass die 538 Fehlermeldungen in
> erster Linie Lesefehler ein und desselben Sektors sind.
>
> Was hei�t denn "read failure"? Einfach nur, dass mindestens ein Sektor
> nicht gelesen werden konnte?
>
Genau.
> Und was bedeutet das "Remaining 90%"? Dass noch 90% Ersatzsektoren
> verf�gbar sind, oder etwas in der Art?
>
Als der Fehler aufgetreten ist, waren noch ~90% des Tests �brig.
> Und dann kommt noch Folgendes im log, mit dem ich nichts anfangen kann:
>
> SMART Selective self-test log data structure revision number 1
> SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
> 1 0 0 Not_testing
> 2 0 0 Not_testing
> 3 0 0 Not_testing
> 4 0 0 Not_testing
> 5 0 0 Not_testing
> Selective self-test flags (0x0):
> After scanning selected spans, do NOT read-scan remainder of disk.
> If Selective self-test is pending on power-up, resume after 0 minute delay.
>
Dies ist eigentlich kein Log, sondern zeigt die aktuellen LBA-Bereiche
der selektiven Selbsttests. Um z.B. bei deiner Platte zu testen, ob
wirklich nur dieser eine Sektor betroffen ist:
# smartctl -t select,6191613-max /dev/ice
Den Status sieht man in '-l selective', das Ergebnis steht in '-l
selftest' oder '-l xselftest'.
Auch n�tzlich, wenn ein '-t long' Test l�nger dauert als der PC
�blicherweise eingeschaltet ist. Alternativ kann man damit die Platte in
kleineren Abschnitten testen ('-t select,cont', geht auch automatisch
mit smartd).
Gru�
Christian