SCSI LTO kann nur 0-Bytes schreiben

1 view
Skip to first unread message

Marcel Mueller

unread,
Aug 7, 2021, 2:17:35 AM8/7/21
to
Moin,

ich habe hier einen seltsamsten Fehler. Ein Ultrium Tape-Wechseler (Dell
PowerVault 124T) mit IBM LTO-3 Laufwerk liefert bei Schreiben
reproduzierbar immer sofort einen Error, es sei denn die Daten stammen
von /dev/zero. Bei letzterem geht es immer - na ja, bis das Band nach
ca. 400GB voll ist.

> root@hadron:# dd if=/dev/zero of=/dev/st0 bs=256k status=progress
> 397934592 bytes (398 MB, 380 MiB) copied, 10 s, 41,2 MB/s
[...]
Wenn man ihn lässt, schafft er sich durch und mit der Datenrate noch höher.

Hingegen
> root@hadron:# dd if=/dev/urandom of=/dev/st0 bs=256k status=progress
> dd: Fehler beim Schreiben von '/dev/st0': Eingabe-/Ausgabefehler
und mit etwas Verzögerung
> dd: Schließen der Ausgabedatei '/dev/st0': Eingabe-/Ausgabefehler

Im log steht dann
> Aug 7 07:55:35 hadron kernel: [10168.180606] st 8:0:3:0: [st0] Sense Key : Aborted Command [current]
> Aug 7 07:55:35 hadron kernel: [10168.180613] st 8:0:3:0: [st0] Add. Sense: Data phase error
> Aug 7 07:55:35 hadron kernel: [10168.190545] st 8:0:3:0: [st0] Sense Key : Medium Error [current]
> Aug 7 07:55:35 hadron kernel: [10168.190549] st 8:0:3:0: [st0] Add. Sense: Medium format corrupted
> Aug 7 07:55:35 hadron kernel: [10168.190552] st 8:0:3:0: [st0] Error on write filemark.
> Aug 7 07:55:50 hadron kernel: [10183.187093] st 8:0:3:0: [st0] Sense Key : Hardware Error [deferred]
> Aug 7 07:55:50 hadron kernel: [10183.187100] st 8:0:3:0: [st0] Add. Sense: Internal target failure
und das war's.

Das ganze ist ein Debian Buster, so aktuell wie das halt ist.
Hardwarekompression ist aus.

Hat irgendjemand eine Idee, woran das liegen könnte?


Marcel

Sieghard Schicktanz

unread,
Aug 7, 2021, 4:13:05 PM8/7/21
to
Hallo Marcel Mueller,

Du schriebst am Sat, 7 Aug 2021 08:17:33 +0200:

> ich habe hier einen seltsamsten Fehler. Ein Ultrium Tape-Wechseler
> (Dell PowerVault 124T) mit IBM LTO-3 Laufwerk liefert bei Schreiben
> reproduzierbar immer sofort einen Error, es sei denn die Daten
> stammen von /dev/zero. Bei letzterem geht es immer - na ja, bis das
> Band nach ca. 400GB voll ist.

Das sind doch Mehrspur-Geräte? Da ist dann wohl die Elektronik für eine
Spur kaputt und schreibt oder liest immer nur Nullen. Wenn wirklich
Nullen geschrieben werden, passt das ja auch immer. Werden aber Daten
geschrieben, die auch davon abweichende Bits enthalten, dann geht das
halt immer dann daneben, wenn ein solches Bit auf der kaputten Spur
landen müßte oder hätte sollen.
...
> Das ganze ist ein Debian Buster, so aktuell wie das halt ist.

Das hat nur dann was zu sagen, wenn das selbe Gerät unter einem anderen
System einwandfrei läuft.

> Hardwarekompression ist aus.

Das hat wahrscheinlich auch nicht viel zu sagen, aber je nach
Algorithmus könnte die Kompression den Fehler auch provizieren.

--
(Weitergabe von Adressdaten, Telefonnummern u.ä. ohne Zustimmung
nicht gestattet, ebenso Zusendung von Werbung oder ähnlichem)
-----------------------------------------------------------
Mit freundlichen Grüßen, S. Schicktanz
-----------------------------------------------------------

Sebastian Suchanek

unread,
Aug 7, 2021, 4:42:32 PM8/7/21
to
Thus spoke Marcel Mueller:

> ich habe hier einen seltsamsten Fehler. Ein Ultrium
> Tape-Wechseler (Dell PowerVault 124T) mit IBM LTO-3
> Laufwerk liefert bei Schreiben reproduzierbar immer sofort
> einen Error, es sei denn die Daten stammen von /dev/zero.
> Bei letzterem geht es immer - na ja, bis das Band nach ca.
> 400GB voll ist.
> [...]
> Hat irgendjemand eine Idee, woran das liegen könnte?

Wie ist der Streamer bzw. die Library denn mit dem PC/Server
verbunden? Ich bin Hier[tm] schier verzweifelt mit einem LTO5-
Laufwerk, das in Bacula reproduzierbar einen einfachen
Schreibtest bestanden, aber bei einem anderen Schreibtest
sofort(!) einen Segfault produziert hat.
Dann habe ich irgendwann den FC-Controller im Server gegen ein
anderes Modell eines anderen Herstellers ausgetauscht. Seither
tut das Laufwerk brav was es soll...


Tschüs,

Sebastian

Marcel Mueller

unread,
Aug 7, 2021, 5:29:27 PM8/7/21
to
Am 07.08.21 um 20:51 schrieb Sieghard Schicktanz:
> Hallo Marcel Mueller,
>
> Du schriebst am Sat, 7 Aug 2021 08:17:33 +0200:
>
>> ich habe hier einen seltsamsten Fehler. Ein Ultrium Tape-Wechseler
>> (Dell PowerVault 124T) mit IBM LTO-3 Laufwerk liefert bei Schreiben
>> reproduzierbar immer sofort einen Error, es sei denn die Daten
>> stammen von /dev/zero. Bei letzterem geht es immer - na ja, bis das
>> Band nach ca. 400GB voll ist.
>
> Das sind doch Mehrspur-Geräte? Da ist dann wohl die Elektronik für eine
> Spur kaputt und schreibt oder liest immer nur Nullen. Wenn wirklich
> Nullen geschrieben werden, passt das ja auch immer.

Eher nicht. Die Dinger schreiben ja noch alle möglichen Metadaten mit
auf's Band. Zudem kommt ja noch ein komplexes Modulationsverfahren zum
Einsatz. Insofern ist null beim schreiben nicht null.


>> Das ganze ist ein Debian Buster, so aktuell wie das halt ist.
>
> Das hat nur dann was zu sagen, wenn das selbe Gerät unter einem anderen
> System einwandfrei läuft.

Ja. Aber die Library schleppe ich jetzt nicht rum. Außerdem habe ich
nicht mehr viel mit passendem SCSI-Controller.


>> Hardwarekompression ist aus.
>
> Das hat wahrscheinlich auch nicht viel zu sagen, aber je nach
> Algorithmus könnte die Kompression den Fehler auch provoizieren.

Sagen wir es mal so: Es ist relativ schwierig ein Band bei aktivierter
Hardwarekompression mit nullen vollzuschreiben. Da sich diese maximal
Komprimieren lassen, würde nahezu nicht geschrieben und es mutmaßlich
einen ganzen Tag dauern, bis die Terabytes auch nur über die
Schnittstelle gelaufen sind.


Marcel

Marcel Mueller

unread,
Aug 7, 2021, 5:40:55 PM8/7/21
to
Am 07.08.21 um 14:57 schrieb Sebastian Suchanek:
> Thus spoke Marcel Mueller:
>
>> ich habe hier einen seltsamsten Fehler. Ein Ultrium
>> Tape-Wechseler (Dell PowerVault 124T) mit IBM LTO-3
>> Laufwerk liefert bei Schreiben reproduzierbar immer sofort
>> einen Error, es sei denn die Daten stammen von /dev/zero.
>> Bei letzterem geht es immer - na ja, bis das Band nach ca.
>> 400GB voll ist.
>> [...]
>> Hat irgendjemand eine Idee, woran das liegen könnte?
>
> Wie ist der Streamer bzw. die Library denn mit dem PC/Server
> verbunden?

LVD SCSI Kabel, ein paar Meter lang.

Aber die Richtung scheint zu stimmen. Tatsächlich habe ich jetzt einen
Ansatzpunkt gefunden. Ich habe mal den SCSI-Terminator gewechselt. Als
ich einen genommen habe, der kein LVD kann, hat es auf einmal
funktioniert - natürlich lahm.

Ich gehe davon aus, dass dem Terminator nichts fehlt, sondern das Kabel
einen Schaden hat, der eine Leitung betrifft, die im SE-Modus nicht
benutzt wird (Masse). Wie allerdings mit der defekten Leitung alle
anderen Sachen fehlerfrei über den Bus gekommen sind, also
Steuerbefehle, Wechsler-Steuerung, Barcodes auslesen etc. erschließt
sich mir nicht. Manchmal geschehen wundersame Dinge.

Natürlich wäre auch ein technischer Defekt beim Laufwerk oder dem
Controller im LVD Tranceiver denkbar. Aber die Dinger sind normalerweise
sehr hart im nehmen.

Auf jeden Fall habe ich jetzt einen Ansatzpunkt.


> Ich bin Hier[tm] schier verzweifelt mit einem LTO5-
> Laufwerk, das in Bacula reproduzierbar einen einfachen
> Schreibtest bestanden, aber bei einem anderen Schreibtest
> sofort(!) einen Segfault produziert hat.
> Dann habe ich irgendwann den FC-Controller im Server gegen ein
> anderes Modell eines anderen Herstellers ausgetauscht. Seither
> tut das Laufwerk brav was es soll...

OK, du meinst der Treiber war Matsch? Das hatte ich auch noch nicht.
Aber ich habe auch nur SCSI. Die PCI-Controller bekommt man
hinterhergeschmissen. FC und SAS hingegen ist dagegen Boutiqueware die
zudem meist noch die Stromrechnung poliert.


Marcel

olaf

unread,
Aug 8, 2021, 3:15:03 AM8/8/21
to
Marcel Mueller <news.5...@spamgourmet.org> wrote:

>Eher nicht. Die Dinger schreiben ja noch alle möglichen Metadaten mit
>auf's Band. Zudem kommt ja noch ein komplexes Modulationsverfahren zum
>Einsatz. Insofern ist null beim schreiben nicht null.

Aber ausschliesslich Nullen und die lassen sich gut packen. Da werden
dann halt nur sehr wenig Daten geschrieben.

Ich hab hier auch probiert einen Streamer mit einem Adaptec 2940UW
ueber eine PCI-E nach PCI Bridge ans laufen zu bekommen. Das hat auch
gut funktioniert solange man nur Tapes ein und auswirf oder wenige
Kilobyte schreibt. Sobald ernsthaft Daten ueber den Bus laufen haengt
sich das weg. (schluchz)

Ich waere im uebrigen interessiert an einen brauchbaren und
preiswerten SCSI-Adapter fuer PCI-E unter Linux. Tips was man da so
nimmt?

>Sagen wir es mal so: Es ist relativ schwierig ein Band bei aktivierter
>Hardwarekompression mit nullen vollzuschreiben. Da sich diese maximal

Genau. Deshalb denke ich du hast ein Problem mit der Zuverlaessigkeit
deiner Verbindung.

Olaf

Sebastian Suchanek

unread,
Aug 8, 2021, 10:07:33 AM8/8/21
to
Thus spoke Marcel Mueller:

> Am 07.08.21 um 14:57 schrieb Sebastian Suchanek:
>> Thus spoke Marcel Mueller:
>
> [LVD-SCSI]
> Wie
> allerdings mit der defekten Leitung alle anderen Sachen
> fehlerfrei über den Bus gekommen sind, also Steuerbefehle,
> Wechsler-Steuerung, Barcodes auslesen etc. erschließt sich
> mir nicht. Manchmal geschehen wundersame Dinge.
> [...]

<SCNR>Ganz klar - Du hast das tägliche Ziegenopfer über dem Bus
vergessen!</SCNR>

>> Ich bin Hier[tm] schier verzweifelt mit einem LTO5-
>> Laufwerk, das in Bacula reproduzierbar einen einfachen
>> Schreibtest bestanden, aber bei einem anderen Schreibtest
>> sofort(!) einen Segfault produziert hat.
>> Dann habe ich irgendwann den FC-Controller im Server gegen
>> ein anderes Modell eines anderen Herstellers ausgetauscht.
>> Seither tut das Laufwerk brav was es soll...
>
> OK, du meinst der Treiber war Matsch?
> [...]

Scheint so - viele andere Erklärungen habe ich jedenfalls nicht.
Nachdem sich das sprichwörtlich über Jahre hingezogen hat und
ich einiges durchprobiert habe, bin ich mir nicht (mehr) sicher,
ob ich es im Produktivsystem auch mal mit einem anderen,
baugleichen Exemplar des zickenden FC-Controllers gemacht habe.
Der alte war jedenfalls ein Emulex LPe11002, der neue - mit dem
es jetzt funktioniert - ist ein Qlogic mit ISP2532 (laut lspci).


Tschüs,

Sebastian

Marcel Mueller

unread,
Aug 8, 2021, 11:57:15 AM8/8/21
to
Am 08.08.21 um 09:14 schrieb olaf:
> Marcel Mueller <news.5...@spamgourmet.org> wrote:
>
> >Eher nicht. Die Dinger schreiben ja noch alle möglichen Metadaten mit
> >auf's Band. Zudem kommt ja noch ein komplexes Modulationsverfahren zum
> >Einsatz. Insofern ist null beim schreiben nicht null.
>
> Aber ausschliesslich Nullen und die lassen sich gut packen. Da werden
> dann halt nur sehr wenig Daten geschrieben.
>
> Ich hab hier auch probiert einen Streamer mit einem Adaptec 2940UW
> ueber eine PCI-E nach PCI Bridge ans laufen zu bekommen. Das hat auch
> gut funktioniert solange man nur Tapes ein und auswirf oder wenige
> Kilobyte schreibt. Sobald ernsthaft Daten ueber den Bus laufen haengt
> sich das weg. (schluchz)

Hmm, die Dinger waren eigentlich Standard. Bei mir ist es ein 2940U2W.
Läuft seit ca. 10 Jahren mit Ultrium. Vorher war AFAIR ein Dawi UW
(alias Symbios alias LSI) mit DLT drin. Lief auch Jahre. Und ein 29160
muss auch noch irgendwo drin sein. PCIe Boards, also mit Bridge sind das
allesamt.


> Ich waere im uebrigen interessiert an einen brauchbaren und
> preiswerten SCSI-Adapter fuer PCI-E unter Linux. Tips was man da so
> nimmt?

Ein Board, was noch /PCI/ kann, das ist billiger. ;-)

Ich habe immer darauf geachtet, noch PCI-Slots zu haben. PCIe-Slots
braucht fast kein Mensch (außer für GraKa zum Zocken). Mittlerweile ist
nahezu alles, was man da rein stecken könnte, ohnehin on Board -
geeignetes Board vorausgesetzt. Und einfache Karten wie DVB, SCSI etc.
kosten als PCIe einfach nur ein Vielfaches, ohne irgendeinen Mehrwert zu
haben.

Dummerweise bekommt man keine aktuellen Boards mit PCI Bridge mehr -
überteuerte Insustrieware mal außen vor. Da kann man dann auch einen
überteuerten Controller kaufen.

Aber neueres Zeug hat natürlich auch kein Parallel SCSI mehr, sondern
entweder FC oder SAS. Die Controller sind aber genauso sündig teuer und
brauchen ordentlich Strom.


> >Sagen wir es mal so: Es ist relativ schwierig ein Band bei aktivierter
> >Hardwarekompression mit nullen vollzuschreiben. Da sich diese maximal
>
> Genau. Deshalb denke ich du hast ein Problem mit der Zuverlaessigkeit
> deiner Verbindung.

Ja, das hat sich ja mittlerweile bestätigt.
Da muss ich nochmal genau gucken, ob es wirklich das Kabel ist.


Marcel

olaf

unread,
Aug 8, 2021, 1:45:03 PM8/8/21
to
Marcel Mueller <news.5...@spamgourmet.org> wrote:

>Hmm, die Dinger waren eigentlich Standard. Bei mir ist es ein 2940U2W.
>Läuft seit ca. 10 Jahren mit Ultrium. Vorher war AFAIR ein Dawi UW
>(alias Symbios alias LSI) mit DLT drin. Lief auch Jahre. Und ein 29160
>muss auch noch irgendwo drin sein. PCIe Boards, also mit Bridge sind das
>allesamt.

Du hast nicht ganz verstanden. :-) Ausser irgendwelche komischen Spezialboard
mit einer OnBoardbridge ist sowas lange Geschichte.

Ich meinte sowas hier:

https://www.amazon.de/Kalea-Informatique-Adapter-Konverter-Express/dp/B08KGBQY7P

Da laeuft weder ein 2940UW, noch ein KT930 noch ein NCR400 zuverlassig
drin. Seufz.

>Ein Board, was noch /PCI/ kann, das ist billiger. ;-)

Klar, da klopf ich dann meinen Ryzen7 mit dem Hammer rein. :-)

>Ich habe immer darauf geachtet, noch PCI-Slots zu haben. PCIe-Slots

Das hab ich vor 7-8Jahren auch noch. Aber jetzt ist die Zeit vorbei.
Wirklich brauchen tue ist das im uebrigen wohl nicht. Aber ohne SCSI
fuehl ich mich irgendwie alt. War seit den 80ern immer im Rechner.

Olaf

Michael Brand

unread,
Aug 9, 2021, 3:22:35 AM8/9/21
to
olaf wrote:
[...]
> Ich meinte sowas hier:
>
> https://www.amazon.de/Kalea-Informatique-Adapter-Konverter-Express/dp/B08KGBQY7P
>
> Da laeuft weder ein 2940UW, noch ein KT930 noch ein NCR400 zuverlassig
> drin. Seufz.

Also, so wie das aussieht und so preiswert es ist wundere ich mich das
damit überhaupt welche Karten mit laufen.

> Wirklich brauchen tue ist das im uebrigen wohl nicht. Aber ohne SCSI
> fuehl ich mich irgendwie alt. War seit den 80ern immer im Rechner.

Du bist ja auch älter geworden. "Die 80er" sind seit über 30 Jahren
vorbei...
Schlimmer ist es, wenn $man eine Spezialanwendung mit einer (damals)
sündhaft teuren ISA-Messwerterfassungskarte hat und die neuen Systeme
weder den Bus noch die Software brauchbar unterstützen.

> Olaf

Michael

Michael Bäuerle

unread,
Aug 9, 2021, 4:34:17 AM8/9/21
to
Marcel Mueller wrote:
> Am 07.08.21 um 14:57 schrieb Sebastian Suchanek:
> > Thus spoke Marcel Mueller:
> > >
> > > ich habe hier einen seltsamsten Fehler. Ein Ultrium
> > > Tape-Wechseler (Dell PowerVault 124T) mit IBM LTO-3
> > > Laufwerk liefert bei Schreiben reproduzierbar immer sofort
> > > einen Error, es sei denn die Daten stammen von /dev/zero.
> > > Bei letzterem geht es immer - na ja, bis das Band nach ca.
> > > 400GB voll ist.
> > > [...]
> > > Hat irgendjemand eine Idee, woran das liegen könnte?
> >
> > Wie ist der Streamer bzw. die Library denn mit dem PC/Server
> > verbunden?
>
> LVD SCSI Kabel, ein paar Meter lang.
>
> Aber die Richtung scheint zu stimmen. Tatsächlich habe ich jetzt einen
> Ansatzpunkt gefunden. Ich habe mal den SCSI-Terminator gewechselt. Als
> ich einen genommen habe, der kein LVD kann, hat es auf einmal
> funktioniert - natürlich lahm.

Das würde zu dieser Fehlermeldung passen:
|
| Aug 7 07:55:35 hadron kernel: [10168.180606] st 8:0:3:0: [st0] Sense Key : Aborted Command [current]
| Aug 7 07:55:35 hadron kernel: [10168.180613] st 8:0:3:0: [st0] Add. Sense: Data phase error
^^^^^^^^^^^^^^^^
Dass kontinuierlich Nullen eher über den Bus zu bringen sind leuchtet
auch ein, weil sich die Pegel der Signalleitungen damit weniger oft
ändern müssen.

> Ich gehe davon aus, dass dem Terminator nichts fehlt, sondern das Kabel
> einen Schaden hat, der eine Leitung betrifft, die im SE-Modus nicht
> benutzt wird (Masse). Wie allerdings mit der defekten Leitung alle
> anderen Sachen fehlerfrei über den Bus gekommen sind, also
> Steuerbefehle, Wechsler-Steuerung, Barcodes auslesen etc. erschließt
> sich mir nicht. Manchmal geschehen wundersame Dinge.

Wenn das Laufwerk zwar LVD-Transfers unterstützt, die moderneren Sachen
wie Information Units aber noch nicht, dann sollten Befehle (mit den
Busphasen COMMAND und STATUS) wie seit allen Zeiten asynchron übertragen
werden.
Außerdem wird dafür nur der Narrow-Bus verwendet, d.h. es könnte ein
Signal auf dem Wide-Bus Probleme machen.

olaf

unread,
Aug 9, 2021, 10:45:03 AM8/9/21
to
Michael Brand <bra...@gmx.net> wrote:

>Also, so wie das aussieht und so preiswert es ist wundere ich mich das
>damit überhaupt welche Karten mit laufen.

Im Prinzip ist das genau dieselbe Bridge die man frueher direkt auf
dem Mobo verbaut hat. Allerdings die weiterleitung des LVDS Kanals mit
einem Stueck USB-Kabel mit noch dazu zwei TypeA Steckern ist schon bizarr.
Ich wollte bei Gelegenheit mal probieren da was kabeltechnisch anderes
dran zu fummeln. Vielleicht geht ja SATA. :-D

>Schlimmer ist es, wenn $man eine Spezialanwendung mit einer (damals)
>sündhaft teuren ISA-Messwerterfassungskarte hat und die neuen Systeme
>weder den Bus noch die Software brauchbar unterstützen.

Ach, das stellt man sich dann halt eine ISA-Kiste von Ebay komplett
hin. Wenn man sowas wirklich braucht ist das ja alles loesbar.

Olaf


Reply all
Reply to author
Forward
0 new messages