je viens de remplacer une SS20 qui commen�ait � montrer des signes de
faiblesse.
Vu que j'ai eu par le pass� des probl�me de SMP avec cette machine, et
vu qu'elle tourne 24/7 je lui offre des vacances et j'ai relog� ses
composants dans une autre SS20 que j'avais en r�serve, soit :
- le SM71
- les 448 Mo de ram
- la carte SCSI / ethernet
- un nouveau disque dur car le pr�c�dent avait commenc� � faire des
castagnettes et commen�ait � indiquer des erreurs de lecture sur
certains secteurs.
J'en ai profit� pour ajouter un second SM71 que j'avais retir� de la
premi�re SS20 apr�s qu'il n'ai plus �t� reconnu.
Dans cette configuration, avec un linux 2.4.26-sparc32-smp le temps de
fonctionnement avant blocage est de 1 � quelques minutes. �a finit
immanquablement sur un watchdog-reset.
Je me souviens de la discussion icelieu en 2006 � propos des probl�mes
de SMP de JKB et dont j'ai retenu que le watchdog-reset traduit plut�t
un probl�me hardware.
Je me souviens �galement qu'on avait dit que le SM71 pouvait �tre
fragile.
Comment je pourrais diagnostiquer ce probl�me et faire rentrer le chien
dans sa niche ? En attendant j'ai retir� le second SM71 et la machine ne
plante plus... Lorsqu'il est connect� le second SM71 est reconnu par
l'OB puis par le noyau SMP (avec l'autre SS20 il n'�tait plus reconnu ni
par l'un ni par l'autre).
Pour info, sicela a une importance, j'ai une rom en 2.2 (ou 2.20 .?),
que je peux remplacer par une 2.25R de ma SS20 initiale.
Merci pour un �ventuel tuyau.
--
S�bastien Kirche
Bonjour,
> je viens de remplacer une SS20 qui commençait à montrer des signes de
> faiblesse.
> Vu que j'ai eu par le passé des problème de SMP avec cette machine, et
> vu qu'elle tourne 24/7 je lui offre des vacances et j'ai relogé ses
> composants dans une autre SS20 que j'avais en réserve, soit :
> - le SM71
> - les 448 Mo de ram
> - la carte SCSI / ethernet
> - un nouveau disque dur car le précédent avait commencé à faire des
> castagnettes et commençait à indiquer des erreurs de lecture sur
> certains secteurs.
>
> J'en ai profité pour ajouter un second SM71 que j'avais retiré de la
> première SS20 après qu'il n'ai plus été reconnu.
>
> Dans cette configuration, avec un linux 2.4.26-sparc32-smp le temps de
> fonctionnement avant blocage est de 1 à quelques minutes. Ça finit
> immanquablement sur un watchdog-reset.
>
> Je me souviens de la discussion icelieu en 2006 à propos des problèmes
> de SMP de JKB et dont j'ai retenu que le watchdog-reset traduit plutôt
> un problème hardware.
Les noyaux Linux après le 2.4.21 (de mémoire) sur une sun4m sont
merdiques et donnent toujours des "watchdog-reset". La valeur du
timeout doit être réglée un peu bas et je ne me suis jamais penché
sur le problème. Cela provient de spinlocks dans le noyau en SMP.
L'ennui, c'est que sur sparc, la libc impose si on ne fait pas gaffe
une migration sur un noyau supérieur par défaut.
> Je me souviens également qu'on avait dit que le SM71 pouvait être
> fragile.
Non. Le SM81 tout au plus. Je n'ai jamais eu de problème à déplorer
avec des SM71-1 (je n'ai jamais eu de SM71-2).
> Comment je pourrais diagnostiquer ce problème et faire rentrer le chien
> dans sa niche ? En attendant j'ai retiré le second SM71 et la machine ne
> plante plus... Lorsqu'il est connecté le second SM71 est reconnu par
> l'OB puis par le noyau SMP (avec l'autre SS20 il n'était plus reconnu ni
> par l'un ni par l'autre).
>
> Pour info, sicela a une importance, j'ai une rom en 2.2 (ou 2.20 .?),
> que je peux remplacer par une 2.25R de ma SS20 initiale.
Le 2.2.5R (ou W), c'est pour des ROSS (et ça ne change rien vis à
vis du watchdog).
Commence par essayer de booter ta machine avec un Linux 2.2 (dernier
noyau réellement correct sur sun4m) ou un NetBSD 4 (pas 5, parce le
support SMP dans le 5 est particulièrement 'broken' ;-) ) et dis
nous ce qui se passe.
Cordialement,
JKB
--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.
> Commence par essayer de booter ta machine avec un Linux 2.2
> (dernier noyau r�ellement correct sur sun4m) ou un NetBSD 4
> (pas 5, parce le support SMP dans le 5 est particuli�rement
> 'broken' ;-) ) et dis nous ce qui se passe.
MMmh. Pas �vident de remettre la main sur un 2.2 ici (il me semble que
j'ai toujours �t� en 2.4 depuis 2004 (� moins que Debian 3 soit en 2.2
?).
Et les cdroms deviennent aussi un peu r�tifs : pas moyen d'utiliser le
cd netinstall de Debian 5 : �a boote mais une fois l'installeur charg�,
il ne trouve plus le cdrom pour continuer (test� avec 3 lecteurs
diff�rents). Pour utiliser le nouveau disque, j'ai d� connecter les 2
disques sur un p�c� avec une 2940W des familles et y aller � coup de
fdisk et de cp -a :(
Et pour finir, pas r�ussi � remettre SILO, l'OB ne veut d�marrer qu'avec
l'ancien et je n'ai pas trouv� � m'en sortir avec une incantation boot
/iommu... pour le moment l'ancien disque ne sert qu'� booter sur le
nouveau et quand une fois boot� je force l'installation de SILO il me
dit que c'est ok mais au red�marrage le disque n'est toujours pas
bootable. Bref j'ai du mal.
Merci pour le soutien.
--
S�bastien Kirche
Pas normal. Mais le pilote ESP est particulièrement buggué sur les
derniers 2.4 et un bon paquet de 2.6. Essaye un NetBSD 4.x ou avec
un Solaris 2.9 et SunVTS (dernier Solaris supportant les sun4m avec
_deux_ processeurs, pour les sun4m à plus de deux processeurs, il
faut tomber à la version 2.7).
> Et pour finir, pas réussi à remettre SILO, l'OB ne veut démarrer qu'avec
> l'ancien et je n'ai pas trouvé à m'en sortir avec une incantation boot
> /iommu... pour le moment l'ancien disque ne sert qu'à booter sur le
> nouveau et quand une fois booté je force l'installation de SILO il me
> dit que c'est ok mais au redémarrage le disque n'est toujours pas
> bootable. Bref j'ai du mal.
Sur quoi installes-tu Silo ? Tu peux l'installer sur /dev/sda3
(whole disque), donc la variable OP est disk ou disk3:c par défaut
(ID3) ou sur une partition comme /dev/sda1, mais la variable de l'OP
est disk3:a. Maintenant, mon expérience sur sparc me dit qu'il ne
faut pas que la première partition commence sur le premier cylindre.
Je laisse toujours le premier cylindre vide pour pouvoir coller silo
sur ce cylindre au travers du 'whole disk'. Autre chose : l'OP des
sparc32 limite la position du noyau (Silo appelle des routines de
l'OP) sur le disque et sa taille (encore que pour la taille, ce soit
en train de changer, mais je ne vois pas trop l'intérêt vu que le
2.6 est mauvais). La taille du noyau est de mémoire limité à 2,5 Mo
et la position de mémoire doit être dans les 8 premiers Go (je dis
ça de mémoire, c'est à vérifier, mais après une certaine position,
l'OP ne retrouve plus ses petits). Donc, si tu veux absolument Silo
et un noyau bootable, il te faut quelque chose du genre :
/dev/sda1 -> /boot (commençant sur le _second_ cylindre)
/dev/sda2 -> /usr
/dev/sda3 -> whole disk (où coller Silo)
/dev/sda4 à /dev/sda8 le reste
Avec ça, tu peux coller deux disques de 300 Go en Raid1 sur une
SS20. Ça marche très bien, j'ai un serveur mapserver qui ronronne
sur une SS20 avec cette configuration et quatre RT626 depuis
quelques mois ;-)
> > Et les cdroms deviennent aussi un peu r�tifs : pas moyen d'utiliser
> > le cd netinstall de Debian 5 : �a boote mais une fois l'installeur
> > charg�, il ne trouve plus le cdrom pour continuer (test� avec 3
> > lecteurs diff�rents). Pour utiliser le nouveau disque, j'ai d�
> > connecter les 2 disques sur un p�c� avec une 2940W des familles et y
> > aller � coup de fdisk et de cp -a :(
>
> Pas normal. Mais le pilote ESP est particuli�rement buggu� sur
> les derniers 2.4 et un bon paquet de 2.6. Essaye un NetBSD 4.x
> ou avec un Solaris 2.9 et SunVTS (dernier Solaris supportant
> les sun4m avec _deux_ processeurs, pour les sun4m � plus de
> deux processeurs, il faut tomber � la version 2.7).
Il faudrait que je refasse une installation. Si �a peut tenir sur un
disque de 2 Go, je peux tenter de voir ce que �a donne. Il ne me reste
pas des masses de disques SCA en r�serve et l� j'ai mis le plus gros
(9�Go) pour la r�installation de la Debian.
> > Et pour finir, pas r�ussi � remettre SILO, l'OB ne veut d�marrer
> > qu'avec l'ancien et je n'ai pas trouv� � m'en sortir avec une
> > incantation boot /iommu... pour le moment l'ancien disque ne sert
> > qu'� booter sur le nouveau et quand une fois boot� je force
> > l'installation de SILO il me dit que c'est ok mais au red�marrage le
> > disque n'est toujours pas bootable. Bref j'ai du mal.
>
> Sur quoi installes-tu Silo ? Tu peux l'installer sur /dev/sda3
> (whole disque), donc la variable OP est disk ou disk3:c par
> d�faut (ID3) ou sur une partition comme /dev/sda1, mais la
> variable de l'OP est disk3:a.
�a doit �tre �a l'erreur : je dois v�rifier mais j'ai d� essayer de
l'installer sur la partition de /boot (/dev/sda1) ou de / (/dev/sda2)
> Maintenant, mon exp�rience sur sparc me dit qu'il ne faut pas
> que la premi�re partition commence sur le premier cylindre. Je
> laisse toujours le premier cylindre vide pour pouvoir coller
> silo sur ce cylindre au travers du 'whole disk'.
�a je peux confirmer : il m'a fallu refaire 3 fois le cycle cr�ation du
sun disk label / configuration de la table de partitions / formatage des
filesystems pour comprendre pourquoi le partitionnement disparaissait
apr�s la cr�ation des filesystems : je faisais commencer la partition
/boot sur le cylindre 0, et au formatage le disk label saute. C'est
document� indirectement dans la man page de fdisk o� on indique qu'avec
un disk label sun il ne faut pas cr�er de partition sur le cylindre 0 et
il m'a fallu faire la manip une 3�me fois pour trouver ce passage dans
le man.
> Autre chose : l'OP des sparc32
> limite la position du noyau (Silo appelle des routines de
> l'OP) sur le disque et sa taille (encore que pour la taille,
> ce soit en train de changer, mais je ne vois pas trop
> l'int�r�t vu que le
> 2.6 est mauvais). La taille du noyau est de m�moire limit� � 2,5 Mo
> et la position de m�moire doit �tre dans les 8 premiers Go (je dis
> �a de m�moire, c'est � v�rifier, mais apr�s une certaine position,
> l'OP ne retrouve plus ses petits).
Avec mon disque de 9 Go je ne devrais pas avoir de probl�me, surtout que
la partition /boot qui contient le noyau commence au cylindre 1.
> Donc, si tu veux absolument Silo et un noyau bootable, il te
> faut quelque chose du genre :
>
> /dev/sda1 -> /boot (commen�ant sur le _second_ cylindre)
> /dev/sda2 -> /usr
> /dev/sda3 -> whole disk (o� coller Silo)
> /dev/sda4 � /dev/sda8 le reste
C'est �a sauf que je vais jusqu'� sda8 (ce sch�ma date d'une �poque o�
je m'�tais convaincu qu'il �tait bon de s�parer /usr / boot / home
/var...
Apr�s je m'interroge sur ton "si tu veux absolument Silo" : il existe
autre chose sur Sparc pour d�marrer un linux ?
J'ai bien vu dans la doc de l'OP qu'on pouvait sp�cifier des trucs du
genre boot disk2;2/repertoire/noyau mais je n'ai pas r�ussi � d�marrer
comme cela. L'OP est intelligent, mais je suppose que dans mon cas il ne
sait pas aller voir sur un fs en ext2 ? J'ai aussi pu faire une erreur
dans la syntaxe au prompt de l'OP.
> Avec �a, tu peux coller deux disques de 300 Go en Raid1 sur
> une SS20. �a marche tr�s bien, j'ai un serveur mapserver qui
> ronronne sur une SS20 avec cette configuration et quatre RT626
> depuis quelques mois ;-)
Ouais, une machine de guerre, �a. Je n'irai pas aussi loin, surtout que
je regarde pour remplacer cette machine par une truc plus compact et
surtout plus silencieux. Apr�s tout elle remplit une fonction de serveur
et ce n'est pas vraiment sa vocation initiale.
> Cordialement,
Merci pour tes pr�cieuses informations.
--
S�bastien Kirche
Silo (enfin, le bootloader lui-même, pas ses bibliothèques pour
attaquer du raid ou le fs) se colle sur le début de la partition
physique, pas sur le système de fichier.
>> Maintenant, mon expérience sur sparc me dit qu'il ne faut pas
>> que la première partition commence sur le premier cylindre. Je
>> laisse toujours le premier cylindre vide pour pouvoir coller
>> silo sur ce cylindre au travers du 'whole disk'.
>
> Ça je peux confirmer : il m'a fallu refaire 3 fois le cycle création du
> sun disk label / configuration de la table de partitions / formatage des
> filesystems pour comprendre pourquoi le partitionnement disparaissait
> après la création des filesystems : je faisais commencer la partition
> /boot sur le cylindre 0, et au formatage le disk label saute. C'est
> documenté indirectement dans la man page de fdisk où on indique qu'avec
> un disk label sun il ne faut pas créer de partition sur le cylindre 0 et
> il m'a fallu faire la manip une 3ème fois pour trouver ce passage dans
> le man.
C'est frustrant, non ? ;-)
>> Autre chose : l'OP des sparc32
>> limite la position du noyau (Silo appelle des routines de
>> l'OP) sur le disque et sa taille (encore que pour la taille,
>> ce soit en train de changer, mais je ne vois pas trop
>> l'intérêt vu que le
>> 2.6 est mauvais). La taille du noyau est de mémoire limité à 2,5 Mo
>> et la position de mémoire doit être dans les 8 premiers Go (je dis
>> ça de mémoire, c'est à vérifier, mais après une certaine position,
>> l'OP ne retrouve plus ses petits).
>
> Avec mon disque de 9 Go je ne devrais pas avoir de problème, surtout que
> la partition /boot qui contient le noyau commence au cylindre 1.
Si, tu peux avoir un problème. Ces machines étaient vendues à
l'époque avec un disque de 2 Go au maximum et le boot loader de
Solaris, même 2.9, ne vérifie pas. J'ai refait je ne sais combien de
ofis une installation de Solaris 9 sur une SS20 munie de deux SM71
avant de comprendre d'où venait le problème (le disque de boot avait
73 Go).
>> Donc, si tu veux absolument Silo et un noyau bootable, il te
>> faut quelque chose du genre :
>>
>> /dev/sda1 -> /boot (commençant sur le _second_ cylindre)
>> /dev/sda2 -> /usr
>> /dev/sda3 -> whole disk (où coller Silo)
>> /dev/sda4 à /dev/sda8 le reste
>
> C'est ça sauf que je vais jusqu'à sda8 (ce schéma date d'une époque où
> je m'étais convaincu qu'il était bon de séparer /usr / boot / home
> /var...
> Après je m'interroge sur ton "si tu veux absolument Silo" : il existe
> autre chose sur Sparc pour démarrer un linux ?
Il y a des trucs plus 'ésotériques'. Ma remarque était le fait
d'utiliser un noyau bootable et silo en même temps ;-)
> J'ai bien vu dans la doc de l'OP qu'on pouvait spécifier des trucs du
> genre boot disk2;2/repertoire/noyau mais je n'ai pas réussi à démarrer
> comme cela. L'OP est intelligent, mais je suppose que dans mon cas il ne
> sait pas aller voir sur un fs en ext2 ? J'ai aussi pu faire une erreur
> dans la syntaxe au prompt de l'OP.
C'est une erreur de syntaxe. L'OP est capable d'aller récupérer un
truc en fonction de sa position physique sur le disque (c'est ce que
fait le premier étage de Silo en gros).
>> Avec ça, tu peux coller deux disques de 300 Go en Raid1 sur
>> une SS20. Ça marche très bien, j'ai un serveur mapserver qui
>> ronronne sur une SS20 avec cette configuration et quatre RT626
>> depuis quelques mois ;-)
>
> Ouais, une machine de guerre, ça. Je n'irai pas aussi loin, surtout que
> je regarde pour remplacer cette machine par une truc plus compact et
> surtout plus silencieux. Après tout elle remplit une fonction de serveur
> et ce n'est pas vraiment sa vocation initiale.
La SS20 en question est parfaitement silencieuse. J'ai remplacé les
ventilo de l'alimentation par des modèles sur billes et les disques
Fujitsu de 300 Go sont parfaitement silencieux.
>> Cordialement,
>
> Merci pour tes précieuses informations.
Je t'en prie,