Buen dia

16 views
Skip to first unread message

Mr Durden

unread,
Nov 8, 2017, 10:19:42 AM11/8/17
to LinuxCabal
Buen día a todos,

Tengo un proyecto en puerto que implica clusters. Clusters HPCC para ser precisos, ya tengo casi terminado el proyecto, pero debido a la escaza información que hay llegue a un punto donde no encuentro mas información que me pueda ayudar a terminarlo.

Richard me recomendó abrir un hilo nuevo y hacer la invitación a todos a unirse a un taller para entre todos colaborar.

Que les parece la idea?

Renich Bon Ciric

unread,
Nov 8, 2017, 11:50:28 AM11/8/17
to linux...@googlegroups.com
2017-11-08 9:19 GMT-06:00 Mr Durden <ddqqro...@gmail.com>:
> Que les parece la idea?

Está chido, pero estaría mejor si publicaras detalles:

* hardware y arquitectura
* recursos
* software que usas
* problemas actuales

O algo así. Es mejor, todavía, si usas la http://wiki.cabal.mx/ para
ir delineando qué es, qué hay y qué falta.

Mr Durden

unread,
Nov 8, 2017, 12:47:44 PM11/8/17
to LinuxCabal
Que tal.

Como te comentaba, es un proyecto solamente en este momento; que mas adelante sera puesto en produccion.

Al momento cuento con servidores dell poweredge 2450 cada uno tiene:

 2 procesadores Xeon a 3 GHz 
16 GB de RAM
2 tarjetas de red
fuente redundante.

De estos tengo 3.

Y estaciones de trabajo HP no recuerdo el modelo pentium dualcore con 8gb de ram de estas tengo 5.


Estoy casado con DEBIAN desde que lo conoci hace mas de 10 anos, entonces esta montado en Debian, solo el nodo maestro esta sobre Mint.

estoy utilizando munge para autenticacion entre los nodos, y mariabd para los  trabajos etc etc y Bind9 como DNS para resolver local.

Y por ultimo SLURM como planificador de tareas.

el problema principal, es que no logro que las estaciones de trabajo se unan a los trabajos del cluster,  las veo IDLE en el cluster y puedo acceder a ellas, recibo paquetes ICMP sin problema alguno, simplemente si agrego una tarea al cluster, el master es el unico que trabaja, las demas no.


Renich Bon Ciric

unread,
Nov 8, 2017, 2:45:51 PM11/8/17
to linux...@googlegroups.com
Bueno, pues parece ser que la documentación de SLURM está bastante bien: https://slurm.schedmd.com/documentation.html

Además, una búsqueda rápida me dió ésto: https://en.wikipedia.org/wiki/Comparison_of_cluster_software

Tienes un montón de alternativas. Apache Mesos ha estado en boga últimamente. Además, ponen a Kubernetes en esta categoría. 

En todo caso, parece que tienes muchas alternativas modernas, aparte de SLURM.

Está bien cabrón debuggear sin ver configuración o algo por el estilo. Pero, puedes checar a ver si tienes abiertos los puertos del firewall en tus máquinas, a ver si es eso.

Debe haber una prueba sencilla que puedas repetir al hacer cambios.
Reply all
Reply to author
Forward
0 new messages