Spark y oferta de empleo

28 views

Skip to first unread message

Iván de Praadoo

unread,

May 13, 2013, 7:52:55 AM5/13/13

to spain-scala...@googlegroups.com

Buenas,

Spark

El otro día estuve leyendo un paper sobre Spark (http://www.cs.berkeley.edu/~matei/papers/2011/tr_spark.pdf) bastante interesante. Por compartir aquí lo que puede sacar en claro del mismo:

1) Spark es una generalización de MapReduce que va más allá

2) Hace uno intensivo de la memoria, pero no es un sistema de procesado exclusivamente en memoria. De hecho, si el dataset no cabe en memoria, se usa disco sin problemas.

3) Al menos para el input y el output, se hace uso del HDFS. Las partes intermedias se procesan usando Spark.

4) Lo bueno, es que los datos en ciertos casos se pueden cachear en memoria, y no se envían por red si no es necesario. Esto es muy bueno para algoritmos iterativos. Especialmente para algoritmos de grafos. Implementar un Pregel con Spark es trivial.

5) Sin embargo, hay muchos otros algoritmos en los que la representación de los datos ha de cambiar entre fase y fase (primero agrupados de una manara, luego de otra, etc) en las que no aporta mucho tener los datos en memoria... al final habrá fase de suffle muy potente a lo MapReduce.

6) Programado con Scala.

7) Es batch oriented, como Hadoop.

En conclusión, es algo bastante interesante sobre todo para algoritmos de Grafos, donde se produce una aceleración muy importante, pero no lo veo algo tan diferente como para merecer la pena desde el punto de vista generalista, a no ser que sea en casos muy concretos. Más aún con la tendencia en Hadoop de virar hacia Tez (http://wiki.apache.org/incubator/TezProposal). ¿Qué opináis? ¿Habéis usado Spark? ¿Para qué casos?

Oferta Big Data

Por otro lado, me gustaría comentaros que ha llegado a mis oidos la posibilidad de una oferta de trabajo en una gran multinacional en Madrid en el terreno del Big Data. Me parece una oferta muy interesante. Si alguien está interesado, que se ponga en contacto privadamente conmigo.

Un saludo!

Iván

Angel Java Lopez

unread,

May 13, 2013, 8:49:45 AM5/13/13

to spain-scala...@googlegroups.com

Hola gente!

Ivan, gracias por compartir... hmmm... interesante!

Bien algo mas para leer.

Tengo que entrenarme en Big Data, veremos que surge

Nos leemos!

Angel "Java" Lopez

@ajlopez

2013/5/13 Iván de Praadoo <ivan....@gmail.com>

--
Has recibido este mensaje porque estás suscrito al grupo "spain-scalability-users" de Grupos de Google.
Para anular la suscripción a este grupo y dejar de recibir sus correos electrónicos, envía un correo electrónico a spain-scalability...@googlegroups.com.
Para obtener más opciones, visita https://groups.google.com/groups/opt_out.

Reply all

Reply to author

Forward

0 new messages