esto es una GRAN idea.
On 04/04/2013 18:14, Pere Ferrera wrote:
> Interesante art�culo y librer�a open-source para Cascading:
> otro peque�o, proponen construir un Bloom Filter usando el dataset
> peque�o. Luego este Bloom Filter se carga en memoria en los Mappers y
> permite filtrar el dataset grande. Por las propiedades del Bloom
> Filter, los elementos que se descarten seguro que no tendr�n elemento
> correspondiente en el dataset peque�o, aunque puede haber falsos
> positivos, en cuyo caso se filtra normalmente en el Reducer. De este
> modo se puede implementar un inner join de manera mucho m�s eficiente
> ya que muchos datos son filtrados antes de la fase del shuffle, que es
> la m�s costosa en MapReduce.
>
> Saludo,
> --
> Has recibido este mensaje porque est�s suscrito al grupo
> "spain-scalability-users" de Grupos de Google.
> Para anular la suscripci�n a este grupo y dejar de recibir sus correos
> electr�nicos, env�a un correo electr�nico a
>
spain-scalability...@googlegroups.com.
> Para obtener m�s opciones, visita
>
https://groups.google.com/groups/opt_out.
>
>