Paris Spark meetup le lundi 7 décembre chez AXA : les inscriptions viennent d'ouvrir, dépêchez-vous!

10 views
Skip to first unread message

Cedric Carbone

unread,
Dec 1, 2015, 5:56:08 AM12/1/15
to hadoop-user-...@googlegroups.com

Inscription sur http://www.meetup.com/Paris-Spark-Meetup/events/226967800/

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le lundi 07 décembre 2015 chez AXA (25 avenue Matignon 75008 Paris) à 18h30. 

*** Attention, il est indispensable de renseigner votre Nom Prenom et email pour valider votre inscription sur http://www.meetup.com/Paris-Spark-Meetup/events/226967800/ ! De plus, merci de ne pas utiliser de caractères accentuées pour votre nom et prénom, merci. ***

Les inscriptions pour ce meetup seront ouvertes à partir de mardi 1er décembre.

Un agenda chargé et intéressant vous attend pour ce meetup:

• 6h30-6h45 Welcome

• 6h45-7:15 : Record Linkage, un cas d’utilisation en Spark ML par Alexis Seigneurin

Le Record Linkage est le process qui consiste à trouver, dans un data set, les enregistrements qui représentent la même entité. Cette opération est particulièrement compliquée quand, comme nous, vous travaillez avec des données anonymisées. C’est là que le Machine Learning vient en renfort ! Nous avons implémenté un algorithme de Record Linkage en Spark SQL (DataFrames) et Spark ML plutôt que d’utiliser des règles statiques. Nous verrons le process de Feature Engineering, pourquoi nous avons dû étendre Spark DataFrames pour préserver des méta-données au travers du pipeline de traitement, et comment nous avons utilisé le Machine Learning pour réconcilier les enregistrements. Nous verrons enfin comment nous avons industrialisé cette application. 

Alexis Seigneurin : Développeur depuis 15 ans, j'attache beaucoup d'importance aux problématiques de traitement, d'analyse et de stockage de la donnée.Chez Ippon, j'interviens principalement sur des missions de conseil et d'architecture autour de technologies big data. Par ailleurs, j'anime la formation Spark chez Ippon.

• 7h15-7h45 : Datalab 101 (Hadoop, Spark, ElasticSearch) par Jonathan Winandy

Retour d'expérience sur la mise en place d'un Datalab avec Hadoop, Spark et ElasticSearch dans un environnement contraint. Nous allons exposer les méthodes qui nous ont permis d'améliorer la conception, le développement, les performances et la recette d'une application complexe en Spark. 

Jonathan Winandy est MOE, développeur Java/Scala spécialisé dans les pipelines de données. 

• 7h45-8h15 : Apache Zeppelin, un notebook d'avenir pour l'éco-système par DuyHai Doan 

Spark et Cassandra sont des projets très populaires, mais avez vous entendu parler d'Apache Zeppelin ? Zeppelin propose un système de notebook pour pouvoir manipuler les données de manière interactive. Zeppelin repose sur un système de plugins qui permet de traiter des tâches Spark, des requêtes Spark SQL mais aussi des requêtes CQL de Cassandra. Je montrerai comment construire un pipeline de transformation BigData en mélangeant du Spark, du Cassandra, du Shell, du Markdown, du ce-que-vous-voulez etc. 

Duy Hai est évangéliste technique pour Datastax, l’entreprise commerciale derrière Apache Cassandra. Il partage son temps entre donner des présentations/meetups/talks sur Cassandra, développer sur des projets open-source pour la communauté et aider les projets utilisant Cassandra. Avant Datastax, Duy Hai a été développeur freelance Java/Cassandra. 


• 8:15-8:45 : Démarrer rapidement avec Apache Flink par Bilal Baltagi

- Présentation de l'éco Système Apache Flink

- Prise en main rapide 



Bilal Baltagi a obtenu un master en analyse des données à l'Université Paris Nord - Paris 13. Il est actuellement consultant décisionnel chez Sarenza à Paris. Il intervient sur toutes les phases d'un projet décisionnel et Big data: recueil des besoins, conceptions, réalisations et accompagnement des utilisateurs. Bilal est de plus en plus intéressé à l'intersection de la Big Data avec la Business Intelligence et aime jouer avec Apache Flink! 

• 8:45-10:30 : networking

Merci de vous enregistrer (http://www.meetup.com/Paris-Spark-Meetup/events/226967800/ afin que l’on puisse s’assurer du bon déroulement logistique. 

Un grand merci à AXA pour nous prêter leur salle et s'occuper de l'apéritif dinatoire. 

L'équipe HUG France  
http://hugfrance.fr  
@hugfrance

______________________

Cédric CARBONE

Strategic Advisor

www.nanocloud.com


Nanocloud
Turn any software into a cloud solution
Reply all
Reply to author
Forward
0 new messages