Meetup ElasticSearch

Viadeo Talks

Thursday, May 23rd 2013 at 7:30-9:30pm

30 Rue de la Victoire

Paris, IdF

Agenda

  • Collecte et analyse de logs chez Viadeo (15 mn)


L'infrastructure de Viadeo génère beaucoup d’événements qui sont collectés et centralisés dans une instance HBase pour un stockage durable. Mais HBase reste difficile à requêter pour nos analystes, sysops et développeurs.


L'indexation dans Elasticsearch simplifie cette exploration par des points de vue différents.


L'exposition avec Kibana3 la rend agréable et efficace, et permet de tester des hypothèses très rapidement sur des données fraîches.

Par David Stendardi et Damien Hardy


  • Maptimize : the one million tweet map (15 mn)


Le site "one million tweet map" est la nouvelle démo du service Maptimize, un service de clustering pour carte en ligne disponible en SaaS ou en serveurs dédiés.

L'idée de Maptimize est partie d'un besoin personnel il y a quelques années, avant même l'existence d'une ligne de code d'elasticsearch sur github (avant même l'existence de github !)
Pendant plusieurs années, l'algorithme a été amélioré, réécrit plusieurs fois dans différentes technologies pour être maintenant basé sur elasticsearch.

Je ferai un rapide historique du projet et j'expliquerai en quoi elasticsearch nous a permis d'aller beaucoup plus loin.

Par Sébastien Gruhier


  • Indexer la terre entière : un projet fou ? Plus aujourd'hui ! (15 mn)


La base de données cartographique libre OpenStreetMap est une véritable mine d'or d'information : elle référence plus de 2 milliardsd'objets géographiques agrémentés d'une flopée de metadonnées, l'ensemble étant maintenu par une armée de contributeurs.


Aujourd'hui, vous trouverez facilement des librairies permettant d'afficher des fonds de carte, des outils pour les styliser à votre gré, ou encore des APIs de geocoding afin de retrouver un emplacement. Mais qu'en est-il lorsqu'il s'agit d'exploiter soi-même les données sources d'OpenStreetMap ?


Les problèmes commencent : un système de stockage datant de l'ère pré-NoSQL, une surcouche nécessitant un doctorat en géomatique et des volumes de données qui imposent au moins 15 années d'expérience sur SGBDR. Parfait pour des géomaticiens, mais clairement excessif pour nos usages.


C'est là qu'entre en scène Elasticsearch, son indexation géographique et ses APIs de geosearch...

Par Nicolas Colomer


  • BlaBlaCar: ElasticSearch Feedback (30 mn)


De mysql à Elasticsearch: toutes les étapes de la migration du célébre site de covoiturage, les difficultés rencontrés et les solutions apportées.

Par Nicolas Blanc

Pour s'inscrire