Formation BigData – Hadoop – module Développeur

Bonjour,

Le BigData n’est plus réservé aux géants du Web, c’est maintenant l’affaire de tous.
On estime que 80% des données d’une entreprise sont non-structurées et inexploitées… et le volume augmente de plus en plus rapidement. De plus, les infrastructures modernes nous permettent de conserver de plus en plus de données à moindre coût : rien n’est à jeter, tout peut être utile.

FastConnect a le plaisir de vous présenter sa nouvelle formation BigData Hadoop orientée Développeurs.
Ce module de 3 jours, alternant cours théoriques et pratiques, vous offre une introduction sur les enjeux du BigData, ainsi qu’une mise en pratique avec la technologie Hadoop. (télécharger le programme de la formation)

L’objectif de cette formation est de démystifier Hadoop, savoir utiliser les outils principaux autour de son écosystème et traiter les données de diverses manières, dont le Machine Learning, afin de présenter les résultats de manière graphique.
Une prise en charge par votre OPCA est possible (numéro d’agrément 11921636592).

La prochaine session aura lieu du 17 au 19 septembre dans notre centre de formation d’Issy les Moulineaux, au prix réduit de 1 700€ HT par participant au lieu de 1 900€.

Les places sont limitées, si cette formation vous intéresse, n’hésitez pas à nous contacter.

Cordialement,

L’équipe FastConnect Training
+33 (0)1 45 07 81 65
training@fastconnect.fr

Morning with MongoDB et MUG

Le 7 Novembre 2012 se sont déroulés 2 événements: le « Morning with MongoDB » et le « MongoDB User Group (Paris)« .

Morning with MongoDB

Vous pouvez retrouver les slides des présentations sur le site de 10gen.
Pour plus d’information sur l’événement, regardez ici.
L’agenda de cette matiné été le suivant:

  • Présentations de 10gen (MongoDB et BigData)
  • Présentations de cas d’utilisations des clients
  • Présentations de cas d’utilisations des partenaires (dont FastConnect!)

Je ne vais pas vous détailler toutes les présentations, mais juste quelques remarques qui me semble interessantes.

10gen ont parlé de la Roadmap, et on note les prochaines fonctionnalités pour la 2.4:

  • Intégration de Kerberos et LDAP/AD
  • Hash comme clé de répartition pour le Sharding
  • Moteur V8 pour le MapReduce
  • Recherche par intersection de polygones pour la recherche GeoSpatial
  • Amélioration du framework d’aggregation

Criteo et le Figaro on un usage commun: stocker des données de sources hétérogènes dans MongoDB grâce à la flexibilité du schéma. Pour Criteo, ils peuvent stocker dans une seule même base les catalogues de produits de plusieurs vendeurs, et pour le Figaro, ils peuvent stocker les données des différents sites web au même endroit.

Je remarque aussi un retour d’expérience qui revient fréquemment: grâce à des performances bien supérieurs aux RDBMS (dans leurs cas d’usages), MongoDB supprime la nécessité d’un cache, et la complexité qui va avec (gestion de l’eviction, mise-à-jour, etc.)

MongoDB s’avère être aussi efficace pour stocker les logs: en effet, les « Capped Collections » sont très utiles pour cet usage, et on peut choisir un niveau de « Write Concern » différent en fonction de l’importance du log (DEBUG, WARN, etc.)

Enfin, MongoDB et sa simplicité à mettre en place la réplication, sert à fournir des données à travers le monde (WAN).

Je vous laisse consulter les présentations ici, ainsi que ma présentation sur un cas d’usage MongoDB avec Hadoop:

MongoDB User Group

Ce MUG était orienté Cloud:

Nous avons eu une première présentation de la plateforme Cloud Scalr, et comment déployer et monitorer MongoDB dessus.

S’est suivie une présentation sur un retour d’expérience avec MongoDB sur le Cloud (Azure) par Pierre Couzy (Microsoft) et Yann Shwartz.
Cette session était très intéressante, car on découvre les pièges à éviter et les problèmes que l’on peut rencontrer dans des situations réelles.
J’ai beaucoup aimé cette présentation car elle recoupe beaucoup avec notre retour d’expérience avec MongoDB sur le Cloud. C’est pourquoi nous essayons de mettre en place ces bonnes pratiques sous la forme de scripts Cloudify!

Pour terminer, nous avons eu le plaisir d’accueillir Matt Bates qui nous a présenté le nouveau framework d’aggregation de la version 2.2 de MongoDB, ainsi que les futures évolutions.

Je remercie au passage les organisateurs du MUG, les hébergeurs et les différents speaker.

En conclusion, c’était une journée riche et interessante !