Big data - L’analyse de données avec Pig
Le paradigme MapReduce est fondamentalement adapté pour paralléliser des traitements sur un volume important de données, ce qui a valut à Hadoop le succès que l’on sait. Mais il atteint ses limites dès qu’il s’agit d’implémenter des traitements plus complexes que le simple comptage de mots dans un corpus de textes, fussent-ils volumineux.
L’écriture de fonctions […]
Big data, le nouvel horizon des Systèmes d’Information
La dernière édition de la désormais très célèbre courbe des tendances technologiques, publiée en Août 2012 par le cabinet Gartner, assoit solidement le mouvement Big data dans le paysage informatique pour la décennie à venir.
Comme souvent, l’industrie informatique attribue aux avis de la société Gartner une grande valeur prédictive. Sans vouloir remettre en cause une […]
Hadoop, une introduction - 3/3
Dans ce troisième et dernier volet de la série, nous dresserons un panorama de l’écosystème Hadoop. La lecture des deux premiers billets est un préalable utile.
Avant d’entrer dans le vif du sujet, répondons à la question suivante : dans quels cas ne pas utiliser Hadoop ?
Hadoop n’est fondamentalement pas prévu pour traiter en temps réel […]