Différences

Cette page vous donne les différences entre la révision choisie et la version actuelle de la page.

Lien vers cette vue

public:seminaires:seminaire-2013-03-27-save [2013/10/29 13:35] (Version actuelle)
aristote créée
Ligne 1: Ligne 1:
 +~~NOTOC~~  ~~ODT~~
 +
 +====== A la poursuite des Big data ======
 +
 +
 +**Séminaire Aristote, Amphithéatre Becquerel, Ecole Polytechnique, Palaiseau.**
 +
 +**Mercredi 27 mars 2013.**
 +
 +[[http://www.association-aristote.fr/Fichiers-2013/2013-03-compte-rendu.pdf|Compte-rendu du séminaire]]  [[http://www.association-aristote.fr/Fichiers-2013/2013-03-actes.pdf|Actes complets]]  
 +
 +/*
 +
 +**[[:public:seminaires:inscription|Inscription]]** 
 +
 +*/
 +
 +Coordination scientifique: Jean-Michel Batto, Pierre Léonard (INRA)
 +
 +
 +====== Introduction ======
 + 
 +Presque deux ans après [[:public:seminaires:seminaire-2011-06-09|un premier séminaire précurseur]]   sur les big data, le paysage s’est transformé. Aristote a voulu ainsi poser une autre pierre sur l’analyse du phénomène,  de ses dérivés, de ses succès. Ce séminaire aura une connotation plus technique. Entre Hadoop qui vient immédiatement à l’esprit, les questions de stockages qui connaissent quelques révolutions --disques remplis à l’hélium pour limiter la consommation électrique et la production de chaleur, et d’autres qui vous serons dévoilées par les constructeurs-- il reste encore beaucoup de sujet à traiter sur la façon de gérer ces données sur un campus et parfois aussi entre sites. C’est alors qu’apparaît une question majeure: //quid// du transport ?
 +
 +====== Programme et présentations ======
 +
 +**Matinée**
 +
 +  * 09h00 Accueil, café
 +  * 09h25 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/00-J-M-Batto-P-Leonard.pdf|Présentation du séminaire]], Jean-Michel Batto et Pierre Léonard (INRA)
 +  * 09h30 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/01-Vincent-Heuschling.pdf|L’écosystème d’''hadoop'' et de ses concurrents]], Vincent Heuschling (Affini-tech)
 +  * 10h10 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/02-Patrick-Demichel.pdf|Evolutions technologiques pour le big data]],Patrick Demichel (HP)
 +  * 11h00 // pause//
 +  * 11h20 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/03-Guy-Chesnot.pdf|''In memory'']], Guy Chesnot (SGI France)
 +  * 11h50 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/04-Patrick-Fuhrmann.pdf|''Dcache'' un système de gestion de données réparties]], Patrick Fuhrmann (Desy)
 +  * 12h30 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/05-Jeremie-Bourdoncle.pdf|Un système de stockage capacitif green et accessible]], Jérémie Bourdoncle (NoRack)
 +  * 13h 00 //Déjeuner//
 +
 +**Après-midi**
 +
 +  * 14h00 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/06-B-Legras-C-Baroux.pdf|BigQuery, le BigData par Google]], Bastien Legras (Google)
 +  * 14h30 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/07-Patrick-Marques.pdf|Un cas concret chez nos clients: ''Hadoop'']], Patrick Marques (HP)
 +  * 15h00 // pause//
 +  * 15h30 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/08-Peter-Livaudais.pdf|''Parstream'', une base de données qui révolutionne la recherche en masse]], Peter Livaudais (Parstream)
 +  * 16h00 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/09-Sebastien-Noury.pdf|''Palantir Gotham'', une plate-forme d'analyse issue de la Silicon Valley]], Sébastien Noury (Palantir)
 +  * 16h30 [[http://www.association-aristote.fr/Fichiers-2013/27-mars/10-Philippe-Martin.pdf|Peut-on faire passer des big data avec un modem 56 kbs]], Philippe Martin (Dell)
 +  * 17h00 Discussion avec les orateurs, fin du séminaire
 +
 +
 +
 +====== Photos de la journée  ======
 +
 +<html><div style="text-align: center;"></html>
 +
 +{{public:seminaires:02-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:04-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:05-27-mars-2013.jpg?200|Séminaire 27/03/2013}}
 +
 +
 +{{public:seminaires:07-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:09-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:11-27-mars-2013.jpg?200|Séminaire 27/03/2013}}
 +
 +{{public:seminaires:13-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:15-27-mars-2013.jpg?200|Séminaire 27/03/2013}}{{public:seminaires:16-27-mars-2013.jpg?200|Séminaire 27/03/2013}}
 +
 +<html><font font size="-2"></html>Séminaire du 7 février 2013<html></font></html>
 +<html></div></html>
 +
 +====== Intervenants et résumés des présentations ======
 +
 +^ Vincent Heuschling (Affini-tech) | L’écosystème d’hadoop et de ses concurrents | 
 +
 +L'écosystème hadoop & NOSQL et ses ramifications, avec la mutation vers l'analytique temps réel qui apparaît actuellement (Apache Drill, Google Dremel, etc.). 
 +
 +Des retours d'expérience, des cas issus de "la vraie vie". On commence à voir des choses intéressantes depuis quelques mois, et dans tous les secteurs d'activités...
 +
 +
 +^ Patrick Demichel (HP) | Evolutions technologiques pour le big data | 
 +
 +  * pourquoi un grand nombre de data, impact sur les architectures;
 +  * tour de piste des technologies //disruptives//;
 +  * focus sur les mémoires non volatiles de grosse capacité;
 +  * focus sur les communications photoniques.
 +
 +
 +^ Guy Chesnot (SGI France) | In memory |  
 +
 +Le terme "Big Data" couvre à la fois un aspect quantité – de volumétrie, de vitesse d’arrivée des données et de multiplicité des types de données numériques – et un aspect algorithmique: comment retirer des informations de valeur de cette masse de données ?
 +Cette présentation se concentre sur l’aspect analyse en différenciant deux classes de méthodes selon les questions posées et les sources de données. On aboutit ainsi à une dichotomie entre traitements distribués et traitements "//In-memory//", distinction illustrée par des exemples industriels ou de recherche.
 +
 +
 +^ Patrick Fuhrmann (Desy) | Dcache un système de gestion de données réparties |  
 +
 +Démarré il y a quelques années au centre du Desy à Hamburg, Dcache  s’est voulu être un système réparti de dépôts de données, de gestion de réplication et de gestion de hiérarchie. Dcache est le résultat d’une collaboration entre le DESY, FERMiLab et le NelC des pays nordiques, dans le cadre d’une initiative Européenne: EMI.
 +Il a ensuite été choisi par le LHC du CERN, lui apportant ainsi la reconnaissance de sa maturité. Principalement utilisé en Europe du nord Dcache étend sa zone d’influence marqué notamment par un workshop le 17 Mars à Tapei.
 +Patrick Fuhrman présentera les spécifités techniques qui font le succès de dcache.
 +
 +^ Jérémie Bourdoncle (NoRack) | Un système de stockage capacitif //green// et accessible |  
 +
 +PDG de NO-Rack.
 +Un segment du Big Data est encore trop peu exploré, celui du stockage des informations. Aujourd'hui, stocker des pétaoctects de données engendrent des coûts relativement importants.
 +Pour résoudre cette problématique, No Rack propose une innovation combinant stockage massif, basse consommation et free cooling.
 +
 +
 +^ Bastien Legras (Google) | BigQuery, le BigData par Google| 
 +
 +Ingénieur solution responsable de l'offre Cloud Platform pour l'Europe du Sud pour la division Google Enterprise. Avec une expérience de 5 ans dans le cloud computing (8 ans en IT), Bastien Legras est en charge d'accompagner les entreprises dans la construction de solutions Cloud.
 +Google est une société incontournable dans les développements en tant que Platform As A Service (PaaS). Par son expérience dans le moteur de recherche et la continuité de service qui y est associée, le traitement du Big Data a été centrale dans le développement de Google.
 +Des offres de plateformes autour de BigQuery et de Hadoop sont proposées par Google. A travers une illustration concrète, Google va présenter ses technologies et démontrer en quoi l'offre de service SAS de Google est pertinente dans le marché du BigData.
 +
 +^ Patrick Marques (HP) | Un cas concret chez nos clients: Hadoop | 
 +
 +  * Structure hadoop (comment ça fonctionne);
 +  * Caractérisation des //workloads//; 
 +  * //Sysing///architecture type;
 +  * Matériel : SL4500 – Moonshot.
 +
 +
 +^ Peter Livaudais (Parstream) | Parstream, une base de données qui révolutionne la recherche en masse |  
 +
 +Directeur technique.
 +L’allemand Parstream positionne son produit sur sa capacité de recherche rapide, sans comparaison à ce jour. Ce n’est pas du NoSql, ni du SQL complet mais les fonctionnalités évoluent pour en faire un des piliers du big data.
 +
 +^ Sébastien Noury (Palantir) | Palantir Gotham : une plateforme d'analyse issue de la Silicon Valley. |  
 +
 +Palantir aide les gouvernements et organisations commerciales à résoudre leurs problèmes d'analyse les plus complexes. Sa plateforme Palantir Gotham est employée par des centaines d'organisations à travers le monde, dans des domaines tels que le renseignement, la prévention de fraude, la défense ou encore la réponse aux catastrophes naturelles. Palantir Gotham est un point d'entrée unique et transparent vers de multiples sources de données structurées, non structurées, temporelles ou géospatiales, qu'elles proviennent de flux temps réel, discontinus ou en quantité massive. 
 +Seb Noury, ingénieur déployé, présentera au travers d'un exemple concret comment Palantir Gotham permet aux analystes d'explorer ces données en temps réel, de découvrir et de consolider leurs connexions, ainsi que de collaborer de façon sécurisée. Résolument orientée "Big Data", cette présentation se focalisera sur les capacités d'analyse offertes par l'exploration de données massives en temps réel. 
 +
 +^ Philippe Martin (Dell) | Peut-on faire passer des big data avec un modem 56kbs | 
 +
 + Philipe Martin est specialiste des ventes réseau.
 +« Big data » : le terme n’est pas immédiatement synonyme de réseau et ne focalise pas sur la capacité de traitement de ce dernier. Il convient néanmoins de constater que de grosses infrastructures de calcul/traitement nécessitent une solution appropriée en termes de réseaux. Les besoins de débits, de latence, de performances de manière générale et de sécurisation d’architecture  diffèrent en fonction des projets.
 +
 +Dell est un acteur majeur de l’infrastructure, et compte toujours plus de clients pour ses solutions de mise en réseau ultra-performantes et sécurisées qui vous seront présentées ici, notamment à l’aide de réalisations d’architectures. Alors peut-on utiliser un modem 56kbits pour son projet Big Data ?
 +
 +
  
public/seminaires/seminaire-2013-03-27-save.txt · Dernière modification: 2013/10/29 13:35 par aristote
CC Attribution-Noncommercial-Share Alike 3.0 Unported
www.chimeric.de Creative Commons License Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0