Pourquoi le big data open source ?

Post on 05-Dec-2014

701 views 1 download

description

 

Transcript of Pourquoi le big data open source ?

Le GTLL face au défidu déluge des données

Stefane Fermigier, Data Tuesday, fév. 2013

There is a tsunami of data that is crashing onto the beaches of the civilized world. This is a tidal wave of unrelated, growing data formed in bits

and bytes, coming in an unorganized, uncontrolled, incoherent cacophony of foam. It's filled with flotsam and jetsam. It's filled with the sticks and bones and shells of inanimate and

animate life. None of it is easily related, none of it comes with any organizational methodology.

Richard Saul Wurman, in “Information Architects” (1996)

Pourquoi le big dataopen source ?

Facteurs économiques

Source: Michael Driscoll

Facteur technique

Pourquoi le big dataopen source ?

• Expertise historique en scalabilité horizontale (cf. Beowulf, Google, etc.)

• Majors de l’internet (cf. Google, Yahoo!, Facebook, Twitter) imprégnés de culture open source, et dont le business model tourne autour de l’accumulation des données

• Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation

Mission du GT

“Développer l’écosystème du Libreen Ile-de-France”

65 PME/ETI

17 Grands Groupes

28 Etablissementsde Recherche et Formation

Distributed / Cloud Embedded

Roadmap technologique

Distributed / Cloud Embedded

Dev. Tools Middleware Big / Open Data

Roadmap technologique

Web 2.0 / 3.0 Enterprise Apps

Distributed / Cloud Embedded

Dev. Tools Middleware Big / Open Data

Roadmap technologique

Projets: 33Effort: 140 M€Aide: 52 M€

R&D collaborative depuis 5 ans

3 “grands défis”

• Qualité logicielle

• “After PC”

• Déluge des données

Focus sur le Big Data

Stockage (NoSQL, NewSQL)

Traitement (MapReduce, etc.)

Indexation

Collecte & injection

Infra & sys. management

Data Viz

Plus d’infos

Livre blanc disponiblesur www.fermigier.com

Site Web:www.gt-logiciel-libre.org