Chronique

Le pêcheur et la mer de données

Que fait concrètement un «Data Scientist»? Et devrions-nous en avoir peur?

Christoph Hugenschmidt

Lorsque, pour la première fois, j’ai entendu parler du «Big Data», j’ai pensé: «Bof». Et en un éclair, le «Big Data» a disparu de mon cerveau encombré de mots-clés. Vous souvenez-vous encore de «Web 2.0»? Ou de «Second Life»? C’est bien ça.

 

Mais le «Big Data» est toujours là et ne cesse de se développer. Le terme est passé d’un mot-clé issu de cerveaux du marketing à une description d’un changement de paradigme. Le «Big Data» a changé nos vies et le fera encore davantage, car il s’agit de la manière dont des individus, des machines, des entreprises et des Etats trouvent des choses, répondent à des questions, constatent des frais, élaborent des prévisions, établissent des connaissances et pilotent quelque chose – par exemple un chauffage de maison individuelle ou des flottes de baleiniers.

 

Imaginez que vous êtes un fabriquant de chaussettes: pour savoir quelles couleurs devraient arborer au printemps prochain vos chaussettes pour le marché du Benelux, vous demandiez jusqu’ici au service IT de collecter puis d’analyser des données sur les ventes de chaussettes, les coloris, la saison et la région. Avant d’avoir la réponse, vous vous posiez déjà d’autres questions et les réponses étaient fausses de toute façon parce que vous aviez oublié d’indiquer aux informaticiens que «bleu marine» et «bleu azur» désignaient la même chose.

«Le Big Data ne cesse de se développer. Le terme est passé d’un mot-clé issu de cerveaux du marketing à une description d’un changement de paradigme.»

Mais demain, vous ferez appel à un «Data Scientist», qui jettera son filet dans la «Sea of Data». Il combinera les données des fabricants de chaussettes (coloris, ventes) à des données météo historiques, une «Sentiment Analysis» de porteurs de chaussettes de Twitter et de Facebook, une analyse de revues de mode, la correspondance e-mail des cinq dernières années de vos vendeurs avec le magasin de chaussettes hollandais et une analyse de tous les selfies de pieds enchaussettés de jeunes de 15 ans des pays du Benelux sur Facebook.

 

Et le Big Data ne s’arrête pas là: pour la commande automatique de feux, des machines liront les photos de plaques d’immatriculations prises par d’innombrables caméras situées dans le tunnel de Gubrist, les combineront avec les calendriers de vacances, les données de stations services et météorologiques pour fixer ainsi à temps, pour le trafic venant du Nord-Ouest de la Suisse, une phase de rouge un peu plus longue afin d’éviter l’embouteillage total au Gothard. Des polices secrètes iront à la pêche dans la «Sea of Data» et découvriront qui regarde seul les émissions interdites de l’étranger et qui les voit avec le voisin. Plus besoin de l’armée d’indicateurs de jadis, peu fiable et onéreuse.

 

Sans relâche, la «Sea of Data» est alimentée par des affluents: les photos des réseaux sociaux, les enregistrements de trilliards de capteurs, les e-mails, conversations téléphoniques, données publiques telles que procès-verbaux de réunions d’autorités publiques et registres fonciers, protocoles de traitements médicaux, dictionnaires. Quiconque saura comment jeter ses filets en saura davantage que nous-mêmes individus ne pouvons ne l’imaginer.

 

Est-ce une bonne ou une mauvaise chose? Cela dépend des intentions du pêcheur et de son donneur d’ordre. Interrogez votre «Data Scientist».

0115_Fok_Kol_Aut
Christoph Hugenschmidt

Ce journaliste et éditeur a fondé il y a dix ans le journal en ligne «inside-it.ch». Il s’intéresse aux ordinateurs depuis 1978 et ne sait toujours pas s’ils sont bons ou mauvais.

Plus dʼarticles Focus

Thème du titre: Big Data

Comprendre le présent et façonner l’avenir

En Suisse, de premières villes testent comment mieux évaluer des projets d’infrastructure au moyen de données de téléphonie mobile rendues anonymes.

Portrait

«Je ne suis pas une pinailleuse»

Quelle impression on a quand on accompagne chaque projet interne de Big Data avec un doigt menaçant?

Entretien avec un expert

«Plus tôt on échoue, mieux c’est»

Pour profiter des technologies de Big Data il faut experimenter, conseille Victor Schlegel.