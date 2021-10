Le Big data, « un véritable changement de paradigme » ? Pour Sadry Porlon, avocat et coordinateur de la conférence, le Big data permettrait de « tout savoir ». Et quoi de mieux qu'utiliser cet outil prometteur dans le marketing, afin de connaître avec plus d'acuité la demande des consommateurs, et évaluer leurs besoins. En effet, le Big data permet de traiter une grande quantité de données, et donc de faire des recoupements d'informations encore plus pertinents que par le passé. D'où l'idée de croiser l'étude technique du Big data avec celle du droit du marketing numérique.

S'agissant de la partie technique, la mission a été confiée à Gérard Péliks, président de l'atelier sécurité et vice-président de l'association Forum Atena. « Le Big data n'a rien de magique, c'est des maths », a-t-il introduit avec pragmatisme, comme pour couper court à l'angélisme qui accompagne l'avènement de certaines innovations. « C'est un changement de paradigme, de mode de pensée », a-t-il averti, puisque « le problème n'est plus de chercher la cause pour en déterminer les faits, mais de corréler les données entre elles ». Ceci permettant d'en retirer la « substantifique moelle ».

Mais pour arriver à ce changement de paradigme, Tony Hey – dans son livre intitulé Le Quatrième paradigme – divise l'évolution des inventions qui ont changé le monde en quatre phases :

• L'empirisme : la science est basée sur l'observation des phénomènes naturels ;

• Les sciences dures : les mathématiques et la physique théorique permettent l'explication des phénomènes observables ;

• La simulation sur ordinateur : il s'agit de modéliser le monde sur un petit échantillon, afin de savoir si l'hypothèse émise se confirme. Mais ce paradigme n'accepte qu'un nombre restreint de paramètres, à la différence de son successeur ;

• Le Big data : le nombre de paramètres pris en compte peut varier jusqu'à l'infini et c'est l'ordinateur lui-même qui fait des liens statistiques parmi des milliards de données.

« Twitter génère 7 To de données par jour ! »

Ainsi, si l'on prend le prix ‘‘10 000 euros'', il s'agit d'une information brute. ‘‘Cette voiture coûte 10 000 euros'', « là nous avons une sémantique », explique le scientifique, « on sait lui associer des metadata ». Un terme qui revêt une importance particulière dans le Big data : c'est l'association de la data brute avec ses metadata qui permet de l'enrichir. Ainsi, une donnée numérique, selon Gérard Péliks, c'est une data accompagnée de toutes ses metadata.

Pour bien cerner les enjeux du phénomène, l'ingénieur a ensuite précisé que le Big data se caractérise principalement par ses 3 V :

• D'abord par son volume : le Big data commence lorsque les moyens informatiques traditionnels ne suffisent plus pour traiter des données. Twitter génère par exemple 7 teraoctets (7000 gigaoctets) de données par jour ! Gérard Péliks a par ailleurs précisé que « le Big data d'aujourd'hui [était] le small data de demain », donnant une idée à l'assistance de l'ampleur que va prendre le phénomène dans les années à venir.

• Ensuite la variété : le Big data accueille tout type de données, qu'ils s'agissent de vidéos, de mails, de photos ou de transactions. Ainsi, les possibilités de croisement de données sont gigantesques.

• Le Big data se caractérise aussi par la vélocité : Google parcourt 100 pétaoctets par seconde, c'est « l'ère de l'immédiateté » comme l'a précisé Gérard Péliks. Ce traitement de données est donc très conséquent, mais aussi rapide.

Pour illustrer ses propos, l'ancien centralien a notamment évoqué « Google flu trends », un service aujourd'hui fermé qui consistait en l'utilisation des résultats de recherche Google afin de prédire les épidémies de grippe. À l'aide d'un algorithme prédictif, le célèbre moteur de recherche a réussi à obtenir les mêmes résultats que le réseau « Sentinelles » des médecins, dédié à l'étude de cette maladie. Cet exemple édifiant illustre parfaitement le changement de paradigme évoqué par Gérard Péliks, où la réalité rejoint la fiction. La prédiction des crimes et délits pourrait à terme investir les commissariats, de la même façon que dans le film Minority Report de Steven Spielberg.

Autre exemple : la migraine, dont personne ne connaissait l'origine. Des milliers de thèses de doctorants ont été analysées aux États-Unis, et le mot « sérotonine » est apparu, puis « stratium », une partie du cervelet qui agit sur la sensation de la satisfaction.

Ou encore, un réacteur d'Airbus A380 génère 1 To (teraoctet) entre Paris et New York. Ainsi, le constructeur Rolls-Royce ne va plus vendre des moteurs, mais un « maintien en conditions opérationnelles », puisqu'il pourra « assurer les réacteurs en fonction des data qui lui arriveront en masse ». De quoi donner une certaine idée des possibilités quasi infinies offertes par le Big data. « Au XIXe siècle, c'était l'époque des biens matériels, au XXe les hommes possédaient des biens immatériels : la marque l'opinion, la confiance ; alors qu'au XXIe siècle nous entrons dans l'ère de la data », a-t-il précisé.

Le spécialiste a tenu à rajouter son propre V en guise de conclusion : « J'ajouterai un V, la voracité. On vous prend toutes vos données de tous formats ; la voracité c'est antinomique de l'anonymisation. » Une transition toute trouvée avec les aspects juridiques du Big data pour l'ingénieur, qui a précisé aux avocats présents en guise d'avertissement « On vous prend toutes vos données, et sachez qu'en associant votre date de naissance à une maladie que vous avez eue dans votre jeunesse, il est possible de retrouver votre nom… ! »

Un Big Data bien encadré

C'est donc Nathalie Metallinos, avocate au barreau de Paris, qui a eu pour charge de brosser le portrait juridique du Big data, en tout cas de son intrication avec le marketing numérique. Ce même marketing à qui « il fallait redonner du sens » car « basé jusqu'à présent sur le ciblage comportemental ». Coupant court à tout excès d'optimisme, la juriste a introduit d'emblée « il faut raison garder par rapport à cet engouement. On a l'impression que l'on va résoudre tous nos problèmes, le Big data étant le nouvel or noir, on ne va plus se poser la question la causalité ». En ce sens que la complexité des algorithmes empêcherait d'en comprendre les tenants et aboutissants, coupant court à toute possibilité de contrôle.

C'est donc à ce niveau, comme l'a précisé Nathalie Metallinos, qu'interviennent la protection des données personnelles et des libertés publiques. « Il faut pouvoir concilier ces engouements avec nos libertés publiques, c'est tout l'enjeu de la protection des données personnelles. Il faut que l'individu garde un minimum de contrôle sur ses données », a-t-elle insisté. Nathalie Metallinos a par ailleurs nuancé les propos de Gérard Péliks, précisant que « ces rapprochements de données ne sont pas tout à fait nouveaux, mais se font de manière plus précise ».

« Il faut que l'individu garde un minimum de contrôle sur ses données »

Pour elle, le danger réside dans le traitement automatisé des données : « Aujourd'hui, c'est la machine qui va faire cette corrélation, et ce qui est problématique, c'est que l'on ne sait pas comment elle le fait. » Les données personnelles relevant des droits de la personnalité, il n'y a pas de propriétés sur ces droits, qui sont inaliénables.

En effet, ce qui est en réalité cédé, c'est la base de données. D'où la possibilité de contrôler ses propres données, protégées par la loi informatique et libertés, ainsi que par la Charte des droits fondamentaux de l'Union européenne. C'est d'ailleurs un des axes majeurs de la Commission nationale de l'informatique et des libertés (CNIL), comme l'a rappelé Nathalie Metallinos, qui est de lutter contre la patrimonialisation des données personnelles. À ne pas confondre avec l'Open data, constitué de données anonymes collectées dans un domaine public, et dont la publication est obligatoire.

Ainsi, Nathalie Metallinos rappelle que l'évolution de ce droit ne va plus porter sur le nom, les identifiants mais sur ce qui permettra de singulariser une personne. Et ce, même si on ne peut pas immédiatement la nommer. On trouve notamment les objets connectés, produisant des données en apparence anonymes, mais dont le croisement permettra de connaître leur propriétaire.

L'intervenante a donc apporté deux règles à respecter : il faut se poser la question « à quel moment puis-je traiter des données à caractère personnel ? » (consentement à donner telle ou telle information), et vérifier qu'il existe bel et bien un intérêt légitime à opérer ce traitement particulier de données.

« Si le produit est gratuit, c'est que le produit c'est vous »

L'avocate a donné l'exemple de la société JCDecaux, qui désirait effectuer des statistiques avec les adresses MAC des terminaux récoltés auprès de ses Abribus. Ceci permettant à son annonceur de connaître exactement le nombre de personnes passant devant ces équipements. En l'espèce, les personnes n'avaient pas la possibilité de donner leur consentement (aucun droit d'opposition), la CNIL a donc rejeté la demande de traitement. Il faut donc procéder à des études d'impact afin d'évaluer le risque, et mettre en place des programmes de conformité (anonymisation des données, consentement, paramétrage user friendly).

Me Sadry Porlon a enfin rappelé enfin qu'il n'y avait pas de transfert de propriété dès lors que l'on pouvait revenir sur le consentement au traitement des données, clôturant la conférence par un adage édifiant : « Si le produit et gratuit, c'est que le produit c'est vous. »