Affiches Parisiennes : Sur quelles technologies s'appuie Predictice ?

Alexandre Chéronnet : Nous utilisons les technologies de compréhension du langage naturel (NLP : natural language programming), fondées sur l'analyse sémantique et syntaxique. Nous agrégeons tout d'abord notre base de données, récupérée soit en open data, soit auprès de la Cour de cassation, puis nous allons utiliser nos algorithmes afin de la structurer. Il s'agit de cibler certaines informations (le montant des indemnités, les postes de préjudice, les personnes condamnées, les condamnations prononcées), puis de les associer entre elles (tel poste de préjudice correspond à tel montant d'indemnité). Tout cela nous permet au final de déterminer des analyses simples –médianes, moyennes, écarts-types...

Actuellement, nous atteignons 96 % de compréhension sur les données d'appel, par exemple. Les 4 % restants sont très durs à cerner, car ils relèvent d'une problématique ambiguë. Néanmoins, pour les fonctionnalités que nous proposons, il n'est pas nécessaire d'atteindre les 100 %.

Google a récemment provoqué une petite révolution en matière de compréhension du langage, grâce a son nouvel outil SyntaxNet. Le gros avantage de cette technologie, c'est qu'elle peut s'adapter à n'importe quel langage. Nous l'avons récupérée il y a un an pour l'entraîner sur le langage juridique.

A.-P. : Qu'entendez-vous par « entraîner » ?



A. C. : Grâce aux algorithmes de machine learning, l'outil peaufine son analyse au fur et à mesure. Cela repose sur la reconnaissance de pattern –modèles, ndlr. Au départ, quelques données sont intégrées pour que la machine reconnaisse ce qui est et ce qui n'est pas. Cela fonctionne comme la reconnaissance d'images : la machine intègre 150 images de chats pour définir ce qu'est un chat, puis 150 images d'autres animaux pour définir ce qui n'est pas un chat. Enfin, par l'intégration de différentes données, l'outil va s'entraîner et ainsi améliorer sa compréhension du sujet. Il en va de même pour les décisions de justice. La différence, avec SyntaxNet, est qu'avant, la machine enregistrait certains modules de phrases prédéfinies, alors qu'aujourd'hui, elle est capable d'améliorer sa compréhension au fil du temps.



A.-P. : Quelle est votre opinion sur la « révolution numérique » ?



A. C. : Elle me semble inévitable. Tous les métiers s'informatisent. Malgré cela, je pense que l'humain aura toujours son importance. Nous ne proposons pas une technologie de substitution, car notre outil ne peut être utilisé que par un professionnel qui connaît parfaitement son métier. Lui seul peut intégrer les bons critères de recherche et les qualifier juridiquement. En définitif, notre outil permet surtout de recentrer l'activité de l'avocat sur ses deux piliers : l'interprétation des données juridiques et le conseil.



A.-P. : Le besoin humain est toujours là car la technologie reste limitée. Quid pour l'avenir ?

A. C. : Nous sommes dans un Etat de droit, induisant l'obligation d'être représenté par un avocat. Quand bien même nous serions face à un ordinateur assez puissant pour être capable de répondre à n'importe quel cas, au regard de la loi, la présence de l'avocat sera toujours obligatoire. Certes, notre outil est capable de challenger l'avocat. Mais cela est déjà le cas aujourd'hui. Un directeur juridique, par exemple, a accès aux mêmes données que nous. Il en est donc aussi capable. Nous allons simplement vers plus de performances.



A.-P. : Allons-nous vers la création d'un nouveau métier, entre analytique et juridique ?



A. C. : Pour moi, c'est une évidence. Il va falloir que les professionnels du droit se forment à ces outils. Ceci dit, Predictice ne nécessite aucun prérequis mathématique ou informatique. Il suffit juste de savoir utiliser un moteur de recherche. Au sein de notre équipe, je remarque que les juristes sont très sensibles aux problématiques de data, et les ingénieurs aux problématiques juridiques. Il est évident qu'à l'avenir, nous allons voir l'émergence de double-profil. On la voit déjà paraître dans certains cabinets anglo-saxons, qui commencent à développer, en interne, leurs propres solutions analytiques, grâce à une équipe technique aux compétences complémentaires.

A.-P. : La création d'outils juridiques numériques devrait-elle être réglementée ?



A. C. : Je pense que non. Si un éditeur juridique écrit quelque chose de faux, ou une interprétation jurisprudentielle que je considère erronée, je ne vais pas pouvoir lui faire de procès. Pourtant, cela va être réutilisé par les avocats dans leurs consultations. Si un professeur de doctrine a une opinion dissidente par rapport à la Cour de cassation, cela n'engage pas non plus sa responsabilité.

La CNIL a récemment créé une commission sur la gouvernance des algorithmes, pour laquelle nous sommes auditionnés. Ce type de démarches ne nous dérange absolument pas, bien au contraire. Nous essayons toujours d'être le plus transparent possible. La tendance me semble donc davantage à l'autorégulation. Mais, évidemment, des questions se posent : doit-on faire de la statistique sur les délits criminels ? Sortir une statistique sur les juridictions où le viol sur mineur est le moins condamné en France ? Cela pose un certain nombre de questions. Faut-il bloquer ces analyses ? Avoir une vision du caractère homogène de la Justice en France est réellement un problème ? Ce sont des questions sur lesquelles nous travaillons avec la Chancellerie.



A.-P. : Justement, quelles sont vos relations avec la Chancellerie ?



A. C. : Etant donné que la loi Lemaire oblige la mise en open data de toutes les décisions de justice, nous avons tout intérêt, aujourd'hui, à avoir d'excellents rapports avec la Cour de cassation, qui est le producteur de données, et la Chancellerie, qui est le maître d'œuvre de cette politique d'open data. Ils ont une réelle vision de ce que doivent être les professions juridiques de demain, et là-dessus, ils sont incontournables.



A. P. : Quelles sont vos principaux partenariats ?



A. C. : Nous avons toujours eu une stratégie très active de partenariats. Comme nous évoluons au sein de professions réglementées, nous n'avons pas voulu répéter les erreurs de d'autres start up. J'ai travaillé pour l'incubateur du barreau de Paris lors de ma dernière année d'étude, et je sais que, même si c'est difficile pour eux, ils essayent de créer un écosystème favorable pour les legaltech. Cette stratégie d'incubateurs commence d'ailleurs à se développer, avec la récente création d'un incubateur à Marseille et à Lyon. C'est quelque chose de très positif pour les legaltech. Nous avons conclu un premier partenariat avec le barreau de Lille, notamment grâce à son bâtonnier, Stéphane Dhonte, quelqu'un de très pro numérique. Lille est ainsi devenu le premier barreau-pilote de la justice prédictive, en Europe, avec une quarantaine d'avocats qui testent actuellement notre outil. Nous cherchons maintenant à développer des partenariats semblables avec certaines cours d'appel, pour pouvoir tester l'outil auprès des magistrats.

Nous avons aussi des partenariats avec des groupes, par exemple avec la direction juridique d'Orange et d'AXA. Notre cible commerciale est non seulement les avocats, mais aussi les directions juridiques, notamment pour tout ce qui touche aux protections juridiques associées aux contrats d'assurance. Ce secteur-là est très friand d'analyses prédictives.

Nous développons par ailleurs un programme « Predictice pour l'enseignement et la recherche ». Nous souhaitons offrir l'outil à l'ensemble des universités de droit, notamment au niveau Master. Nous disposons d'un premier partenariat fort avec Sciences Po Paris, en organisant des conférences et des formations autour de l'analytique dans le monde du droit.



A.-P. : Vos concurrents utilisent-ils les mêmes technologies ? Pour une décision donnée, ressort-il différentes analyses selon l'outil utilisé ?



A. C. : Vu que je ne connais pas d'outils prédictifs aussi avancés que le nôtre, je ne peux pas comparer. Mais c'est une vraie question. Sans avoir accès aux données, je sais qu'un de nos clients teste à la fois notre solution et celle de Case Law Analytics, qui s'appuie sur la régression linéaire (et non du NLP). Il serait intéressant de comparer sur un cas précis.



A.-P. : Avec la démocratisation probable des outils statistiques, pouvons-nous encore dire « non » à la machine ?



A. C. : C'est toute la question de l'essai « performatif ». Le fait d'avoir de la statistique amène-t-il à une standardisation des différends ? Deux éléments de réponse. Déjà, l'outil permet d'éviter la judiciarisation des cas les moins sujets à variation. Face à une probabilité de résolution sûre à 95 %, la statistique garde tout de même un sens. Après, si un cas se distingue par telle ou telle caractéristique, le professionnel du droit va évidemment le prendre en compte. C'est à lui de juger et de pondérer en fonction de la caractéristique propre au cas d'espèce.

La justice prédictive doit être perçue comme un changement majeur pour les professionnels du droit, pas comme un renversement de paradigme. Ce n'est pas une statistique qui va dicter le métier de qui que ce soit.