Fermer la publicité
Journal d'information juridique et d'annonces légales

Quand les robots apprennent à lire les contrats

le - - Droit - Actualité du droit

Quand les robots apprennent à lire les contrats
DR

Par Manon Perret, étudiante en dernière année à l'EDHEC Business School, LLM Law & Tax Management

Nous concluons de plus en plus de contrats, mais ces derniers gagnent également en complexité et en volume. En prolongeant les analyses de Philipe d'Iribarne, sociologue, on peut expliquer ce phénomène d'hyperinflation contractuelle par une sorte de rapprochement avec les comportements d'outre-Atlantique.

En effet, les américains ont tendance à vouloir tout anticiper dans leurs contrats afin d'éviter le plus possible de passer devant un juge. On peut également expliquer cette tendance par une diminution de la régulation étatique et la place faite par la loi à plus de consensualisme. L'État se retire et les agents économiques bénéficient de l'outil contractuel pour régir leurs relations économiques.

Cependant, il existe une contrepartie à cette plus grande liberté des agents économiques. Les contrats deviennent des monstres de papier difficilement lisibles. Perdu dans un jargon juridique pointu et une exhaustivité assommante, le lecteur peut passer à côté d'informations cruciales car utiles au quotidien du monde des affaires.

Ainsi, l'intelligence artificielle, et plus précisément l'analyse sémantique des « données textuelles », peut venir en aide au lecteur, juriste comme profane, perdu dans des contrats pouvant atteindre des centaines de pages et remettre l'outil contractuel au cœur de l'entreprise.

L'analyse sémantique, qu'est-ce que c'est ?

Aujourd'hui, la grande majorité des données est contenue dans des textes, sous forme verbale et donc non-structurée. Là où les robots échangent des datas, les humains échangent des messages électroniques, des mémos, des commentaires, des avis clients, des CV, des offres d'emplois, etc. L'analyse
sémantique de « données textuelles » a pour ambition de faire apparaître des faits ou des tendances cachés dans des contenus écrits. Au-delà d'une simple analyse lexicale qui s'intéresse à un mot de manière isolée - le lexème - l'analyse sémantique s'intéresse au sens global d'un énoncé apporté par un ensemble de mots(2). Il s'agit donc de la phase la plus fastidieuse pour les machines et c'est pour cette raison qu'elle reste encore assez peu développée.

De plus, il ne s'agit pas ici de comprendre la signification d'une phrase ou d'un texte mais plutôt de tirer des conclusions sur la signification globale d'un texte qu'on analyse. L'analyste permettra, par exemple, de savoir si la phrase « il fait très froid » est sémantiquement proche de « le temps est glacial ». Un analyste sémantique recherchera si ces deux exemples expriment la même idée afin de construire une représentation mathématique de la signification des phrases(3). Grace à cette représentation, il sera alors possible de comparer, classer et même opérer un raisonnement déductif entre les textes. L'analyse sémantique assiste donc le lecteur dans différentes tâches : le calcul de similarité entre deux textes, la détection de notions particulières, le résumé automatique, l'analyse d'opinions et d'émotions, le classement par thématique ou encore la génération de nuages de mots.

Comment cela fonctionne-t-il techniquement ? L'analyse se fait par une organisation des mots d'un corpus par le biais d'immenses thésaurus – listes organisées de termes – afin de les classer dans une arborescence de concepts. Une fois ce classement établi, il sera possible de dégager les thèmes dominants d'un texte. Des algorithmes complexes pourront alors évaluer les relations entre les différentes idées(4).

L'exemple de Proxem, pionnier du Deep Learning

Proxem est une entreprise française spécialiste de l'analyse sémantique des données textuelles pour l'entreprise. Elle a été fondée par François-Régis Chaumartin, doctorant en linguistique computationnelle, qui a lancé il y a 10 ans Antelope, la plateforme d'analyse sémantique de Proxem. L'entreprise génère aujourd'hui un chiffre d'affaires de 2 millions d'euros. La société a mené depuis sa création 130 projets pour une quarantaine de clients, principalement des sociétés du CAC 40 telles que Airbus, Total, BNB Paribas, etc. La société doit son succès à sa performance en R&D, ayant à son actif plusieurs brevets et publications scientifiques, ainsi qu'à la confiance des investisseurs grâce à plusieurs levées de fonds.

Si l'engagement de Proxem semble simple, obtenir des données structurées à partir de textes, les défis technologiques n'en sont pas moins réels. Son fondateur utilise une analogie avec l'apprentissage humain pour montrer la complexité de l'outil de Proxem : « Nous oublions souvent que nous avons épuisé la patience de nos parents pendant trois à quatre ans avant d'apprendre à parler. Et que nous avons étudié quinze ans avant de savoir faire un résumé ». Il montre ici que Proxem œuvre dans une des franges les plus complexes de l'Intelligence Artificielle, qui offre également un champ de possibles illimité, le « Deep Learning »(5).

Le Deep Learning, traduit en français par « l'apprentissage profond » est une forme d'intelligence artificielle, dérivée du Machine Learning (apprentissage automatique). Auparavant, apprendre quelque chose à un ordinateur revenait à le programmer, c'est-à-dire lui permettre d'exécuter à la lettre des règles prédéterminées. Mais un programme peut être difficile à écrire, présenter des bugs ou encore devoir impérativement contenir des informations explicites qui peuvent être difficilement prévisibles dans des situations complexes.

La révolution permise par le Deep Learning est le fait que la machine soit capable d'apprendre par elle-même, par l'exemple. Elle peut ainsi reproduire les comportements cognitifs que l'humain lui-même ne peut décortiquer et expliquer. Le Deep Learning imite le cerveau humain en recréant un réseau de neurones artificiels organisés en une centaine de
« couches » successives. Ces dernières reçoivent et interprètent les informations de la « couche » précédente(6). En lui présentant l'algorithme des images correspondant à une pomme et lui signalant quelle est la réponse attendue, l'ordinateur apprendra à reconnaître une pomme parmi une bibliothèque d'images. Plus le système accumule des images de pommes, plus il peut généraliser et reconnaître une pomme sur des images qu'il n'a jamais vues(7). Cependant, pour que la machine soit capable d'une telle généralisation, il faudra lui fournir 100.000 images de pomme avec un taux de réussite de 95%(8).

Utilisation pratique dans le monde juridique

L'analyse sémantique a de nombreuses applications commerciales (analyse des messages électroniques, des avis clients, de l'image d'une marque, etc.) mais peut tout aussi naturellement porter sur des contrats. En tant que juriste, il est nécessaire de rechercher des caractéristiques particulières dans un ensemble de contrats telles que la responsabilité des parties ou encore les pénalités de retard. Cependant, la recherche par mots-clés est vaine lorsque ces idées sont exprimées dans un vocabulaire différent. L'analyse sémantique permet de trouver les paragraphes relatifs à la notion cherchée en s'intéressant au contexte et au sens global de la clause(9). L'analyse sémantique peut donc être une aide précieuse grâce à une lecture rapide des documents longs tels que les appels d'offre, la due diligence, etc.

Plus précisément, l'analyse sémantique s'attache au sens du terme juridique, c'est-à-dire à une interprétation dans un contexte. La recherche du mot « loi » permettra ainsi d'obtenir « législation », « directive » ou encore « constitution ». L'intelligence artificielle permet de construire une large matrice de notions juridiques ayant des connections entre elles. Cependant, bien que ce type de technologie ait été implémenté avec succès, l'analyse sémantique appliquée au droit ne parvient pas à avoir une compréhension plus complexe d'une argumentation juridique. Elle se contente ainsi de faire correspondre une question à la meilleure réponse possible. Pour le moment, la technologie ne semble pas assez mature pour analyser par exemple une décision de justice et comprendre l'intention du juge ou l'argumentation d'un avocat. Le cerveau humain prévaudra ici car l'IA ne parvient pas à généraliser des syllogismes difficiles ou des règles de droits avec des concepts peu définis(10).

D'autres applications sont cependant possibles. Dans le cadre du Règlement Général sur la Protection des données (RGPD), l'analyse sémantique peut participer à l'anonymisation, la modération et la validation d'un grand nombre de données. De même, lors des data room, l'analyse peut porter sur un corpus spécifique en phase d'audit. Enfin, dans le domaine de la compliance, l'analyse sémantique peut également être très utile pour la lecture des rapports d'Assemblée Générale, de notices financières, etc.

Limites techniques à l'analyse sémantique

Cependant, il est nécessaire de préciser qu'il existe un seul type d'intelligence à proprement parler, l'intelligence humaine. Aucun système informatique ne sait aujourd'hui comprendre en profondeur un énoncé comme un humain en est capable. La compréhension du langage humain est un sujet d'une grande complexité, comme le démontre l'omniprésence de l'ambiguïté, et un travail long à l'échelle humaine. Les humains parlent, lisent des textes et arrivent généralement à se comprendre si l'on oublie les malentendus et autres quiproquos. Les machines n'en sont pas encore techniquement capables.

De plus, il existe des limites techniques pour des entreprises comme Proxem. En effet, afin de développer le Deep Learning, elles ont besoin d'un très grand nombre de données. Une bibliothèque de 10.000 contrats, bien qu'énorme à l'échelle d'un cabinet ou d'un service juridique, n'est pas suffisante pour qu'une machine puisse apprendre par l'exemple. La matière première de l'IA reste les données et seuls les GAFA qui en possèdent des milliards semblent en capacité de développer de telles technologies. Ainsi, Proxem développe plutôt une forme d'AI hybride, un mélange Deep Learning et un retour à un système à base de règles. De manière générale, on peut donc parler aujourd'hui d'IA faible. Nous savons faire de l'IA spécialisée, très bien et vite, mais uniquement sur une tâche très précise.

Dans un monde où les flux de données déferlent à un rythme inintelligible pour l'humain, l'analyse sémantique permet de retrouver une maitrise nécessaire de l'information. Appliquée au monde des contrats, l'analyse sémantique facilite le travail des juristes en les aidant à identifier rapidement les points d'attention dans un document juridique. Elle réduit le temps de traitement d'un document et donc sa pénibilité. Le contrat devient alors un outil vivant au cœur de l'entreprise, véritable source d'information.

Chronique « Droit, Juriste et Pratique du Droit Augmentés »

Cette chronique a pour objectif, de traiter de questions d'actualité relatives à cette transformation. Dans un contexte où le digital, le big data et le data analytics, le machine learning et l'intelligence artificielle transforment en profondeur et durablement la pratique du droit, créant des « juristes augmentés » mais appelant aussi un « Droit augmenté » au regard des enjeux et des nouveaux business models portés par le digital.

L'EDHEC Business School dispose de deux atouts pour contribuer aux réflexions sur ces sujets. D'une part, son centre de recherche LegalEdhec, dont les travaux – reconnus – à l'intersection entre le droit et la stratégie, et portant sur le management des risques juridiques et la performance juridique, l'amènent aujourd'hui à lancer son nouveau projet A3L (Advanced Law, Lawyers and Lawyering). D'autre part, ses étudiants, et en particulier ceux de sa Filière Business Law and Management (en partenariat avec la Faculté de droit de l'Université Catholique de Lille) et de son LLM Law & Tax Management, dont la formation et les objectifs professionnels les placent au cœur de ces enjeux du digital.




Ses derniers articles

Abonnez-vous à l'offre Papier + Numérique

Affiches Parisiennes Journal d'information juridique et d'annonces légales

  • ›   Pour plus de contenu, papier + web
  • ›   l’accès aux annonces légales,
  • ›   l’accès aux ventes aux enchères.
Je m'abonne

À lire également


Réagir à cet article

Message déjà envoyé Adresse e-mail non valide


Fermer
En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies et de technologies similaires par notre société ainsi que par des tiers, afin de réaliser des statistiques d'audiences et de vous proposer des services éditoriaux et la possibilité de partager des contenus sur des réseaux sociaux. En savoir plus / paramétrer