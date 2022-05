La transition semble enfin amorcée pour les juridictions suprêmes, à l’heure où moins de 1 % des décisions des tribunaux de première instance et des cours d’appel sont librement accessibles en ligne[2].

Juristes et justiciables doivent ainsi toujours composer avec une connaissance mutilée, au mépris des impératifs d’accessibilité et d’intelligibilité de la règle de droit, et ne peuvent se prémunir contre « une justice secrète échappant au contrôle du public », selon la formule de la Cour européenne des droits de l’Homme[3].

Le principe de publicité des décisions de justice est pourtant protégé tant au niveau conventionnel[4] que constitutionnel[5], par les jurisprudences de la Cour de cassation et du Conseil d’État, et par un grand nombre de dispositions législatives françaises. Une loi de 1972[6] dispose ainsi sans ambiguïté que « les tiers sont en droit de se faire délivrer copie des jugements » (à condition toutefois que lesdits jugements soient prononcés publiquement). Les articles L.10 du Code de justice administrative et L.111-13 du Code de l'organisation judiciaire composent également le socle du droit à l’accès aux décisions de justice.

La loi de 2016[7] et son décret d’application publié en 2020[8] ont introduit un changement de paradigme en promettant l’open data des décisions des juridictions judiciaires et administratives. Si cet open data des décisions de justice pourrait enfin rendre effective la publicité de la justice, il doit s'accompagner de garanties d’innocuité car les informations ainsi dévoilées au grand jour et hautement manipulables peuvent porter atteinte à la vie privée et au droit à la protection des données à caractère personnel des parties aux décisions et des tiers.

L’open data est une notion complexe qui, appliquée en particulier aux décisions de justice, présente un intérêt certain pour les justiciables (I), mais en conséquence de ce changement de paradigme, les droits à la vie privée et à la protection des données à caractère personnel des justiciables doivent faire l’objet d’une protection accrue (II).

Le principe de l’open data de la jurisprudence en droit français

La notion d’open data et son application aux décisions de justice

L’open data des décisions de justice, mise en œuvre contemporaine du principe de publicité de la justice, désigne la mise à disposition du public des décisions de justice (idéalement toutes) à titre gratuit sous forme électronique[9] afin d’en permettre la réutilisation[10].

Il s’agit d’un concept avant tout technique qui est né avec les outils numériques de traitement de données en masse et de communication, mais qui présente également des enjeux politiques notamment en ce qu’il permet aux justiciables d’exercer un contrôle renforcé sur l’institution judiciaire.

En termes quantitatifs, l’open data permettrait d'accroître considérablement le nombre de décisions de justice publiées. Ainsi, plus de 300 000 décisions de l’ordre administratif et 3 millions pour l’ordre judiciaire seraient à terme publiées annuellement, contre 20 000 décisions administratives et 15 000 décisions judiciaires publiées aujourd’hui [11].

La loi du 7 octobre 2016 pour une République numérique a posé le principe d'une mise à disposition du public, à titre gratuit et dans le respect de la vie privée des personnes concernées, des décisions des juridictions administratives et judiciaires. Le décret d’application de cette loi n’a cependant été pris que le 29 juin 2020, la mise en application de cette loi ayant été repoussée à l'occasion de la loi de modernisation du 23 mars 2019. Le 28 avril 2021, un arrêté précisant le calendrier de l’open data des décisions a finalement été pris sur injonction suite à une décision du Conseil d’État[12]. Le décret du 30 septembre 2021 instaure finalement deux canaux de diffusion correspondant aux deux ordres juridictionnels :

« Judilibre » est l’outil mis en œuvre par la Cour de cassation pour mettre gratuitement à la disposition du public une base de données ouverte alimentée par les décisions rendues par les juridictions judiciaires et destinée à être progressivement enrichie par les décisions de tous les niveaux de juridiction. La dernière avancée en date est la diffusion depuis le 21 avril 2022 des arrêts des cours d’appel en matières civile, sociale, et commerciale [13] .

. L’équivalent dans l’ordre administratif, sobrement baptisé « Décisions de la justice administrative », remplit la même fonction de diffusion massive de la jurisprudence.

Derrière cette inertie et ce calendrier étalé se cachent non seulement des obstacles technologiques mais également des défis juridiques, alors qu’un open data prochain présenterait de nombreux intérêts notamment pour le juriste et le justiciable.

Intérêts et limites de l’open data pour le juriste et le justiciable

L’open data des décisions de justice est la forme ultime de la publicité qui constitue, selon la formule de Jeremy Bentham, « l'âme même de la justice [...] l'incitation la plus vive à l'effort, et la plus sûre des protections contre l'improbité ». C’est donc un mouvement en apparence enthousiasmant, car il renforce en théorie la prévisibilité du droit et le contrôle du juge par le justiciable.

En outre, cette « ouverture des vannes » met fin à une situation historique d’oligopole des éditeurs juridiques en matière de diffusion de la jurisprudence. Cela encourageait d’ailleurs certains acteurs émergents à recourir à des pratiques frauduleuses aux fins de procurer des décisions juridiques et d’en tirer un avantage économique sur un marché où la valeur du service proposé dépend directement de la quantité de données dont l’on dispose[14], et même si finalement c’est plus la qualité des algorithmes qui compte que la masse des données traitées.

L’open data mettrait donc fin à une situation d’exclusion du justiciable de la connaissance du droit qui lui est applicable. Il pourra demain accéder librement et gratuitement à l’ensemble de la jurisprudence des juridictions françaises. Toutefois, face à des décisions de justice certes très abondantes, mais rédigées dans une langue abrupte voire savante, le justiciable ne dispose pas vraiment de la grille de lecture lui permettant une compréhension réelle de l’information mise ainsi à sa disposition.

Le justiciable ne peut accéder de sa seule initiative à l’ensemble de la connaissance juridique libérée par l’open data. Des acteurs doivent s’interposer pour lui en permettre l’intelligibilité au moyen d’un retraitement « digestion » des données de l’open data (structuration des données, valorisation éditoriale, etc.). Il est alors nécessaire de conjuguer l’objectif d’intérêt général que constitue l’accès au droit pour tous avec les intérêts privés des acteurs - souvent commerciaux - de la valorisation des données de l’open data afin d’éviter une privatisation de la donnée juridique.

Si ces initiatives semblent enfin rendre effectif le principe de publicité de la justice, elles participent également à la libération massive de données et d’informations personnelles propres aux personnes concernées par les décisions. L’enjeu est donc de doter les outils de l’open data de moyens technologiques efficaces afin de protéger la vie privée et les données personnelles des personnes physiques (II).

La protection de la vie privée et des données à caractère personnel des parties prenantes aux décisions publiées

Fondements et mise en oeuvre du droit au respect de la vie privée et à la protection des données à caractère personnel des justiciables

Le droit au respect de la vie privée et à la protection des données à caractère personnel sont des droits fondamentaux reconnus par des instruments internationaux[15] et nationaux[16]. Ils bénéficient en premier lieu aux personnes physiques. Au sein de l’Union européenne, le Règlement Général sur la Protection des Données (“RGPD”), entré en vigueur en France en 2018, met en œuvre ce droit fondamental en encadrant les traitements de données à caractère personnel.

La notion de « donnée à caractère personnel », pierre angulaire du texte, y est définie comme “toute information se rapportant à une personne physique identifiée ou identifiable [...] directement ou indirectement” [17].

Constitue par exemple une donnée à caractère personnel le nom ou le prénom, l’adresse, ainsi que toute information qui peut être directement (ou via un recoupement) associée à une personne physique. Les décisions de justice lorsqu’elles sont rendues contiennent de tels éléments, y compris ceux relevant de l’intimité de ces personnes. L’on pense par exemple au rappel des faits d’une décision de divorce ou du juge aux affaires familiales.

Le RGPD définit également la notion de traitement comme “ toute opération ou tout ensemble d'opérations effectuées ou non à l'aide de procédés automatisés et appliquées à des données ou des ensembles de données à caractère personnel telles que la collecte, [...], la conservation, [...], la communication par transmission, la diffusion ou toute autre forme de mise à disposition[...]” [18].

La diffusion en open data des décisions de justice (par une personne publique ou privée), mais également la simple conservation de ces dernières, entrent donc dans le champ d’application du RGPD dès lors que lesdites décisions comportent des données personnelles. C’est d’autant plus le cas lorsque celles-ci comportent des données sensibles au sens du RGPD (informations révélant la prétendue origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l'appartenance syndicale, données concernant la vie sexuelle ou l'orientation sexuelle d'une personne physique notamment) ce qui est courant notamment en matière pénale ou familiale.

Les différents principes du RGPD (en particulier le fait que le responsable d'un fichier ne puisse enregistrer et utiliser des informations sur des personnes physiques que dans un but bien précis, légal et légitime) sont donc applicables aux informations sur des personnes physiques contenues dans les décisions, de telle sorte que le législateur français a entendu mettre en œuvre l’open data en opérant une conciliation avec les droits fondamentaux des justiciables.

La loi du 23 mars 2019[19] a complété le cadre législatif en précisant les moyens à mettre en œuvre aux fins de protéger la vie privée et les données personnelles des justiciables concernés par les décisions de justice publiées dans le cadre de l’open data. Les articles L. 111-13 du Code de l’organisation judiciaire et L.10 du Code de justice administrative modifiés par cette loi consacrent, outre le principe de l’open data, l’obligation d’anonymisation des données concernant les parties à l’audience et l’interdiction du profilage des membres des juridictions ou des juridictions elles-mêmes par la réutilisation des données d’identité.

L’anonymisation doit s’entendre d’un traitement de données qui consiste à utiliser un ensemble de techniques de manière à rendre impossible, en pratique, toute identification de la personne par quelque moyen que ce soit, ce de manière irréversible[20]. La loi fait de l’anonymisation la règle en imposant l’occultation préalable des « noms et prénoms des personnes physiques mentionnées dans la décision, lorsqu'elles sont parties ou tiers » avant toute diffusion de la décision[21].

La CNIL a précisé les modalités d’anonymisation des décisions dans un avis du 29 novembre 2001[22]. Elle rappelle que doivent être anonymisés le nom et l'adresse des parties et des témoins dans tous les jugements et arrêts librement accessibles sur internet, quels que soient l'ordre ou le degré de la juridiction et la nature du contentieux. L’identité et les données des experts judiciaires et des autres professionnels apportant leur concours à la décision doivent également être occultées.

Selon la loi de 2019, il n’est en revanche pas nécessaire d’occulter l'identité des magistrats ou membres des juridictions, ni celle des auxiliaires de justice ou experts, mais la constitution de « profils » de juges ou d'avocats à partir des décisions de justice publiées est strictement prohibée par l’alinéa 3 de l’article L.111-3 du COJ issu de la loi de 2019. Cependant, les nom des juges non professionnels en matière pénale sont systématiquement occultés (jurés d'assises, assesseurs des tribunaux pour enfants, etc.).

En outre, la loi de 2019 autorise le président de la formation,juge, greffier ou le ministère public à anonymiser les décisions rendues en occultant « tout autre élément d'identification » en cas d’atteinte à la sécurité ou au respect de la vie privée des personnes physiques mentionnées dans le jugement. De même devant les juridictions pénales, le ministère public peut décider l’occultation de certains éléments d’identification[23].

L’anonymisation apparait comme un moyen impératif de protection de la vie privée et des données personnelles mais dans la perspective de l’open data, et par conséquent d'une publication massive de décisions, l’anonymisation totale de toutes les décisions semble illusoire et irréalisable. En effet, une totale anonymisation est impossible puisque des risques de réidentification demeurent toujours malgré les efforts et bonnes pratiques des responsables de traitement.

L’anonymisation doit d’ailleurs se distinguer d’un autre procédé qui se développe pour protéger la vie privée et les données des justiciables concernés par les décisions publiées, à savoir la pseudonymisation. Cette notion, mise en avant par le RGPD, consiste à retirer toute donnée à caractère personnel au sein de la décision. Plus précisément, la pseudonymisation est un traitement de données personnelles réalisé de manière à ce que l’on ne puisse plus attribuer les données relatives à une personne physique sans information supplémentaire. Avec l’entrée en vigueur du RGPD, la pseudonymisation remplace l’anonymisation. Ce procédé, qui existait déjà dans la pratique[24], consiste à remplacer les données directement identifiantes (nom, prénom, etc.) par un jeu de données par des données indirectement identifiantes (alias, numéro séquentiel, etc.)[25].

Le projet Open Justice porté par la Cour de cassation permet de développer des solutions fiables de pseudonymisation et d’enrichissement des données. L’objectif est en effet de « pseudonymiser » efficacement les décisions de justice en occultant les éléments identifiants qu’elles contiennent (noms, adresses, dates de naissance…) et faciliter la réutilisation des données grâce à l’enrichissement des données et à leur mise à disposition en open data[26]. La pseudonymisation répondrait à des besoins de conservation, de protection et de réutilisation des données.

Le décret du 30 septembre 2021[27] établit une liste des données à caractère personnel des parties et des magistrats pouvant faire l’objet d’un traitement (données concernant l’identité, la situation familiale et professionnelle etc.). Toutes ces données ont donc vocation à terme à être traitées, collectées et pseudonymisées avant la diffusion de la décision.

Cependant la pseudonymisation comme l’anonymisation font courir un risque de réidentification a posteriori des parties et des tiers aux décisions de justice. La technique de diffusion en ligne entraîne un accès sans limite à la jurisprudence qui s’accompagne de la possibilité de réutiliser et de retraiter les données. Des solutions de long terme doivent donc être pensées pour pallier le risque de réidentification des parties et l’utilisation abusive des données. Le rapport Cadiet préconisait la non-diffusion de la décision lorsque le risque de réidentification est trop important[28]. La question de la pseudonymisation et de l’anonymisation du personnel et des auxiliaires de justice est d’autant plus importante que la divulgation de ces informations permettrait une réidentification des parties[29].

De plus, l’accroissement du volume, de la variété et de la sensibilité des données diffusées rend difficile la prévention de la réidentification. Une analyse de ce risque est nécessaire et doit être réalisée par les diffuseurs des décisions de justice avant toute diffusion d’une décision ; les conditions de diffusion des décisions de justice doivent parfois être adaptées, notamment avec la mise en place d’une pseudonymisation complémentaire pour les données les plus sensibles[30].

Concernant les moyens d’action pour mettre en œuvre l’anonymisation et la pseudonymisation, les innovations technologiques sont des outils nécessaires à la mise œuvre de l’open data et à la protection des données personnelles. En effet, si l'anonymisation était autrefois manuelle, la diffusion massive de décisions de justice rend ce procédé obsolète et les outils technologiques automatisés tels que l’intelligence artificielle, et plus particulièrement les procédés de machine-learning et de deep-learning, viennent remplacer le travail manuel.

Plus récemment, la Cour de cassation a mis en place le programme EIG 4, une application de machine-learning, qui a pour objectif de développer un outil d’annotation ergonomique et open source pour accélérer la pseudonymisation des décisions de justice et leur mise en open data[31].

Les conséquences de la violation des droits fondamentaux des justiciables en matière d’open data et les critiques adressées à l’anonymisation

La diffusion massive de décisions de justice par les juridictions et les éditeurs juridiques sans le secours de techniques d’anonymisation parfaitement efficaces pose la nécessaire question des sanctions et des recours en cas d’anonymisation insuffisante ou inexistante, conduisant à l’identification d’une partie ou d’un tiers.

En cas de manquement à l’obligation de respect de la vie privée ou d’insuffisance d’anonymisation de la décision, le responsable est celui qui a commis la faute selon le droit commun, donc le responsable du traitement des données qui peut être toute personne privée mais aussi l’État[32].

En cas d’atteinte, les personnes victimes disposent de plusieurs recours :

Sur le fondement de l’article 38 de la loi du 6 janvier 1978, elles peuvent s’opposer à la poursuite du traitement les concernant en faisant valoir un motif légitime devant la CNIL ou un juge.

L’article 17 du RGPD prévoit l’obtention dans les meilleurs délais de l’effacement des données à caractère personnelle les concernant (droit à l’oubli).

L’article 21 du même règlement permet à la personne concernée de s’opposer à tout moment aux traitements de ses données personnelles (droit d’opposition).

La diffusion d’une décision non anonymisée est en outre susceptible de recevoir une qualification pénale (à l’exception d’une diffusion par l’État). Le manquement à l’obligation d’anonymisation d’une décision diffusée s'analyse en un traitement automatisé de données personnelles, punissable sur le terrain du droit à la protection des données personnelles. Le responsable de ces agissements encourt jusqu’à cinq ans d'emprisonnement et de 300 000 euros d'amende vertu des articles 226-16 et suivants du Code pénal sanctionnant les infractions à la législation sur les données personnelles[33].

Le législateur a également interdit la réutilisation des données relatives à l’identités des magistrats et greffiers afin de réaliser des analyses statistiques permettant de prédire ou de comparer la manière de traiter les contentieux en fonction des juridictions[34].

Les données personnelles bénéficient également du régime de contrôle et de sanction issu du droit commun. Ainsi, toute personne pourra demander la réparation de son préjudice sur le fondement des articles 1240 et 1241 du Code civil[35].

Enfin des sanctions, notamment pécuniaires, peuvent être prononcées par la CNIL et sont désormais renforcées par le RGPD[36].

Le principe d’anonymisation en lui-même ne fait cependant pas l’unanimité. En effet, pour certains, le principe de l'anonymisation entrerait en contradiction avec l’exigence de publicité de la justice et conduirait à une déshumanisation de celle-ci. En premier lieu, cela nuirait à la qualité des références jurisprudentielles. En effet, les décisions de justice importantes sont souvent nommées d’après le nom des parties (comment l’illustrent les célèbres arrêts Clément Bayard, Jand’heur ou plus récemment Perruche ou Cœur Défense) et restent ainsi ancrées dans la mémoire du Droit. Ce procédé créerait en outre une justice anonyme et algorithmique, et ferait oublier que la justice doit être rendue « au nom du peuple français », par des juges et entre des plaideurs identifiés. Enfin, il s’agirait d’une chimère dès lors qu’il demeurerait très facile de retrouver le nom d’une partie à un procès lorsqu’une affaire juridique est médiatisée, en entrant les informations de l’affaire sur un moteur de recherche[37]