Big data juridique : enjeux et opportunités
Une fois n’est pas coutume, dans les locaux de l’École de formation des barreaux de la cour d’appel de Paris le 8 décembre 2015, il a été question de sémantisation, d’algorithmes, de machines apprenantes, de communs numériques, d’identifiants ECLI, de requêtes SPARQL, de crap data et de data lake… L’association Juriconnexion y organisait une journée de formation et de réflexion autour des enjeux et des opportunités du big data juridique. Retour sur quelques unes des interventions de la journée.
« Le potentiel du big data est gigantesque », a déclaré derechef Benjamin Jean, président de l’association Open Law et dirigeant de la société Inno3. Avant d’en pointer les limites : « Cela demande une expertise dont peu de gens disposent aujourd’hui, et il ne faut pas oublier les risques de déviances qui y sont associés en termes de contrôle de ces données. » Et d’insister sur l’intérêt que présente sur ce terrain l’open data (bases de données sous licences qui permettent la réutilisation par tous), et sur le nécessaire dialogue qui commence à s’instaurer « entre ceux qui collectent des données sans jamais les partager et ceux qui veulent tout partager ». (voir la vidéo de l'intervention de Benjamin Jean)
Le big data, tout un monde d’incertitudes
« Le big data, ce n’est pas nouveau, cela a quinze ans, mais les problématiques ont changé », a ensuite expliqué Jean-Pierre Malle, data scientist, expert en data intelligence et consultant de la société M8 : « Aujourd’hui, on ne peut plus traiter toute l’information car le volume de production des données est trop important et la capacité de traitement reste beaucoup plus faible que la capacité de production des données. » De même que la capacité de stockage. Aussi faut-il désormais « intégrer cette incapacité à être exhaustif dans nos méthodes de traitement, c’est à dire accepter la nécessité de n’exploiter que les données essentielles et le risque de ne pas capter les signaux faibles ». De plus, « en matière de sémantique, le sens des mots change au fil du temps et cela introduit de l’incertitude dans le traitement des données ». Et dans le vaste monde du big data, « on trouve des données non structurées, évolutives, interprétables… ». Autant « de sources d’incertitude qu’il faut intégrer dans les processus de traitement des données ». Enfin, « on manque de data scientists », a-t-il ajouté. Avant de conclure : « Le talon d’Achille du big data, c’est la protection des données personnelles. » (voir la vidéo de l'intervention de Jean-Pierre Malle)
C’est à François Pelligrini, professeur en informatique à l’Université de Bordeaux et chercheur au LaBRI et à l’Inria, qu’a été confiée la mission d’exposer les grands principes de la protection des données personnelles, ainsi que les grandes lignes de la révision – en cours – de la directive européenne en la matière. « La question de la sécurisation des données devient de plus en plus complexe avec les chaines de sous-traitants et le stockage sur le cloud, a-t-il relevé. Idéalement, il faudrait une convention internationale de la protection des données. Dans l’immédiat, on peut le faire à l’échelle européenne dans le cadre de la directive en cours de révision. »
Big data juridique : appel à contributions
Responsable de la stratégie au sein de la Délégation à l’innovation de la DILA (Direction de l’information légale et administrative), Thomas Saint-Aubin a dressé un état des lieux du big data juridique en France. Il a choisi de mettre l’accent sur « les domaines dans lesquels ça bouge ». À commencer par l’ouverture des données juridiques françaises : « Cela va désormais très vite : après les lois, décrets et conventions collectives et, depuis septembre 2015, la jurisprudence nationale, ce sont les données du RNCS qui seront bientôt librement accessibles. (…) Cela redistribue les cartes entre les professionnels du droit, les éditeurs juridiques, l’État et la legal tech [les start up du droit, ndlr]. » En ce qui concerne la doctrine, le projet open collector de doctrine « consiste à créer une base permettant d’avoir accès à toutes les sources de doctrine francophones et européennes publiées sur Internet, et d’évaluer les articles par crowdsourcing. »
Du côté des acteurs privés, Thomas Saint-Aubin a relevé l’émergence d’initiatives telles que Jurismatic, un site internet sur lequel un cabinet d’avocats a mis à disposition gratuite des actes et contrats en open content (licence creative commons). Autre initiative, associant cette fois acteurs privés et publics : le programme Open Law, dont les travaux visent « à créer des communs numériques du droit et un réseau de données liées, qui vont ensuite ouvrir de vastes possibilités en termes d’applications ». « L’ébauche d’un réseau de données liées constitue par ailleurs un enjeu géostratégique pour le droit continental : soit nous réussissons à mettre des choses “en communs“, soit nous restons avec des ressources de big data éparses et nous ne serons jamais compétitifs à l’international », a-t-il pointé. Et de lancer un appel à contributions : « Le big data juridique est à portée de main mais la DILA ne peut pas le faire seule, d’où sa volonté d’ouverture vers la legal tech et les professionnels du droit. Nous avons en France les meilleurs spécialistes du traitement des données et nous sommes un pays très respectueux des données personnelles : tout est réuni pour que la France assume un leadership en matière de big data juridique, sous réserve que l’on arrive à travailler tous ensemble. » (voir la vidéo de l'intervention de Thomas Saint-Aubin)
Des applications concrètes en cours de développement
Une partie de l’après-midi a été consacrée à la présentation d’applications concrètes de l’exploitation du big data en matière juridique. Fondateur de la société informatique OOFFEE, Florent André a présenté le projet “Mon dashboard d’entreprise”, co-développé dans le cadre du programme Open Law avec la DILA, Pôle Emploi et l’Institut Mines Telecom. Ce dernier consiste à récupérer toutes les données sur les entreprises dont disposent les différentes administrations afin que chaque société puisse y avoir accès via une seule et même interface, qui fournira également des informations personnalisées en fonction du profil et de l’activité de l’entreprise : formalités obligatoires, réglementations applicables, possibilités d’aides et de subventions, etc. Un projet qui implique « un gros travail pour rendre les données interopérables entre elles car les sources et les formats sont très variés », a précisé le jeune entrepreneur. Il a ensuite présenté le projet RIPSA, pour “Répertoire intelligent des procédures silence vaut accord”, également développé dans le cadre du programme Open Law, et qui vise la création d’un site internet recensant et permettant d’accéder via un moteur de recherche thématique à l’ensemble des 4 000 procédures concernées (textes de référence compris).
Le prochain programme d'Open Law
Président de l’association Juriconnexion, Jean Gasnault a ensuite présenté les futurs travaux et réflexions qui seront menés dans le cadre du prochain programme d’Open Law, et pour lesquels « nous recherchons des partenaires, éditeurs juridiques, cabinets d’avocats… Nous allons également solliciter Bercy et la Chancellerie », a-t-il précisé. Entre février et juillet 2016, le programme “économie numérique du droit” porté par Open Law, l’ADIJ et l’Ordre des avocats au barreau de Paris, s’articulera autour de plusieurs projets qui portent sur « l’e-justice et les possibles interactions entre les avocats et la legal tech », « la formation des juristes et des documentalistes juridiques, en incluant la legal tech pour inciter les différents acteurs à travailler ensemble », « une réflexion sur l’interprofessionnalité, les partenariats et le financement des innovations numériques, pour trouver des cadres juridiques permettant la collaboration entre les juristes et la legal tech », a énuméré Jean Gasnault. Avant d’ajouter qu’un dernier projet visera à « créer un lieu où tous les acteurs pourront échanger et travailler ensemble, et prototyper des plateformes de justice en ligne ».
Miren Lartigue
Cet article a été publié dans la Lettre des juristes d'affaires 1236-1237 du 21 décembre 2015