01/09/2008

Un défaut commun aux bases de données juridiques : les réponses doublonnées

Les vacances sont propices au travail ! Voilà un paradoxe digne de la poésie baroque. Mes collègues le savent, cependant : quoi de mieux que les vacances pour mettre la première ou la dernière main à un ouvrage, pour rattraper les retards accumulés dans la remise de ses articles, pour terminer sa contribution à des Mélanges pour lesquels la date de souscription est déjà dépassée ?

Note à destination des éditeurs juridiques avec lesquels je suis lié contractuellement et qui s'aventureraient sur ces pages : Je n'ai parlé que de mes collègues !

Et pour travailler, loin des universités et des bibliothèques aux portes closes il y a deux solutions.

Disposer chez soi de la 1e édition du Traité des contrats administratifs (3 vol 1956-57).

Ou

Disposer d'un accès distant sur les bases de données des grands éditeurs juridiques.

Si je bénéficiais de la première de ces solutions, je ne le clamerais pas sur les toits. Pensez vous, quelque doctorant ayant consommé ses droits à ATERat risquerait de le dérober pour le revendre à la Mémoire du droit.

Mais en revanche, grâce à l'initiative de mon université de rattachement, je bénéficie de la seconde depuis quelques semaines.

Qu'on y songe.

Dalloz
Lamyline Reflex
Lexis-Nexis
Lextenso

Un vrai pousse au crime.

Une fois que j'ai eu fini de taper « Rolin » dans tous les formulaires, puis de taper « X » et « Y » pour m'assurer qu'ils étaient bien moins cités que moi, bref, une fois que j'ai eu épuisé les charmes de l'égologie juridique, j'ai essayé de travailler sérieusement.

(Nota : en vérité le recensement des citations n'est pas si essentiel que cela, c'est plutôt le recensement des non-citations qui est important. Les non universitaires ne doivent pas savoir la torture du chercheur qui voit, sur son sujet fétiche, son œuvre méticuleusement ignorée par ses suiveurs. Ou encore, la citation bancale, comme ce docteur qui retrouve sous la plume de son directeur de thèse, la citation de sa thèse avec une faute à son nom et une erreur dans le titre de la thèse...).

D'ailleurs à ce propos je signale dans le dernier numéro de la Revue X de droit Y que j'aurais dû être cité par M... à propos du régime du retrait des décisions d'abrogation des actes non réglementaires non créateurs de droit pour motif de fraude. Cette omission n'augure rien de bon lors de son passage devant la  commission de spécialistes euh le comité de sélection de l'Université de Z. dont je serai membre.

Bref, j'ai essayé de travailler et de comparer les interfaces de recherches de chacun de ces outils.

J'avais déjà fourni quelques impressions personnelles sur ces questions.

Je voudrais ici les compléter brièvement.

Il me semble qu'il existe un défaut commun à l'ensemble des plates-formes que j'ai cités (sauf l'exception remarquable de lextenso qui mérite d'être soulignée), c'est la multi-citation des réponses.

Dans Lexis, si le même texte est repris dans plusieurs encyclopédies ou revues, il sera cité dans la liste des réponses autant de fois qu'il y aura de doublons.

Même chose dans Lamyline reflex avec en plus un affichage contextuel moins performant qui fait qu'après avoir ouvert dix fois le même document on finit par s'irriter.

Quant à Dalloz.fr, il annonce toutes matières confondues un nombre mirobolant de résultat, mais on constate ensuite que les références au Recueil Dalloz sont les mêmes que l'on soit dans la matière « droit administratif » ou « droit immobilier ».

Je ne voudrais pas donner l'impression de connaître la pierre philosophale de la bonne base de données juridique, mais il me semble qu'il faudrait au moins veiller à éliminer ces doublons qui font perdre un temps significatif dans les recherches. Et j'ai tendance à penser que cela pourrait s'opérer en cumulant deux outils.

D'abord une structuration des sources orientée « base de données » et non plus « papier ».

Ainsi, pour prendre l'exemple des jurisclasseurs, il est clair que si jadis il était utile de reproduire dans le juris-classeur construction, les fascicules urbanisme qui étaient contenus dans l'encyclopédie de droit administratif (pour les personnes qui ne pouvaient s'abonner à tous les contenus), aujourd'hui, ce doublonnage perd beaucoup de son intérêt. Idem pour la muli-publication des articles dans les différentes version de la semaine juridique.

Ensuite, un outil informatique qui repère les contenus identiques : après tout la comparaison de texte est déjà opérée par les outils anti-plagiat, pourquoi ne pas l'étendre au contrôle des réponses renvoyées à l'auteur d'une requête.

Voilà je soumets ces réflexions à la commaunauté universitaire et éditoriale et je retourne à mes requêtes test (savez vous par exemple que mon blog est cité 13 fois sur lexis, 14 fois sur Dalloz, 6 fois sur Lamy et 5 fois sur Lextenso ? Non, et bien comme ça je vous dispense de la recherche, y compris pour vérifier combien de ces citations sont des auto-citations...).

26/03/2008

Quelques observations sur le contenu et l’ergonomie du site Lexis-Nexis.



Comme je l’ai fait il y a quelques semaines à propos du site Dalloz, je poursuis mon petit tour d’horizon des bases de données juridiques en m’attachant cette fois au site Lexis Nexis, ou du moins à la partie du service intitulée « lexis-nexis jurisclasseur ».

Du point de vue de l’ergonomie du moteur de recherche, il faut le souligner, nous sommes en présence à mon sens, de l’outil le plus abouti. La recherche par opérateurs y est particulièrement simple et accessible, la recherche par type de sources également.

On pourra toutefois formuler un regret qui tient au fait que les opérateurs chronologiques soient prédéfinis (il y a un mois, trois mois, …) mais cela reste une lacune mineure.

La qualité de l’ergonomie de la présentation des résultats souffre davantage de discussions.

De ce point de vue, quatre observations essentielles peuvent être faites.

D’abord, les résultats ne peuvent être triés que par type de source. On aimerait pouvoir les classer par ordre chronologique,selon des critères de pertinence par rapport à la recherche ou même en hiérarchisant à l’intérieur des types de sources les textes : études /chroniques / notules…) il est en effet très frustrant, dans le cadre d’une recherche de fond, de faire ressortir des notes en trois lignes qui n’apportent rien à la matière mais alourdissent les résultats.

Ensuite, il arrive très fréquemment que des contenus (notamment dans les jurisclasseurs mais pas uniquement) soient redondants (ainsi, une bonne partie du jurisclasseur construction est reprise dans le jurisclasseur notarial /géomètre expert /voire administratif), ce qui, pour des recherches qui font déjà sortir de nombreux résultats conduit à des listes infinies avec l’obligation à chaque fois d’aller vérifier si l’on est en présence d’un contenu original ou dupliqué.

Par ailleurs, et cela vaut tout particulièrement pour les nombreuses chroniques thématiques, la recherche est opérée sur l’ensemble de la chronique et non sur les arrêts commentés un par un. Par exemple, si vous tapez « urbanisme et contrat », toutes les chroniques de droit administratif sortent, alors qu’on ne souhaite disposer que des analyses portant sur le rapprochement de ces deux notions. Par ailleurs, l’opérateur de proximité n’est pas toujours efficace puisqu’il faut lui donner une très grande valeur pour être sûr de ne rien rater dans un article. Il est à noter que sur un échantillon de plusieurs dizaines de recherches effectuées ces derniers jours, j’ai relevé ce type de problèmes dans plus de 70% des recherches et constituant souvent plus de 20 % des résultats.

Enfin, si la possibilité de lire en ligne les revues, livraison par livraison est vraiment très intéressante, on peut regretter que pour certaines (JCP-A, DA...) on ne trouve dans les sommaire cliquables que les initulés des contenus sans que soi précisé ni leur nature (information rapide, note, article...) ni leur auteur.

Troisième et dernière série d’observations, elle touche cette fois la qualité globale des sources. J’ai ici quelques critiques que j’énoncerai prudemment pour ne froisser personne.

Il me semble que l’ensemble des sources est marquée par une très grande hétérogénéité. S’agissant des jurisclasseurs, par exemple, certains fascicules sont exceptionnels. D’autres sont utilisables et d’autres encore à peine utilisables, notamment du fait de leur péremption. C’est une vraie difficulté quand on procède à une recherche, notamment dans les domaines que l’on ne maîtrise pas car il est difficile d’arriver à faire le départ entre le bon grain et l’ivraie.

J’aurai également un reproche que je développerai un autre jour de manière plus générale : il me semble que lexis-nexis pratique ce qu’il est convenu d’appeler le « patriotisme éditorial ». Cela signifie que le plus souvent, les articles ou fascicules de jurisclasseur ne citent, notamment à la suite des arrêts, que les commentaires parus dans d’autres publications Lexis-Nexis. Un exemple caricatural puisé dans un article récent, à propos de l’arrêt Tropic : « (CE, ass., 16 juill. 2007, n° 291545, Sté Tropic travaux signalisation : Juris-Data n° 2007-072199 ; JCP A 2007, 2212, note F. Linditch ; JCP A 2007, 2221, note M.-Ch. Rouault ; JCP A 2007, 2227, note B. Seiller ; JCP G 2007, I, 193, chron. B. Plessix ; JCP G 2007, II, 10160 ; Dr. adm. 2007, repère 7 ; Dr. adm. 2007, comm. 142, Ph. Cossalter ; Contrats – Marchés publ. 2007, comm. 254, J.-P. Pietri ; S. Braconnier et F. Brenet, Le contentieux des contrats publics d'affaires : Contrats – Marchés publ. 2007, comm. 8) ».

Je trouve cette pratique assez contestable, en particulier pour les articles ayant une portée doctrinale car si il n’est plus possible, aujourd’hui, de pratiquer des citations exhaustives de toutes les notes d’arrêts, il me semble qu’une partie du travail doctrinal consiste précisément à identifier les commentaires de qualité, et cela ne peut pas passer uniquement par la référence aux « publications maison ».

Enfin, la base jurisprudence (et surtout, vous l’aurez compris la jurisprudence administrative), ne me semble pas reprendre l’ensemble des arrêts que l’on trouve (que l’on trouvait) sur Legifrance. En outre de nombreuses décisions ne figurent que par leurs abstracts juris-data qui, s’ils sont de qualité, n’emploient pas toujours le même vocabulaire que les tables du recueil Lebon. Or, l’homogénéité terminologiques me semble être un critère important pour la qualité de recherches jurisprudentielles.

Pour conclure si, comme, d’habitude, j’ai d’avantage mis l’accent sur les critiques que sur les compliments, il reste que ce service est sans doute le plus performant de ceux que qu’il m’a été donné d’utiliser : mémorisation des recherches, des documents consultés, veilles sur les recherches, lien hypertextes vers les arrêts ou les textes cités, tout cela est du bel ouvrage.



06/02/2008

Modernisation de HUDOC : la Cour EDH sollicite l'avis des utilisateurs par un questionnaire

 

On pourra considérer qu'il s'agit d'une marotte, qu'après l'état d'urgence, sciences-po, le DALO, je fais une nouvelle démonstration de ma monomanie séquentielle.


De fait, je ne démentirai pas.


Mais il n'en reste pas moins que la différence de démarche est frappante entre la Cour EDH et notre cher Legifrance (à ce propos, le groupe sur facebook dont j'avais mentionné l'existence atteint désormais le nombre de 113 membres).


La nouvelle version de Legifrance a été conçue de manière strictement interne par l'administration et son prestataire. Un « levé de voile » sur les nouvelles fonctionnalités a été fait quelques semaines avant sa mise en ligne, devant un public d'initiés.


Puis cette mise en ligne a eu lieu et devant les récriminations, un appel aux « améliorations », ou plus exactement à la chasse au bugs a été lancé.


Or voilà que la CEDH envisage de moderniser le site qui permet l'accès à la base de données de ses arrêts, le service HUDOC.


Comment croyez vous que cette organisation internationale procède pour mener à bien cette modernisation ?


Elle procède à la mise en ligne d'un questionnaire.


« Afin d'apporter des améliorations à la base de données HUDOC, dans laquelle est publiée la jurisprudence relative à la Convention, la Cour a mis en ligne un questionnaire destiné aux utilisateurs tant confirmés qu'occasionnels de cette base ».

 

Je vous invite d'ailleurs à y répondre nombreux, car l'ergonomie de cette base n'est pas pour l'instant, des plus efficaces.  


Il restera à déterminer le mode de traitement des réponses ainsi que leur traduction concrète dans la nouvelle application, mais je ne peux m'empêcher de m'adresser aux gestionnaires de Legifrance : n'aurait-il pas été judicieux d'adopter une démarche analogue ?




04/02/2008

Les utilisateurs de Legifrance sur facebook…

Je jure sur la collection complète du recueil Lebon –en version papier ( !) – que je n’y suis pour rien. Mais force est de constater que je ne dois pas être le seul parmi les utilisateurs de la nouvelle version de Legifrance à ne pas retrouver mes petits puisqu’un groupe vient de s’ouvrir sur Facebook intitulé : « le Legifrance nouveau est arrivé, je n’y retrouve plus rien » qui compte déjà, en moins de trois jours d’existence, 34 membres.

 

Au-delà de l’anecdote, on pourra souligner que cet emploi de réseaux sociaux par des utilisateurs de services publics marque sans doute une innovation intéressante puisqu’elle permettra aux gestionnaires de ces services de mesurer la nature et l’ampleur des inquiétudes ou mécontentements qu’ils occasionnent, et elle permettra à ces usagers d’acquérir une visibilité nouvelle.

 

Le présent groupe en fournira une bonne illustration : si le chiffre de ses membres ne croit pas considérablement, il pourra être traité en quantité négligeable, en revanche, s’il atteint un chiffre respectable, il portera la démonstration que les critiques entendues ici ou là ne sont pas isolées mais traduisent un mécontentement global qui devra être entendu.

 

La seule limite à ce type d’initiative, provient naturellement du fait que la critique prime fréquemment sur les propositions d’amélioration. A moins que les gestionnaires de Legifrance ne sollicitent ce groupe en ce sens. Ce serait alors l’acte de naissance d’une « administration 2.0 » ! fol espoir ou perspective réaliste, nous verrons bien.

22/01/2008

Recensons les dysfonctionnements de la nouvelle version de Legifrance



Comme d'habitude, mon précédent billet m'a valu de nouvelles inimitiés. C'est étonnant comme, quand on dit les choses telles qu'elles sont, cela peut-être mal pris.


L'ensemble des retours que j'ai pu avoir, que ce soit dans les commentaires sous cette note, ou dans des discussions avec des collègues, montre que la réception de cette nouvelle version est globalement très négative.


Parmi les utilisateurs que je connais, personne n'est sensible à la principale amélioration, cette tentative cybernétique de pouvoir fournir la disposition en vigueur de chaque texte, à chaque date envisageable, dans le passé comme dans l'avenir (!).


En revanche, les mêmes utilisateurs sont fort mécontents des insuffisances ergonomiques des différents services, sans compter les problèmes d'alimentation des bases.


Laissons donc la polémique.


Et devenons constructifs.


Notez, amis lecteurs que la précédente phrase est au pluriel, car j'envisage de vous mettre à contribution.


Je voudrais que nous entreprenions de fournir au webmaster de Legifrance une liste de nos principales doléances pour que celles-ci puissent être prises en compte dans le cadre du debugage de l'application.


Je vous propose de distinguer deux catégories :


  • les questions d'ergonomie ;

  • les questions de fond.


Et dans chacune de ces catégories, de distinguer chacune des bases (Lois / réglements ; Codes ; jurisprudence judiciaire / administrative ; Autres).


Pour que la discussion soit fructueuse, j'essaierai de reprendre dans ce billet chacune des propositions faites pour que la discussion s'instaure.


Et enfin, quand nous aurons finalisé tout cela, je vous propose que nous adressions un envoi en Grande Pompe de cette liste de propositions aux autorités compétentes, pour que, cette fois, nous soyions enfin écoutés.


Je vous remercie d'avance pour vos contributions.