Accueil / Langues de France / Retour sur le hackathon Lingua Libre 2021

Retour sur le hackathon Lingua Libre 2021

Posted on
Un hackathon dédié au projet Lingua Libre s’est tenu à Lyon les 1er et 2 juillet 2021. Organisé par l’Institut international pour la Francophonie dans le cadre du projet de Dictionnaire des francophones, il a permis d’apporter plusieurs améliorations et pistes d’améliorations techniques à Lingua Libre.

Une rencontre dédiée à Lingua Libre

Lingua Libre est un outil et un projet créé par l’association Wikimédia France. Son objectif est de constituer un corpus d’enregistrements de prononciations sous licence libre, dans le but de documenter la diversité linguistique orale du monde entier. Cet outil, accessible à tous, permet d’enregistrer facilement un grand nombre de mots et d’envoyer les fichiers dans une médiathèque numérique. Dans le cadre du projet Lingua Libre, plus de 500 000 enregistrements ont déjà été réalisés, dont plus de 220 000 en français.

Dans la dynamique du Dictionnaire des francophones

Le Dictionnaire des francophones (DDF) est un projet impulsé par le Ministère de la Culture par le biais de la Délégation générale à la langue française et aux langues de France (DGLFLF) et réalisé par l’Institut international pour la Francophonie, une composante de l’Université Jean Moulin Lyon III. La DGLFLF soutient Lingua Libre depuis trois ans et a d’ailleurs soutenu l’organisation de cet évènement. 
 
Le Dictionnaire des francophones est une base de connaissances sur les mots qui intègre plusieurs ressources libres ou ouvertes et permet un enrichissement participatif. Il intègre notamment le Wiktionnaire. Outre les définitions, le DDF proposera prochainement d’écouter ses entrées prononcées par des francophones du monde entier, grâce à la phonothèque Lingua Libre. De même que pour les définitions, l’ordre d’affichage des fichiers audios sera dynamique et dépendra de l’indication de géolocalisation donnée par le lectorat afin de proposer les prononciations d’ici et d’ailleurs. 
 
Bien que nativement numérique, le DDF se déploie dans l’ensemble de la Francophonie et vise à la mise en place d’ateliers de contributions qui pourront également intégrer Lingua Libre afin de collecter des définitions et des accents francophones.

Un chemin libre

Cet événement a été en partie financé par Wikimédia France par le biais du mécanisme de micro-financement, ainsi que par la structure qui l’a accueilli, l’Institut international pour la Francophonie. Depuis 2020, des conventions de partenariat rapprochent ces deux structures autour du Dictionnaire des francophones, avec d’abord l’accueil pendant un an du premier Wiktionnariste en résidence, dont le blog s’était fait l’écho. Sébastien Gathier (Seb en Résidence (2IF)) était chargé d’améliorer les données du Wiktionnaire, dont l’intégration dans le Dictionnaire des francophones posait de nombreuses difficultés. Cette collaboration s’est poursuivie en 2021 avec le premier dispositif de Lingua Libriste en résidence dont bénéficie Lucas Prégaldiny alias WikiLucas00. Il est en charge de préparer l’intégration des prononciations audio en français au Dictionnaire des francophones. WikiLucas00 travaille donc à rendre l’outil plus simple d’utilisation pour couvrir plus d’entrées et permettre à plus de locuteurs et locutrices d’enregistrer leurs accents, afin de mieux refléter la diversité francophone. Ce séjour prend la forme d’un stage pendant son Master en Industries de la langue, et Sébastien est son tuteur de stage.
WikiLucas00 travaillant dans le centre de documentation de l'Institut international pour la Francophonie

Un hackathon à l’université

Les Wikimédiens de l’équipe du Dictionnaire des francophones (Noé Gasparini “Noé”, Sébastien Gathier “Sebleouf” et Lucas Prégaldiny “WikiLucas00”) ont invité quatre contributeurs développeurs (Pamputt, Poslovitch, VIGNERON et Yug) pour deux jours de hackathon à Lyon, dans les locaux de l’Université Jean Moulin Lyon III. Un hackathon (ou programmathon) est un événement ponctuel réunissant des développeurs et développeuses dans le but de travailler ensemble à l’évolution d’un projet informatique. Si ce type d’événement est courant dans le monde du logiciel libre ou dans celui de l’innovation, il est assez rare dans le cadre de la recherche académique.

Lingua Libre Hackathon Lyon juillet 2021
Lingua Libristes en action

Des avancées collectives

Ces deux jours de conception collective et de développement ont permis d’apporter plusieurs changements à Lingua Libre, tels que l’amélioration de la documentation opérationnelle, ainsi que la libération de près de 10 Go d’espace sur le serveur, du fait de fichiers temporaires qui n’étaient pas supprimés. Ce hackathon était également l’occasion d’améliorer le code de Lingua Libre Bot, le programme s’occupant d’ajouter les enregistrements sur les Wiktionnaire. Un nouveau statut d’utilisateur a été mis en place avec l’accord de la communauté, celui d’administrateur de traduction (2 contributeurs ont reçu ce statut).
Les participants ont travaillé sur de nouvelles fonctionnalités de la Wikibase du site, notamment la création d’un élément lié à une liste afin de lui attribuer des métadonnées ainsi qu’une propriété pour classer les listes par importance et, à terme, les considérer comme “listes recommandées”. Les enregistrements problématiques peuvent maintenant être signalés grâce à une propriété dédiée.
Enfin, un nouveau modèle a été mis en place sur le Wiktionnaire francophone, afin de marquer les pages pour lesquelles une prononciation audio est souhaitée. Les pages sont ainsi rangées dans une catégorie qu’il est possible de récupérer depuis Lingua Libre.

Au niveau du développement

De nombreuses pistes de développement ont également été ouvertes pour les mois à venir. Le point de départ est la mise en place d’un environnement de développement, qui permettra aux développeurs de réaliser des tests sans risquer de perturber le fonctionnement du site.
Les jeux de données devraient être à nouveau tenus à jour, et leur interface sera améliorée prochainement.
Une importante modification devrait toucher l’expérience utilisateur dans l’espace des listes. L’outil de création de listes sera repensé, pour plus d’adaptabilité aux utilisateurs, à leur localisation et à leurs centres d’intérêts. Des listes pourront être générées en direct par le Record Wizard grâce à des requêtes SPARQL vers Lingua Libre, Wikidata ou le Dictionnaire des francophones. Elles pourront également provenir de catégories Wikivoyage. Il sera possible de charger des listes partiellement, ce qui n’était pas encore faisable.

Au niveau du module d’enregistrement

Un important changement concernera la refonte en profondeur du Record Wizard, portée bénévolement par Florian Cuny (Poslovitch), dans le but d’améliorer l’expérience utilisateur en prenant en charge les éléments décrits plus haut ainsi que par des détails esthétiques et pratiques.
Les participants ont également réfléchi à la mise en place d’un moteur de recherche prédictif tel que CirrusSearch, ainsi que d’un outil de mesure des visites et de l’utilisation (Matomo).
 
Les participants travailleront de nouveau sur Lingua Libre ensemble, ainsi qu’avec d’autres développeurs, lors des 24 premières heures de la Wikimania 2021, dédiées au traditionnel hackathon de l’événement. Une présentation de l’outil sera également donnée par Lucas à cette occasion.

Une soirée au KoToPo

À la fin de la première journée de hackathon, les participants se sont retrouvés au KoToPo, dans le 1er arrondissement de Lyon, afin de participer à la permanence mensuelle du Wiktionnaire. L’occasion de découvrir cet espace culturel unique, de rencontrer le groupe local, ainsi que des Wikimédiens de passage à Lyon. Une vingtaine de personnes ont ainsi pu partager de vive voix leurs rêves wikimédiens !
Des membres du groupe lyonnais qui discutent au KoToPo lors de la permanence de juillet 2021

Recevez nos courriels

Abonnez-vous pour découvrir nos projets actuels et à venir.

Parlez à un être humain

Des questions sur notre association ou sur nos projets ? Contactez notre équipe.

Contact →

Nous suivre sur les réseaux sociaux
Crédits images
Wiki Lucas00, CC BY-SA 4.0
Lingua Libre Hackathon Lyon juillet 2021
PasNad, CC BY-SA 4.0
Wiki Lucas00, CC BY-SA 4.0
Noé, CC BY-SA 4.0
Wikinade, CC BY-SA 4.0
Top