Lingua Libre est un outil et un projet collaboratif en ligne visant à constituer un corpus audiovisuel multilingue. Développé par l’association Wikimédia France, il est placé sous licence libre, comme les autres projets du mouvement Wikimédia. Lingua Libre permet d’enregistrer des mots, des locutions ou des phrases de toutes les langues, orales (enregistrement audio) ou signées (enregistrement vidéo). Les mots sont présentés au locuteur sous la forme d’une liste, créée en direct ou à l’avance, ou réutilisant une catégorie Wikimédia existante. Le locuteur lit simplement le mot affiché à l’écran, et le logiciel passe au mot suivant lorsqu’il détecte un silence après le mot lu. Ce principe, repris du logiciel open source Shtooka recorder avec l'aide de son créateur, Nicolas Vion, permet d’enregistrer plusieurs centaines de mots par heure. Les enregistrements sont ensuite téléversés automatiquement depuis le client web vers la médiathèque Wikimedia Commons. Le projet est intégré à et soutenu par la communauté wikimédienne. Les enregistrements sont consultables à la fois sur Lingua Libre et sur Commons. Ils sont principalement utilisés sur d’autres projets Wikimédia, afin par exemple d’illustrer des entrées sur le Wiktionnaire ou des noms propres dans des articles Wikipédia. Ils sont également produits et utilisés par le Dico des Ados. La réutilisation des enregistrements dans un cadre d’enseignement des langues est envisagée. Les enregistrements sont également réutilisés dans des projets de traitement automatique des langues, notamment pour entraîner les moteurs de reconnaissance vocale DeepSpeech de Mozilla. Lingua Libre est lancé le 23 janvier 2015. Lingua Libre a connu trois versions principales. Dans le cadre du projet Langues de France, ayant pour objectif de documenter et valoriser les langues régionales de France sur les projets Wikimédia et internet de manière générale, la conception de Lingua Libre démarre en novembre 2015, en partie subventionnée par la Délégation générale à la langue française et aux langues de France (DGLFLF).