Cette séance de cours traite de l'importance du traitement multilingue des langues naturelles (NLP) dans la lutte contre la fracture numérique entre les langues. L'instructeur met en évidence l'état actuel des modèles linguistiques multilingues et les défis rencontrés dans la mise à l'échelle de ces modèles pour accueillir de nombreuses langues. Avec environ 7 000 langues parlées dans le monde, la séance de cours souligne la disparité dans la représentation, car seules quelques centaines de langues sont adéquatement représentées en ligne. L'instructeur explique les deux principales approches de la PNL multilingue: la PNL monolingue en plusieurs langues et la PNL multilingue, qui vise à apprendre les langues conjointement. La discussion porte sur l’importance de la qualité et de la disponibilité des données, ainsi que sur les préjugés culturels inhérents aux modèles de PNL existants. La séance de cours couvre également le concept de transfert multilingue, où les connaissances des langues à ressources élevées sont appliquées aux langues à faibles ressources. Enfin, l'instructeur aborde la malédiction du multilinguisme, où l'ajout de langues peut entraîner une diminution des performances, et suggère des solutions potentielles pour améliorer les systèmes de PNL multilingues.