Cette séance de cours couvre le développement de dhSegment, un package open source pour la segmentation de documents à l'aide de PyTorch. Initialement implémenté dans TensorFlow, dhSegment a été porté à PyTorch pour intégrer plus facilement des architectures de pointe. La séance de cours traite des défis de l'analyse automatique des documents, de la transition de TensorFlow à PyTorch et des améliorations apportées à dhSegment. Les sujets spécifiques incluent la segmentation sémantique de l'image, la reconnaissance d'objets, la reconnaissance de texte et les systèmes d'analyse.