Are you an EPFL student looking for a semester project?
Work with us on data science and visualisation projects, and deploy your project as an app on top of Graph Search.
Ce rapport décrit la réalisation d'une interface permettant à un opérateur d'extraire de l'image d'un texte manuscrit des prototypes de caractères et des les accumuler dans une base de données devant servir ultérieurement à la reconnaissance de l'écrit. L'utilité d'une telle interface intervient dans le cas où la reconnaissance de l'écrit s'applique à de longs documents ayant un style particulier (par ex. documents anciens). La méthode utilisée part d'une représentation des caractères par le contour et résout la difficulté que constitue l'isolement d'un caractère en sur-segmentant légérement l'image des contours par rapport à une segmentation en caractères. L'opérateur rassemble ensuite les segments pour former les prototypes de caractère. This report describes the realisation of an interface by which an operator can extract character prototypes from the image of a handwritten text and accumulate them into a database, which will be used afterwards for text recognition. Such an interface is usefull in the case where text recognition is required for long documents with a particular writing style (e.g. ancient documents). The method applied in this system, based on a boundary representation of characters, solves in the following manner the difficulty of isolating a character. The boundary image is slightly over-segmented with respect to a segmentation into characters. The operator gathers then the segments composing a single character.
Frédéric Kaplan, Maud Ehrmann, Matteo Romanello, Sven-Nicolas Yoann Najem, Emanuela Boros