Comment fonctionne un ocr?

J'aimerais bien explorer l'idée de créer un OCR, je ne parle pas de programmer un OCR fonctionnel et utilisable mais juste pour m’amuser un peu, peu importe le résultat.

Je sais que les ocrs convertissent d'abord l'Image RGB en image binaire, c'est plus simple à gérer, et après? dois-je découper l'image en en lignes d'abord? j'imagine que ça va me faciliter la tache, mais j'aimerai aussi que mon ocr soit capable de reconnaître une salade de caractères, donc le mieux c'est d'isolé les caractères un par un, ça va créer la différence par apport aux autres ocrs qui ne sont pas capables de lire des lignes inclinées.

Mais il y a un autre problème, les i, les j et les caractères accentués sont composés de deux objets, certaines polices découpent les caractères en plusieurs objets, d'autres les joignent à la manière de l’écriture manuscrite, est ce que quelqu'un à une idée simple pour remédier à ça, parce que si c'est compliqué je préfère lâcher l'affaire, je n'aime pas jouer au puzzle.
 

etre2en1

intersex people are cool
VIB
Jusqu'à présent aucun logiciel OCR n'a été capable de comprendre ce que j'écris pourtant j'écris avec des caractères identiques à ceux que j'utilise sur pc, un logiciel même pas capable de comprendre une écriture de pc.

Méthode pour séparer les lettres en écriture manuscrite :
délimiter la zone en éliminant la zone vide autour du texte,
convertir l'image du texte en points dans une grille,
utiliser une grille de comparaison pour vérifier et reconnaître les caractères.

Certains OCR proposent d'entrer soi même ses caractères manuscrits 1 à 1 pour que ensuite ils les reconnaissent.
Pour les accents il faut prévoir une marge vide autour de la sélection qui va les inclure.
 
Jusqu'à présent aucun logiciel OCR n'a été capable de comprendre ce que j'écris pourtant j'écris avec des caractères identiques à ceux que j'utilise sur pc, un logiciel même pas capable de comprendre une écriture de pc.
Est ce qu tu peux m'envoyer une image?
Méthode pour séparer les lettres en écriture manuscrite :
délimiter la zone en éliminant la zone vide autour du texte,
convertir l'image du texte en points dans une grille,
utiliser une grille de comparaison pour vérifier et reconnaître les caractères.

Certains OCR proposent d'entrer soi même ses caractères manuscrits 1 à 1 pour que ensuite ils les reconnaissent.
Pour les accents il faut prévoir une marge vide autour de la sélection qui va les inclure.
C'est ça, je ne sais pas encre commnent exploiter ton idée, mais je vais voir ce que je peux faire.

Eh bien dis donc, t'es pas seulement 2en1, t'as aussi une double intelligence :D
 

etre2en1

intersex people are cool
VIB
Tu choisis une résolution pour la zone à traiter, tu la découpes en points, tu créés des zones en testant si il y a quelque chose d'écrit ou non, cela créé des blocs écrits et des parties vides, tu peux englober les petites zones dans la plus grande à proximité, c'est une autre méthode.

Dans les 2 cas, tu dois déterminer, si 2 points sont liés ou non pour les réunir en un caractère, pour ça tu dois avoir une marge d'erreur par exemple pour faire une différence entre ... ou _ .
 
Haut