Reconnaissance de texte incorrecte
Si une partie du document original n’est pas convertie en texte correctement
pendant l’OCR, vous pouvez avoir recours aux solutions suivantes :
◆
Examinez l’image de page originale et vérifiez que tous les blocs de
texte sont entourés d’une zone (tout bloc de texte non entouré d’une
zone est ignoré lors de la reconnaissance). Pour plus de détails sur la
création et la modification de zones, consultez la section « Gestion
des zones », page 42.
◆
Vérifiez que les zones de texte sont identifiées correctement. Si
nécessaire, sélectionnez d’autres valeurs de type et/ou de contenu
pour les zones existantes et relancez la reconnaissance du document.
Voir « Types et propriétés de zone », page 41.
◆
Assurez-vous que vous n’avez pas chargé un gabarit incorrect. Si les
bords des zones empiètent sur le texte, la qualité de la
reconnaissance en est affectée.
◆
Ajustez les curseurs de luminosité et de contraste (onglet Scanner de
la boîte de dialogue Options) : vous devrez sans doute essayer
plusieurs combinaisons de réglages pour obtenir le résultat
escompté.
◆
Utilisez les outils de retouche d’images afin d’optimiser votre image
pour l’OCR.
◆
Vérifiez la résolution de l’image originale : placez le curseur sur la
vignette de page voulue pour afficher une mini-fenêtre. Une
résolution bien supérieure ou inférieure à 300 ppp risque d’affecter
la reconnaissance.
◆
Vérifiez que les langues du document ont été correctement
sélectionnées dans les réglages OCR ; seules les langues
effectivement présentes dans le document doivent être sélectionnées.
◆
Activez IntelliTrain et effectuez les corrections nécessaires. Cette
fonction convient tout particulièrement aux polices stylisées et aux
documents présentant une dégradation uniforme. Si IntelliTrain
était actif lors de l’OCR, désactivez-le car il n’est pas destiné à
certains types de documents très dégradés.
Chapitre 7
Dépannage
91
◆
Exécutez un apprentissage manuel ou éditez les données
d’apprentissage existantes pour supprimer toute valeur incorrecte.
Les conseils précédents, relatifs à Intellitrain et à l'apprentissage, ne
s'appliquent pas à OmniPage SE.
◆
Si vous activez le mode True Page dans l’éditeur de texte pour
l’affichage ou l’exportation, le texte reconnu est placé dans des
cadres ou des blocs de texte. Si l’un de ces blocs de texte est trop
petit, une partie du texte peut être masquée. Pour afficher le texte
caché, placez le curseur dans ce bloc de texte et utilisez les touches
flèches du clavier pour faire défiler le texte dans la direction requise.
◆
Vérifiez la vitre, les miroirs et les objectifs du scanner. Éliminez les
traces de doigt et de poussière.
Do'stlaringiz bilan baham: |