Autodétection

L’autodétection est la procédure qui permet de détecter certains éléments d’un document pour établir son appartenance à un gabarit. La Reconnaissance Optique des Caractères (OCR) détecte les zones​​ préétablies telles que le nom de la compagnie qui émet le document, la date, le numéro de facture, le montant total ou toute autre information pertinente contenue sur un document.

Création d’une nouvelle zone de détection

Pour créer une nouvelle zone de détection sur un document, il faut utiliser la souris et dessiner la zone (clic-glisse). Les zones de détection doivent toujours être un peu plus grandes que le texte ou la valeur que nous tentons de saisir. Les demi-mots coupés en deux sur la longueur ou encore les caractères coupés en deux sur la hauteur ne seront jamais reconnus par l’OCR. La position ainsi que le format de la zone de détection doivent toujours être validés lors de la création des zones de détection. La validation s’effectue en comparant ce qu’il y a réellement sur le document avec le contenu du champ « Texte de la zone détectée par l’OCR ». Cette technique permet d’éviter les erreurs de configuration et s’assurer que tout est conforme.

Voici quelques exemples de bonnes pratiques lors de la​​ création de nouvelles zones de détection :

​​ 

 

Modification d’une zone de détection

En tout temps, il est possible de modifier une zone de détection. Pour modifier une zone de détection, il faut la sélectionner sur le document. Une fois la zone sélectionnée, il est possible de modifier son emplacement, son format ainsi que les configurations de la zone. Pour conserver les modifications, appuyer sur enregistrer.​​ 

Désactivation d’une zone de détection

En tout temps, il est possible de désactiver une zone​​ de détection sur un gabarit. Une fois désactivée, la zone ne sera plus considérée lors de la détection des documents. Les valeurs associées aux champs ne seront plus visibles. Les zones désactivées sont de couleur orange sur les gabarits. Les champs globaux associés aux zones désactivées sont de nouveau disponibles pour être sélectionnés.

Lorsqu’une zone de détection est désactivée, elle peut être réactivée. Au moment de la réactivation, les zones seront de nouveau disponibles. De plus, les valeurs lues par OCR seront de nouveau disponibles.​​ 

Suppression d’une zone de détection

Seulement les zones n’ayant aucune valeur reconnue sur des documents peuvent être supprimées.​​ 

Configuration d’une zone de détection

Cette section traite de toutes les​​ configurations possibles pour une zone de détection.

Nom du champ

Sélectionner le nom du champ parmi la liste de​​ champs globaux. Les champs globaux sont​​ configurés et créés au niveau Système de Viridem. Seulement les utilisateurs ayant les droits applicables peuvent créer ou modifier les champs globaux existants. Lors de la création des gabarits, il est primordial de sélectionner le bon champ global pour​​ la zone de détection prévue afin que les programmes d’exportation, les transitions ou assignations conditionnelles dans les flux de travail fonctionnent adéquatement. Référez-vous au document de référence de votre Intégrateur Viridem pour valider les champs à utiliser dans les gabarits.

Description

Lors de la sélection du champ global, la description prévue (s’il y a en a une de configurée) s’inscrira sous le nom du champ. La description n’a pas de rôle fonctionnel dans la solution. Elle est présente à titre informatif.

Type de champ

Lors de la sélection du champ global, le type de champ prévu dans la configuration du champ global au niveau système s’affichera automatiquement. Il est possible de modifier le type de champ directement dans le gabarit. Si cette​​ méthode est choisie, cela ne modifiera pas les configurations du champ global pour les autres gabarits. Les types de champs globaux permettent de spécifier davantage l’information captée lors de l’OCR. Des filtres de caractères spécifiques aux types de champs sont appliqués et permettent d’augmenter le taux de réussite de l’OCR. Il n’est pas possible de créer de nouveau type de champ. Il y a 5 types de champs globaux soit :​​ 

  • Texte : Les champs de type « Texte » ne filtrent aucun caractère. Les lettres, les​​ chiffres et les caractères spéciaux seront lus.

  • Numérique : Les champs de type « Numérique » filtrent les caractères pour considérer les chiffres uniquement. Tous les « 0 » devant le premier chiffre seront automatiquement retirés.

  • Monétaire : Les​​ champs de type « Monétaire » récupèrent les notions de filtres du type de champs numérique en y ajoutant certains filtres pour traiter les crédits (exemple :​​ ‑10.00 ou encore (10.00)) et retirer les mentions de devises monétaires (exemple : EUR, CAN, USD)​​ et caractères spéciaux (exemple : $). Tous les « 0 » devant le premier chiffre seront automatiquement retirés.

  • Date : Les champs de type « Date » sont appliqués sur les champs où des dates sont récupérées. Ce type de champ permet l’affichage du calendrier​​ lors de la saisie de données sur le document ainsi que d’uniformiser le format de date pour faciliter la recherche.

  • Code-barres : Ce type de champ global est disponible​​ sous licence payante​​ seulement. Il permet la lecture des codes-barres 1D tels que : Code 39, Code 93, Code 128, Codabar, Interleaved 2 of 5, EAN-8, EAN-13, UPC-A, UPC-E, Industrial 2 of 5. Les filtres de​​ caractères spéciaux de ce type de champ permettent la lecture du contenu du code-barre.

Est une liste

Cette configuration permet de lire plusieurs valeurs et les séparer en valeurs distinctes lors du passage de OCR. Cette configuration est utilisée, entre​​ autres, dans les traitements en groupe pour identifier chaque numéro de facture sur les états de compte ou sur les chèques. Les résultats de la lecture de la liste de données seront présentés de cette façon à l’utilisateur :​​