|
La suite Documalis comprend des modules de traitement des documents, de reconnaissance de caractères, de documents et de lecture automatique de contenu, de transformation PDF …
|
Reconnaissance de caractères (OCR)
Documalis pilote les meilleurs moteurs OCR disponibles en fonction du type de document, de la nature des documents et des performances attendue : Transym OCR, Nuance Scansoft, Abbyy Finereader ou ReadIris pour les textes en Arabe.
L’automatisation des processus fournis par Process Server autorise la conversion automatique des documents numérisés en PDF intelligents, ainsi que la lecture de zones particulières en vue d’une indexation ou d’un typage automatique.
Reconnaissance automatique des documents (RAD)
Documalis intègre plusieurs logiques de reconnaissance automatique des documents, qui peuvent travailler indépendamment ou de manière combinée pour des résultats optimums :
• Analyse statistique par pondération de mots clés lus par l’OCR,
• Reconnaissance de formes dans le document (logos, patchs, tampons …)
• Détections de critères statistiques (taille, couleurs, nombre de caractères, type de polices, présence de codes à barres…)
L’intelligence des scenarii Documalis permet d’obtenir des résultats optimums, quelle que soit la nature des documents à analyser, ce qui permet de reconstituer facilement des dossiers de financement, du personnel, d’assurance, sans tri préalable des documents passés au scanner.
|
Cette séparation automatique des documents est également un des piliers de base du
traitement des factures fournisseurs et autres documents structurés, puisqu’elle permet l’application d’un modèle de LAD sur les documents les plus fréquemment rencontrés pour garantir un taux de lecture optimal.
|  |
Lecture automatique des documents (LAD)
Documalis utilise plusieurs méthodes pour la lecture automatique du contenu du document en fonction de la nature de ce dernier :
• Recherche intelligente sur le contenu entier du document non modélisé, avec apprentissage optionnel,
• Recherche zonée en fonction d’un modèle prédéfini et reconnu en RAD pour les documents récurrents,
• Recherche mixte à base de macro-zones et d’expressions régulières prédéfinies pour une tolérance maximale,
• Recherche d’éléments typographiques, codes à barres, cases à cocher, choix multiples …
• Lecture de formulaires et de peignes manuscrits pour les documents de type enquêtes.
Les résultats de la lecture peuvent être confrontés à des tables de référence (ex liste des villes et codes postaux), contrôlés à partir de
données recherchées dans les applications métier de l’entreprise (ex présence du numéro de commande dans l’ERP), vérifiés à
partir de règles de gestions simples (ex: TTC = HT + TVA ou date facture < date du jour et > date du jour - 6 mois) avant d’être envoyés au vidéocodage pour une fiabilité accrue des données extraites automatiquement.
Recherche automatique d’information (RAI)
La recherche automatique d’information consiste à déterminer un critère d’index ou un type de document à partir d’une liste prédéfinie existant dans une base, un annuaire ou un logiciel métier de l’entreprise.
On utilise pour cela un référentiel des éléments à rechercher et une lecture OCR de la première page, de son entête, de l’enveloppe ou du document complet selon la nature de l’information à rechercher. La recherche peut combiner plusieurs critères, comme la
ville et le code postal, la personne et le service, le conseiller et l’agence, etc. Une liste de résultats affectés d’un score individuel permet de déterminer la fiabilité de la recherche et de présenter les entrées les plus probables dans le choix de vidéocodage.
|
Le traitement du courrier entrant est un cas de figure typique de ce genre de recherche, afin de déterminer le service, le conseiller ou la personne destinatrice, grâce à l’utilisation de l’annuaire interne. Dans le cas d’analyse des bulletins de paie, la liste des matricules permet de séparer et d’identifier facilement le salarié et de ranger automatiquement le document dans la GED. La détermination du client pour les courriers sortants permet de choisir le mode de routage, par courrier physique, email ou transfert EDI …
|  |
Documalis dispose des instructions EAI, ETL et des connecteurs métiers nécessaires à l’extraction et à la synchronisation des tables de référentiel nécessaires à la recherche automatique d’information, ce qui simplifie grandement la mise en œuvre de ce type de processus dans l’entreprise.
Découpage des spools d’impression
Documalis dispose de fonctions de découpage des spools d’impression, autorisant la récupération d’éditions globales comme les bulletins de paie du mois, les factures du jour ou les bons de commande d’un fournisseur, la transformation PDF au besoin, puis le découpage unitaire des pages et la reconstruction des documents multipages selon des
critères de rupture intelligents définis grâce aux scénarii Documalis
|  |
Interfaces de contrôle et de vidéocodage
Documalis fournit des interfaces de contrôles des opérations de RAD et de LAD autorisant un contrôle visuel du document et des valeurs reconnues, la saisie des index manquants, ou le choix de la bonne valeur dans une liste de candidats possibles établis par le processus de reconnaissance automatique.
Cette étape de contrôle et ressaisie peut être effectuée en interne ou sous-traitée auprès de partenaires Documalis certifiées pour leur sérieux et la qualité de leur prestations. Dans ce dernier cas, le transfert des images à vidéo coder peut être automatisé, anonymisé et sécurisé de bout en bout grâces aux logiciels Documalis.
Formats PDF « intelligents » avec texte, image et signature électronique
Documalis génère des documents PDF optimisés en taille, incluant le texte et l’image sur des couches séparées, la signature numérique et la gestion des métadonnées, tampons et annotations internes au document pour une traçabilité maximale de l’information liée au document.
L’outil de reporting intégré permet également la création de documents PDF composites incluant les données d’origine (spool, image numérisée), des ajouts visuels de type fond de page et toutes les informations visuelles de suivi nécessaire au traitement du document ou à sa traçabilité.
Traitements en hautes volumétries
Le moteur de traitement documentaire Documalis Process Server a été nativement conçu
pour des implémentations hautement parallèles, afin de pouvoir compenser les temps de
traitement importants des processus OCR-LAD-RAD par une mise en œuvre de
serveurs ultra-économiques sous Windows XP disposant de puissances de calculs énormes
grâce aux processeurs Dual et Quad Core actuels.
|  |
Il est ainsi possible de traiter des dizaines de millions de documents chaque mois sans difficulté particulière.
|
| Voir aussi : |
 |
 |
|