Auto-apprentissage ou pas ?
Vous vous interrogez sur la pertinence d’un système d’auto-apprentissage intégré à votre solution de reconnaissance automatique de factures ?
Les lignes qui suivent vous concernent.
Les deux approches possibles
Il existe 2 approches de localisation de l’information sur un document :
Analyse géographique basée sur la position de la donnée sur la facture.
Analyse sémantique : détection de la donnée par analyse du texte et détection de mots-clés, formats de données, etc.
L'auto-apprentissage
L’auto-apprentissage consiste à mémoriser une position lorsque l’utilisateur clique sur une zone permettant ainsi de corriger un modèle existant. Cependant comment savoir si cette nouvelle position est définitive ou temporaire ?
Cette technologie d’auto-apprentissage par zone géographique fait bien évidemment partie du panel de technologies ITESOFT dont nous disposons.
Toutefois, nous avons fait le choix de désactiver totalement ces anciennes fonctions d’auto-apprentissage dans Yooz car nous voulons éradiquer toute notion de position géographique d’une donnée (non pérenne, propre à un fournisseur) pour privilégier l’analyse sémantique (pérenne et indépendante du fournisseur).
Par ailleurs, il est important d’avoir en tête que les solutions qui proposent de l’auto-apprentissage sont forcément dans l’un ou l’autre des cas de figure ci-dessous :
soit elles n’ont pas de base de connaissance mutualisée, et dans ce cas l’utilisateur a un travail d’apprentissage très fastidieux à faire en amont pour que la reconnaissance fonctionne,
soit elles ont une base mutualisée, et dans ce cas, si un utilisateur fait une erreur lors du zonage, l’auto-apprentissage est erroné et pénalise du même coup tous les autres clients.
Aucun de ces deux cas ne nous semble convaincant.
L'approche Yooz
La technologie de Yooz est dite « full-text », c’est à dire qu’elle n’implique absolument aucun paramétrage préalable (ni zonage, ni modèles de factures, ni auto-apprentissage). L’intégralité de la facture est lue et reconnue du premier coup sans que l’utilisateur ait quoi que ce soit à faire.
Notre ligne directrice technique est très claire sur ce point : nous ne voulons pas définir un champ par sa position géographique, notamment car cette position pourrait évoluer si la mise en page de la facture venait à changer.
Toutefois, nous sommes, bien entendu, dans une démarche d’amélioration continue. Dès qu’un utilisateur détecte une facture qui pourrait nécessiter une optimisation de reconnaissance, il peut nous la signaler d’un simple clic depuis la plateforme Yooz. Cette facture fera alors l’objet d’un travail d’optimisation par nos spécialistes. Cette optimisation, toujours générique, est basée sur des algorithmes full-text d’analyse sémantique.
Cette évolution bénéficiera à l’ensemble des clients Yooz.
De même, vous bénéficierez de toutes les optimisations qui seraient demandées par d’autres utilisateurs Yooz.
La technologie s’enrichit des demandes d’apprentissage de chacun sans aucun risque de mémoriser des erreurs propres à un utilisateur.