Dans le domaine de la comptabilité fournisseurs, il est bien connu que la fin d'une facture fournisseur dans sa comptabilisation, et tous les éléments d'amélioration que nous introduisons dans le processus de la facture fournisseur doivent viser à réduire le cycle de comptabilisation ainsi que le coût du processus autant que possible. C'est pourquoi la numérisation des factures est une avancée imminente.
Processus de numérisation des factures
Dans le cadre d'un processus de numérisation des factures fournisseurs, nous pouvons définir 4 phases principales :
- 1. la facturation et la comparaison à 2 ou 3 voies avec la commande.
- 2. Approbation des factures,pour l'acceptation des factures sur la base de critères commerciaux.
- 3. Résolution des incidents, catégorisation des exceptions pour la résolution des procédures.
- 4. Comptabilisation automatique des factures.
Toutes ces phases de numérisation des factures sont automatisées par des outils de workflow, comme nous l'avons mentionné dans notre précédent billet, mais il y a une condition de base pour leur fonctionnement : les données contenues dans les factures doivent être disponibles. Ce point ne pose pas de problème pour les factures électroniques, puisque toutes les informations de base de la facture sont contenues de manière structurée dans le fichier, mais qu'en est-il des factures papier et des factures reçues par e-mail au format PDF ?
Processus de numérisation des factures : outils et fonctionnalités
Le traitement des factures papier et des factures PDF précédemment scannées nécessite un outil OCR (Optical Character Recognition) pour l'extraction des données.
Qu'est-ce que l'OCR ?
L'OCR nous permet d'extraire les données de la facture et de les utiliser pour le traitement ultérieur de la facture.
Chez easyap, nous utilisons différentes plateformes OCR de premier ordre pour le traitement des factures papier et PDF. L'utilisation de ces plateformes depuis plus de 12 ans nous a permis d'acquérir une expérience très importante lorsqu'il s'agit de connaître le potentiel réel, les limites et les dépendances de ces plateformes.
Fonctionnalité de la plate-forme OCR
Les plates-formes d'OCR sont d'une grande aide, mais elles sont loin d'être des solutions autonomes et loin d'être des outils "prêts à l'emploi" qui peuvent fonctionner sans surveillance et sans développement et maintenance récurrents. En général, un outil d'OCR doit couvrir les étapes suivantes :
- 1) Classification des documents: dans la section relative aux factures, il doit être possible au moins d'identifier et de séparer les factures et leurs pièces jointes.
- 2. OCR, pour la reconnaissance des données de la facture. En fonction de la technologie utilisée, cette phase peut nécessiter un travail de paramétrage préalable plus ou moins important.
- 3. la validation manuelle des factures, pour la correction des données extraites par erreur par l'OCR. Il convient de noter que cette phase n'est pas facultative, car le traitement automatique des factures après OCR sans validation manuelle n'est pas possible compte tenu du taux d'erreurs produit.
- 4. Contrôle de la qualité, pour la résolution d'incidents typiques des phases précédentes tels que : plus d'un document par facture, images de mauvaise qualité, rotation des images,...
En ce qui concerne les plates-formes d'OCR, il existe deux grandes catégories : l'OCR basée sur un modèle et l'OCR basée sur des mots-clés. Alors que les premières nécessitent un modèle spécifique par fournisseur, indiquant pour chaque fournisseur où trouver chaque champ de la facture, les secondes requièrent la définition de zones de recherche et de mots-clés pour localiser chaque champ de manière générique pour toutes les factures des fournisseurs. Certains de ces derniers peuvent intégrer un module d'apprentissage qui permet l'auto-création de modèles sur la base de données validées manuellement.
Ils se distinguent également par la possibilité ou non de capturer des lignes de détail.
L'OCR basé sur des modèles présente l'avantage d'un niveau de reconnaissance plus élevé pour chacun des fournisseurs, mais l'inconvénient majeur de la nécessité de définir un modèle pour chaque fournisseur. La définition de modèles nécessite un engagement et une dépendance à l'égard des ressources techniques. Par exemple, il faut en moyenne 12 minutes pour créer un modèle pour un fournisseur pour des factures sans lignes et 19 minutes pour des factures avec des lignes détaillées, et en moyenne un fournisseur change un paramètre affectant le format de la facture tous les 17 mois, ce qui nécessite une nouvelle conception du modèle.
L'OCR par mot-clé a un taux de réussite plus faible, et des "faux positifs" sont générés lors de la localisation des champs de la facture, mais elle implique un paramétrage moins récurrent. La préconfiguration, bien que mineure, nécessite des ressources techniques avec un haut degré d'expertise.
Plates-formes OCR : Localisation des données
En ce qui concerne la localisation des données de facturation et le degré de réussite, on peut distinguer 4 groupes principaux
- - Données numériques: la lecture des données numériques est assez précise, en particulier celles qui peuvent être validées arithmétiquement et surtout dans les factures comportant des taxes. Les factures comportant plusieurs bases et les factures provenant de pays où il n'y a pas de TVA ou une taxe de 0 % ont un degré de complexité plus élevé dans leur saisie automatique par OCR et ont donc un taux d'erreur plus élevé.
- - Données pouvant être validées par rapport à des sources externes : telles que les CIF des fournisseurs et des clients. La validation des données reconnues par rapport à des bases de données externes augmente le degré de précision en mode automatique.
- - Données ayant un format prédéfini: comme les numéros de commande ou les dates. Il est très courant que les numéros de commande suivent un modèle en termes de longueur et de plage numérique, et la recherche de données via l'emplacement de formats spécifiques simplifie la procédure et améliore le taux de réussite.
- - Champs non structurés ou sans format prédéfini : tels que le numéro de facture, le numéro de bon de livraison du fournisseur, le bureau, le département, etc... Comme il n'existe pas de modèle de recherche universel, ces champs ont le taux d'erreur le plus élevé en matière de reconnaissance automatique.
- - Lignes de détail: pour les factures accompagnées de bons de commande, l'extraction des lignes de la facture est généralement nécessaire pour la comparaison avec les bons de commande et/ou les reçus. Il s'agit de l'élément le plus complexe dans sa détection et celui qui nécessite le plus de validation manuelle pour la correction des erreurs. La complexité est telle que tous les logiciels d'OCR ne prennent pas en charge l'extraction des lignes.
Numérisation des factures : OCR
Le processus de numérisation des factures à l'aide d'un outil OCR nécessite des ressources techniques/informatiques pour la configuration, la maintenance et l'adaptation des modèles et des applications, ainsi que des ressources administratives pour les tâches de numérisation, de validation et de contrôle de la qualité.
En résumé, nous pouvons conclure que l'OCR n'est pas un outil utile en soi, car il nécessite l'automatisation d'étapes ultérieures. En outre, à l'heure où l'utilisation de la facturation électronique est en forte hausse et où l'utilisation de factures au format pdf se généralise, l'investissement dans des processus de numérisation et d'OCR des factures ne se justifie qu'avec un volume important de factures.
Un volume de factures papier inférieur à 250 000 par an ne justifie pas l'investissement dans la technologie (logiciel et matériel) ni les ressources techniques et opérationnelles nécessaires à la maintenance et à l'exploitation de la solution.
Pour les factures papier, un modèle basé sur l'externalisation de l'ensemble du processus, y compris le flux de travail, garantit un délai de mise en œuvre court et permet de réaliser des économies de plus de 30 % sur l'ensemble du processus.




