La numérisation n’est pas de la magie (cela y ressemble)

La numérisation n’est pas de la magie (cela y ressemble)

Saviez-vous que la reconnaissance optique de caractères (ROC) – procédé qui utilise des machines pour traduire des mots écrits en diverses formes d’informations – existe depuis plus de 100 ans? Les premiers appareils inventés transformaient automatiquement le texte en code Morse qui pouvait être télégraphié partout au monde.

L'optophone (vers 1914) transformait le texte en tonalités pour que les non-voyants puissent « entendre » le matériel écrit.

Photo courtoisie de : Artiste inconnu, numérisée depuis le « Vetenskapen och livet », le 31 décembre 1921

 

Grâce à l'apprentissage automatique, ainsi qu'aux avancées en intelligence artificielle et à la puissance brute de traitement, la ROC s'est beaucoup améliorée, mais sa principale mission n’a pas changé : extraire l'information bloquée sur le papier avec un très haut taux de précision, tout en réduisant ou en éliminant l'intervention humaine.


La première étape est la reconnaissance des tracés

Remettez à quelqu’un une carte professionnelle et il sait aussitôt de quoi il s’agit, à quoi cela sert et quelle information elle contient – sans même la regarder. L’intelligence humaine reconnaît la forme et remplit les parties vides.

Le logiciel de numérisation évolué fait presque la même chose. En se basant sur la forme et la taille de chaque numérisation, le logiciel peut en déduire si l'objet est une carte professionnelle, un permis de conduire ou un formulaire d'entrée. Ayant une compréhension générale du document, le programme peut facilement prévoir quel type d’information il doit rechercher et où il doit regarder.


Analyse de la disposition

La disposition, qui comprend la taille et les positions relatives des objets sur une page, fournit encore plus de contexte au logiciel de numérisation pour identifier l'information. Par exemple, un texte centré en haut sur une ligne est probablement le nom et l'adresse de l'entreprise. Une colonne de chiffres sur la marge de droite contient probablement des prix. Le logiciel de numérisation réunit ces tracés en une hypothèse de travail de ce qu'il voit.


Extraction des données

L'extraction des données est l'étape la mieux développée de ce processus (elle existe depuis plus de 100 ans, après tout). Lors de ce processus, le logiciel de numérisation reconnaît les chiffres et les lettres avec une exceptionnelle précision. Toutefois, la prochaine étape, qui détermine ce que signifient réellement ces caractères, est ce qui distingue un logiciel « correct » d'une solution offrant vraiment un gain de temps.


Qu'est-ce que tout cela signifie?

En se fiant sur les trois facteurs de reconnaissance des tracés, de disposition et des données brutes, le meilleur logiciel peut déchiffrer l’information et transposer ce qu’il extrait en données qu’un ordinateur (ou un humain) peut ensuite rechercher, réviser et utiliser. Une fois transposées, les données peuvent être mises dans un tableur, remplir une base de données des ventes ou être importées dans votre système de comptabilité. Les possibilités pour de telles données, une fois correctement interprétées, sont virtuellement infinies.

 


Une vérification à 100 % exige une touche humaine

Oui, le meilleur logiciel peut saisir, extraire et interpréter des masses de numérisations de documents mixtes avec un haut degré de précision. Cependant, le travail du logiciel doit encore être revu et vérifié par un être humain pour assurer la précision. Une vue « épreuve » de l'image numérisée est placée côte à côte avec les données interprétées pour faciliter la tâche.


Archives flexibles et consultables

Tout ce qui est extrait de la numérisation, depuis le pourboire sur un reçu de restaurant aux articles à pages multiples et aux documents techniques, devient des métadonnées pour votre système de gestion de document. Cela permet aux employés de trouver rapidement et facilement les documents dont ils ont besoin.

 

Besoin d'aide pour trouver ou développer le bon logiciel de numérisation?

Parlez avec Panasonic. Nous travaillons avec les chefs de file des développeurs en extraction de données et en gestion de document pour assurer aux clients qui achètent les numériseurs Panasonic qu'ils obtiennent le flux de travail le plus efficace possible. Vous pouvez compter sur nous pour des conseils impartiaux sur les logiciels et sur les solutions intégrées de documents clés en main basées sur nos technologies de numérisation éprouvées.