Profitez des offres Memoirevive.ch!
Prizmo 2: pour capturer du texte de partout

Les logiciels d'OCR, j'ai toujours adoré.

Il y en a plusieurs pour Mac.

Je répète ce que j’ai déjà écrit plusieurs fois depuis dix ans: c’est le logiciel OmniPage qui m’a fait passer d’Atari sur Mac. Il y a 20 ans déjà, ce logiciel était génial.

Et puis, il nous a abandonnés lâchement.

Celui que j’utilise depuis un bout de temps, c’est ReadIris. Ce logiciel que j’ai testé il y a longtemps sur Cuk, et qui en version 14 est très bon. Il faudra que j’en parle un jour.

Et puis aussi ABBYY FineReader que j’utilise via mon scanner Fujitsu puisqu’il est livré en bundle avec lui.

Mais bon, j’en vois qui quittent déjà parce qu’ils ne comprennent rien.

C’est quoi l’OCR ou le ROC? OCR pour Optical Character Regognition, ROC pour Reconnaissance Optique de Caractère.

Vous scannez un document.

Ce dernier n’est pas simplement pris comme une photocopie, mais purement et simplement retapé par le logiciel.

Vous pouvez ensuite modifier le texte obtenu, comme si c’était vous qui l’aviez saisi avec vos petits doigts.

Et étonnamment, pour autant que le fichier que l’on donne à mâcher soit de bonne qualité, si possible tiré d’un scanner avec une résolution de 300 PPP, le texte rendu est quasiment parfait.

Attention: il y a deux types de logiciels OCR: ceux qui, et ils sont légion, indexe votre document scanné et permettent de retrouver des chaînes de caractères à l’intérieur, mais qui ne permettent pas l’édition du document obtenu, et qui sont pratiques, immensément pratiques même pour retrouver en un clin d’œil le document que vous recherchez à travers un outil de type Spotlight, et ceux qui vous permettent de retoucher le texte obtenu, comme si c’était vous qui l’aviez tapé.

Certains logiciels parviennent même à vous rendre la mise en page originale, ce qui est bluffant, mais pas toujours pratique à retoucher. Lorsqu’on voit ce que ça donne sur Word pour que les alignements soient parfaits, on comprend que la moindre retouche amène très vite une confusion générale.

Le plus incroyable pour cela est AnyBizSoft PDF Converter qui a été repris par Wondershare pour devenir Wonderhsare PDF converter, avec une version Pro qui fait de l’OCR.

Le résultat est magique tellement il est semblable dans Word à l’original. Tellement magique qu’il devient fort difficile de reprendre le texte sans tout chambouler. Or pouvoir reprendre le texte est tout de même la raison d’être de ce type de logiciel.

Attention à la poudre aux yeux donc.

Et de la poudre aux yeux, ce n’est pas du tout ce que nous offre Prizmo 2.

Pourquoi Prizmo 2 et pas un autre?

Mon intertitre est un peu nul.

En effet, Prizmo ne remplace pas complètement un ReadIris par exemple.

Tout simplement parce que Prizmo ne veut qu’une chose: reconnaître du texte, et ce dans 40 langues, sans s’occuper de préserver la mise en page, d’où qu’il provienne, et même s’il est de mauvaise qualité.

Et c’est là que Prizmo est tout simplement génial.

Je vous parlais d’un texte de 300 PPP pour parvenir à une bonne reconnaissance avec les logiciels traditionnels?

Pas avec Prizmo.

En effet, ce logiciel accepte tout et n’importe quoi à manger, et le plus incroyable, c’est qu’il donne de très bons résultats.

Commençons par un exemple tout simple que j’ai pris, je l’admets, exprès pour la démonstration. Un texte d’un livre, pris le soir, chez moi, à la lumière d’une lampe de plafond, par un iPhone 5. Pour éviter l’ombre, je me suis mis de côté, ce qui a impliqué les défauts que vous voyez très bien sur l’image suivante:

image

Qu’est-ce qui peut poser un problème pour la reconnaissance? Tout! Le fond, la résolution et la perspective entre autres choses.

Eh bien il suffit de glisser l’image dans l’interface de Prizmo.

image

Vous disposez ensuite de tous les outils nécessaires pour corriger le problème.

Vous redressez l’image au niveau des perspectives, supprimez le fond, améliorez la netteté.

image

Tous les outils de redressement sont de la partie (courbure, rognage)

image

Le résultat des corrections

image

On peut même corriger les défauts de la lentille.
Sur mon iPhone, le résultat n’est pas trop concluant

image

Des outils de nettoyages sont proposés

image

Lorsque vous êtes prêt, vous lancez la reconnaissance. Une preview est disponible alors à droite de la fenêtre.

Il est ensuite possible de lancer l’analyse. Les zones sont tracées

image

Il est possible de les redéfinir, de les supprimer, de les réordonner

Vous pouvez à ce moment réordonner au besoin les zones reconnues (le programme n’étant pas encore, comme tous ses congénères, aussi intelligent que nous, quoique même moi, des fois, j’ai de la peine à comprendre où est la suite d’un article.

Tout cela est très bien, du type même de tout ce qui se fait ailleurs. On ne va pas non plus réinventer la roue.

 

image

L’export est multiple

image

Et de tous les formats utiles

 

Quelques petits plus: la lecture du document reconnu est disponible, tout comme une traduction en plusieurs langues.

Bon, dans le cas précis de ma démonstration, la reconnaissance, comme je l’ai écrit, était honorable, sans plus. Faut pas pousser tout de même: document courbe, luminosité exécrable, iPhone 5 et déclic non stabilisé, ce n’est pas tout ce qu’un programme d’OCR peut attendre pour travailler dans de bonnes conditions.

Mais là où les programmes traditionnels n’auraient rien donné, Prizmo s’en sort plutôt bien.

Et dans des situations un tout petit peu meilleures, même avec des défauts, Prizmo fait presque des miracles.

 

Tout y passe, avec un succès certain

Comme vous l’avez vu, vous pouvez envoyer sur Prizmo des documents tout biscornus.

Mais vous pouvez également envoyer des captures d’écran, qui ont d’habitude contre elles d’être d’avoir une résolution de tout temps largement insuffisante pour permettre un OCR de qualité.

Si vous glissez une copie d’écran, Prizmo vous propose de multiplier par 2 (et semble-t-il par 4) la résolution pour améliorer la reconnaissance. Acceptez bon sang, ça ne mange pas de pain.

Mieux même!

Prizmo vous propose un petit menu permanent (merci Bartender de venir à mon secours pour tous les gérer!) qui nous permet de sélectionner du texte à tout instant en tirant un rectangle autour d’une zone ou d’une image en comportant, en choisissant ensuite la langue, puis en cliquant sur "Copier le texte" (avec ou sans retour de chariot à la fin de chaque ligne, c’est tout nouveau dans la dernière version 2.02 qui vient de sortir).

image

Le texte est copié depuis Cuk.ch...

image

Puis collé dans TextEdit

 

Tout cela est très pratique, et l’on se rend compte que ce programme est très souvent utile, ce d’autant plus qu’on l’a toujours à disposition.

 

Un joli couple avec Antidote

Tout logiciel de reconnaissance de caractère ne peut se passer d’un bon correcteur.

Certains l’intégraient à l’époque, d’autres et la plupart maintenant préfèrent laisser la correction aux bons soins du programme qui reçoit le texte (Word par exemple).

Eh bien tous ceux qui possèdent le merveilleux Antidote testé vendredi passé auront le plaisir de voir que le programme travaille en symbiose parfaite avec Prizmo.

Génial non?

Et bigrement utile!

image

 

En conclusion

Si ReadIris et Abby FineReader ont pour eux une reconnaissance non seulement du texte, mais également de la mise en page, avec les avantages, mais aussi les désavantages que cela peut apporter (quelques parasitages de votre texte par exemple), et sont un peu plus précis avec une belle page bien scannée à 300PPP, Prizmo a pour lui véritablement de faire exploser le carcan de ces 300 ppp, de la rectitude des images.

Il vous permet d’éviter de retaper du texte, même si l’original n’est pas de bonne qualité.

Oh, bien évidemment, si le texte est écrit en jaune sur fond bleu ciel, il va avoir des problèmes, mais même dans ce cas, ses nombreux outils vont peut-être vous tirer d’affaire.

Personnellement, je pense que la version de base est tout à fait suffisante, mais ceux qui désirent aller plus loin dans le domaine peuvent passer en mode professionnel, ce qui double pratiquement le prix du logiciel, sans du tout améliorer la reconnaissance. Ce sont juste les traitements en lot, des scripts et des actions Automator qui sont offerts en plus, le principal est dans la version de base.

Les prix?

Les voici:

image

 

17 commentaires
1)
jpg
, le 23.11.2012 à 08:01
[modifier]

Cela semble bien intéressant. Une version d’essai est disponible mais Prizmo 2 exige d’être au moins sous OS 10.7, autrement dit cela ne fonctionne pas sous Snow Leopard.

2)
Alain Le Gallou
, le 23.11.2012 à 10:45
[modifier]

Hé oui, l’obligation de passer à Mountain Lion est requise pour les mises à jour de plus en plus de logiciel. C’est mon cas pour la nouvelle version de Dictate. Je suis sur Mountain Lion depuis 9 jours sans soucis graves, mais avec très peu d’amélioration notable, et le désagrément du gris moins visible qui fatigue les yeux. (j’ai mis la couleur pour le Finder). Coût de 133.51€ de mises à jour logiciels incompatibles.

J’ai testé un peu Prizmo ce matin. Cela à l’air pas mal. La démo n’a pas de date limite. Elle met des ** à la place de, disons, 10% de mots.

3)
François Cuneo
, le 23.11.2012 à 11:48
[modifier]

Ouuuuuuaaaaaaaaaaaaaaaaaaaaah!

Le moment est HIS-TO-RI-QUE!

Alain a quitté Snow Leopard!!!!!!

Incroyable.

On m’aurait dit que dès ce jour, les poules ont des dents que je n’aurais pas été plus surpris!:-)))

5)
Migui
, le 24.11.2012 à 07:07
[modifier]

Une seule fois j’ai dû utiliser un logiciel OCR pour digitaliser deux ouvrages, l’un en français et l’autre en néerlandais.

J’ai utilisé la fonction idoine contenue dans Adobe Acrobat installé sur mon PC du boulot. Le résultat était satisfaisant, mais je n’ai pas eu l’occasion de comparer le travail avec d’autres logiciels.

6)
lnk
, le 24.11.2012 à 19:37
[modifier]

J’aime beaucoup ce logiciel. On peut ajouter qu’il corrige très bien la courbure de la page sur des photos de gros livres. Je l’utilise aussi, même sans l’OCR, pour obtenir de belles images bien lisibles de pages de livres : c’est beaucoup moins problématique pour de vieux livres fragiles que la manipulation avec un scanner.

L’OCR se tire bien d’images prises dans de mauvaises conditions. Ci-dessous un exemple : photo prise avec un iphone 4S d’une plaque (sur le mur de l’a prison de la Santé à Paris) située relativement haut par rapport à un piéton. J’ai dû tâtonner pas mal parce que les marbrures de la plaque perturbaient l’OCR (qui cherchait à les “interpréter” comme des éléments de textes), mais j’y suis arrivée. J’ai bien entendu refait la mise en page, mais je n’ai eu à faire aucune correction du texte lui-même.

7)
lnk
, le 24.11.2012 à 19:41
[modifier]

Désolée, mon image était beaucoup trop grande, il faut pour la voir l’ouvrir dans une fenêtre séparée, et je ne sais pas comment corriger mon commentaire. Il me reste des progrès à faire pour devenir une parfaite Cukienne (pourtant je suis une fidèle lectrice depuis des années, même si je commente peu.

8)
Alain Le Gallou
, le 24.11.2012 à 23:15
[modifier]

@Ink Il faut juste passer ta photo de 300dpi à 72dpi et enlever un peu du mur pour voir la plaque. Je l’ai fait pour toi avec GraphicConverter.

9)
lnk
, le 25.11.2012 à 00:08
[modifier]

Merci mille fois, Alain Le Gallou! Je pensais bien qu’il fallait diminuer la taille du fichier en changeant la résolution, mais je n’avais même pas compris comment je pouvais modifier un élément de mon commentaire (l’image) une fois que je l’avais posté. J’aurais dû y penser avant. Au fait, comment fait-on une fois le commentaire est posté?

11)
cerock
, le 26.11.2012 à 11:31
[modifier]

Je suis les dernière nouvelle de cuk avec du retard ? Question bête, la mise a jour vaut-elle la peine a part la lecture des texte que je ne vais jamais utiliser.

MErci

14)
jdmuys
, le 27.11.2012 à 15:00
[modifier]

A la disparition d’Omnipage, j’avais acheté ReadIris 11, et avait été profondément déçu, à la fois par la médiocre qualité technique du logiciel, par son ergonomie insuffisante (restons charitable), et par les pratiques détestables de l’éditeur en matière de mise à jour.

Ces points se sont-ils améliorés dans les versions plus récentes?

La plupart du temps. je ne souhaite pas conserver la mise en page du document original en sortie de l’OCR, car dans ces cas là, mon logiciel de scan fait un boulot acceptable en produisant un PDF double couche.

Par contre, j’ai besoin d’une sortie “au kilomètre” de qualité (pour des sources de qualité), y compris dans la reconnaissance de lettres grecques, la présence d’indices et d’exposant, des symboles mathématiques, et la reconnaissance du plus grand nombre possible de glyphes Unicode. Par exemple:

lim f(x) = ℓ ⇔ ∀ ε∈ℝ⁺∖{0}, ∃α∈ℝ⁺, ∀x∈ℂ, |x – a| ≤ α ⇒ |f(x) – ℓ| ≤ ε

Ou en chimie, reconnaître mmol.L-1 (avec “-1” en exposant).

Que donne Prizmo sur ce genre de texte?

15)
cerock
, le 27.11.2012 à 15:29
[modifier]

@jdmuys Tu peux m’envoyer un scan d’exemple en MP ou alors te faire une idée avec la version de démo disponible sur le site de l’éditeur.

Moi aussi après avoir l’impression de m’être fais avoir chez readiris, (la version 11 n’a jamais réussi a démarré sur mon ordo, j’ai du finir par l’utililser au travail… si on peut dire utiliser, car une vrai daube se logiciel) j’ai passé à Prizmo 1 et ce n’est que du bonheur ;)

16)
jdmuys
, le 28.11.2012 à 11:11
[modifier]

J’ai testé avec la version de démonstration sur ma petite ligne mathématique ci-dessus, via l’OCR “copie d’écran”, après avoir zoomé assez fort.

Résultat: zéro. La cata totale. Voici ce qu’il reconnaît:

Par ••••••, j’ai besoin d’une sortie “au kilomètre” de qualité (pour des sources de •••••••), y compris dans la reconnaissance de lettres grecques, la presence ••••••••• et d’exposant, des symboles mathématiques, et la reconnaissance du plus grand •••••• possible de glyphes Unicode. Par exemple: lim f(x) = { ~ v ER÷\{O}, 3a•÷, vx¢, Ix – al <– a ~ If(x) – {I <– E Ou en chimie, reconnaître mmol.L-1 (•••• “-1” en exposant).

Noter que les “••••” ne sont pas des problèmes, mais simplement le symptôme des limitations de la version démo.

Joker pour les exposants aussi: mon commentaire Cuk n’ayant pas d’exposant. Sauf le ”+” en exposant de ℝ, reconnu comme “÷” sans être en exposant. Donc assez mauvais signe.

Donc pour les glyphes “spéciaux”, Prizmo n’apporte aucune amélioration par rapport à ReadIris 11: on en est toujours à des performances inutilisables. Mais bon… c’est clair que c’est un problème difficile. Pour le reste, ce logiciel semble en effet assez sympa, et bien mieux conçu que ReadIris. J’hésite encore, mais il se pourrait bien que je l’achète malgré son inadéquation sur mes documents scientifiques.

17)
Alain Le Gallou
, le 28.11.2012 à 13:23
[modifier]

@jdmuys pour acheter à moitié prix il faut donner dans la case coupon la clef d’une version V1. J’ai donné celle d’un copain qui n’est plus sur Mac. Il n’y a pas de vérification sur le nom visiblement.