Vendredi 20 novembre 2009
Snow Leopard et les scanners, c'est presque le top

J'ai toujours eu un faible pour les logiciels d'OCR (ou de ROC pour Reconnaissance optique de caractères).

Un logiciel comme OmniPage à l'époque a été par exemple la raison pour laquelle j'ai quitté Atari pour le Mac.

Depuis, OmniPage a abandonné lâchement notre plateforme, et je suis passé soit sur ReadIris, que j'ai testé à de nombreuses reprises sur Cuk.ch, ou sur Prizmo, un peu plus récemment, si je n'ai pas de scanner sous la main.

J'aime les logiciels d'OCR, en partie parce que je perds en disons… un jour au maximum, tout papier qui passe dans mes mains. Et que pour cette raison, j'ai décidé de scanner toutes les convocations ou plus simplement tous les documents bien réels sur ma machine.

Sauf que scanner une page de texte pour en faire une image:

  • prend énormément de place sur le disque dur
  • ne permet pas de faire de la recherche sur le texte

Alors que passer un document "papier" dans un logiciel d'OCR permet de véritablement transformer une image en texte, puisque le logiciel lit et "retape" votre document, et donc permet:

  • de diminuer drastiquement la place utilisée (un document texte pèse immensément moins qu'une image)
  • d'effectuer une recherche sur n'importe quelle chaîne contenue dans le texte

Seulement voilà: pour faire de l'OCR, il faut un scanner (ou alors d'un appareil de photo, mais je préfère le premier).

Et j'en ai une pliée, de scanners à utiliser!

Un Epson Perfection 2400 à la maison, trois Canon Lide 90 un peu partout à l'école, un Lide 200 au bureau, et encore un ou deux Perfection dans d'autres locaux. Attention, je n'en ai que deux à moi hein… Les autres, je les utilise là où je me trouve.

Tous ces scanners fonctionnaient sur une technologie TWAIN, avec des pilotes fournis par les fabricants.

Les logiciels s'appuyaient sur cette technologie un peu vieillissante.

Or, depuis deux mois, j'ai installé Snow Leopard sur mon Mac, et depuis, je n'ai plus jamais osé utiliser un scanner, et j'ai donc perdu pas mal de documents en papier.

J'avais bien essayé de réutiliser VueScan, ce logiciel étonnant qui reconnaît tous les scanners (voire plus, mais oui, mais oui): sous SnowLeopard, aucun problème, si ce n'est une interface tout de même lourdingue ou plutôt vieillotte. Et puis, scanner une image pour la placer dans un logiciel de reconnaissance, c'est un peu fatigant. Cela dit, je viens de me rendre compte que VueScan dispose d'un OCR intégré… Purée depuis quand? Est-il bon? Il va falloir que je le teste! Si c'est le cas, j'en reparlerai ici.

Donc j'avais un peu laissé les scanners de côté depuis deux mois. Il faut dire que quand j'ai peur qu'une chose ne fonctionne pas, je fais un peu l'autruche.

Mais l'autre jour, j'ai fait le pas, et installé ReadIris Pro 12, qui ne reconnaissait plus aucun scanner par défaut! Enfin, quand je dis ça… Le pire, c'est que j'ai fait la grosse erreur de croire que c'était la faute de SnowLeopard. Alors que…

Je suis donc allé sur les sites Epson et Canon, et je n'ai trouvé aucun pilote Twain récent pour mes scanners de la première marque, et un pilote pour 10. 6 Canon, mais pour le Lide 200 seulement.

Rien pour le Lide 90, qui date de deux ans à peine.

Alors là ça a été la crise, et je me suis dit que les fabricants se fichaient de nous, j'en voulais à Apple et tout et tout.

Jusqu'à ce que je lise ce petit article de MacGeneration intitulé "Prizmo laisse SnowLeopard numériser". La petite phrase suivante m'a juste fait tilt: "Il (Prizmo donc) délègue la numérisation des documents à la nouvelle interface de gestion des scanners apparue avec le 10.6, avant de reprendre la main pour l'analyse du texte".

J'avais bien lu dans certains blogs que le système supportait quelques scanners, mais je n'avais aucune idée de comment utiliser la chose, alors, je me suis rabattu par erreur sur Twain et donc pratiquement sur le seul scanner supporté: le Lide 200.

Et puis, suite à cet article, j'ai téléchargé Prizmo, et, une fois la première fenêtre affichée, j'ai cliqué, sans trop y croire, sur le petit bouton du bas, représentant un scanner.

image

Et miracle, tous mes scanners ont été reconnus du premier coup.

image

Ici, le Lide 90 est connecté. Et il fonctionne, même très bien!

Je suis alors retourné sur ReadIris 12, et j'ai trouvé dans les préférences l'option "Activer les scanners Image Capture". Et là miracle (bis), j'ai pu utiliser tour à tour tous mes scanners.

image

Une liste des scanners et imprimantes est d'ailleurs disponible ici chez Apple.

Remarquez que cette liste ne me semble pas exhaustive, puisque le Canon Lide 90 n'est pas répertorié (alors que le 100, le 200 et 700F le sont), et qu'il est bien reconnu par les logiciels utilisant le fameux Image Capture.

Et vous l'avez compris, à ma grande honte, je ne savais même pas qu'il était possible de numériser une image directement dans MacOS 10.6.

Mais j'ai une excuse: j'ai tapé lors de ma découverte de SnowLeopard dans l'aide Mac le mot "scanner". Et là, aucun résultat, et j'en suis resté là. Pour cet article, j'ai tapé "numéris" et là, tout est apparu. Et c'est là que j'ai vu qu'un scanner est un scanneur pour cette aide en ligne!

image

L'interface, quelle que soit la marque du scanner, est toujours la même, je trouve ça génial, même si elle pourrait être un poil plus jolie.

image

Et puis, on pourrait il me semble faire un peu attention aux messages, qui ne correspondent pas toujours aux boutons en présence… Problème de traduction j'imagine!

En fait, le système est fort simple et efficace.

On passe dans les préférences systèmes, on choisit "Imprimantes et fax".

image

À gauche, si les scanners n'apparaissent pas tout seuls (deux l'ont fait, un autre pas), on clique sur le petit bouton "+" et le scanner, si intégré au système, peut être sélectionné. En ce cas, il monte dans la liste de gauche, dans une rubrique "Scanneurs".

Une fois le scanner sélectionné, on peut appeler l'interface de numérisation intégrée à SnowLeopard en cliquant sur le bouton "Ouvrir le scanneur…".

Et puis ensuite, par exemple à l'aide de Launchbar (testé ici en version 3), on peut avoir un accès immédiat au scanner désiré…

image

Ici par exemple, j'ai tapé "lide", et mes deux scanners Canon apparaissent dans la liste. Il suffit d'en sélectionner un, et c'est tout bon.

 

Cela dit, j'ai écrit en titre "c'est presque le top", mais ce "presque", ce n'est pas la faute d'Apple…

En effet, un logiciel comme GraphicConverter, s'il arrive étonnamment à travailler avec le pilote Twain (alors qu'aucun autre logiciel ne le fait sur mon Mac) n'utilise pas encore la nouvelle technologie Apple. Ce qui fait qu'il faut maîtriser une autre interface…

Et je n'ai pas réussi non plus à scanner directement depuis Photoshop CS4, pas plus que depuis Pixelmator.

Il semblerait donc qu'il reste du travail à faire, mais surtout du côté des éditeurs de logiciels graphiques, pour supporter la nouvelle technologie proposée par Apple au niveau de la numérisation.

Si certains y arrivent, pourquoi pas d'autres? Je vous le demande…

À part ça, vous voulez que je vous dise? SnowLeopard, je commence à m'y faire. Même mon imprimante HP 2600n est reconnue sans bidouiller depuis l'installation de la mise à jour de la marque ce mardi.

Et ce nouveau félin, je le trouve finalement assez superbe.

Même que je n'aimerais pas revenir en arrière.

Comme quoi, il faut laisser le temps au temps!