Google bringt kostenlose OCR Software
Die OCR-Software Tesseract wurde heute von Google als Open Source freigegeben. Die aus dem Hause Hewlett-Packard stammende Software ist allerdings noch eine Baustelle, so fehlt zum Beispiel eine Benutzeroberfläche. Google plant Tesseract weiter zu verbessern.
Ich könnte wetten, viele der SEOs denken jetzt, Google will das nur dazu nutzen das Impressum von Webseiten welches als Bild gespeichert wurde damit auszulesen, stimmts?
Sie könnten es auch sinnvollerweise dafür nutzen, um den verstärkt auftretenden Image Spam bei GMail auszufiltern.
Marcus
8 Sep 06 at 2:35 pm
Da ausser in Deutschland kein Land dieses Impressumswahn und die damit verbundenen Bildchen hat, halte ich das für unwahrscheinlich.
Johannes
10 Sep 06 at 4:20 pm
OCR? Mhmmm … hat bestimmt was mit Google-Books zu tun. Da gibt es eine Menge PDF umzuwandeln.
Matthias
18 Sep 06 at 12:58 am