2010. augusztus 16., hétfő

Ingyenes online szövegfelismerő (OCR)

Anno volt a Recognita, azóta is sok értékes fizetős program segít a szövegfelismerésben, amikor valamilyen dokumentumot szkennelés után szeretnénk szerkeszthető dokumentummá alakítani (pl. szövegszerkesztőben).
Ma az egyik munkatársunknak kellett hirtelen egy ilyen lehetőség, de természetesen nem volt a közelben ilyen szoftver.
Szigorúan a legális megoldások talaján maradva találtam a következő lehetőséget, amit eddig én nem ismertem, más már lehet, hogy igen, de sebaj, nekem (illetve neki) sokat segített.
Természetesen, mielőtt ajánlottam volna neki, vagy épp ebben a bejegyzésben, kipróbáltam egy korábbi, szkennelt szöveges képpel, és működik.
(Tapasztalat egy kicsit hosszabb, 2 oldalnyi magyar nyelvű szöveggel: szinte mindent helyesen ismert fel, kivéve az á illetve ő betűt.)
A következő formátumokat kezeli: JPG, GIF, TIFF, BMP, PDF.
A méretkorlát 2MB és óránként csak 10 fájlt lehet konvertálni.
De szükségmegoldásnak, néhány oldal erejéig mindenképp kiváló.
Természetesen a sok nyelv közül a magyar is választható.
Az már más kérdés, hogy milyen dokumentumot bízunk egy ismeretlenre.
Bizalmas iratokat szerintem nem, de egy-két általános szöveget azért fel lehet tölteni.

Az oldal címe:
http://www.free-ocr.com/ (Friss infó: lentebb egy hozzászólásban jelezték, hogy elég furcsa végeredményt kaptak. Kipróbáltam, valóban úgy van. Nem tudom, hogy átmeneti vagy tartós a probléma, de egy másik, hasonló oldalon továbbra is jó az eredmény.)

Az alternatív oldal címe:
http://www.onlineocr.net/

6 megjegyzés:

  1. Húh köszi! Véletlenül találtam e bejegyzésre, nagy segítség lesz, hamarosan kapok egy könyvet, amit újra kellene tördelni. Köszi!!

    VálaszTörlés
  2. A baj csak az, hogy nekem 15,9 MB-t kellene felismernie, átalakítania. :(

    VálaszTörlés
  3. Nagyon köszi a tippet!
    Tényleg nagy segítség. A Paint *.png-t is felismeri. Néha megmakacsolja magát (azt írja, hogy nem talált szöveget...) de a próbálkozásokat számolja, ami miatt a vártnál hamarabb kimeríted a 10-es limitet.
    De a célnak tényleg megfelel és minimális a hibaszázalék! Meglepően jó :-)

    VálaszTörlés
  4. A cuda tudja. Ez egy magyar szöveg, úgy kezdődik, hogy:
    az egészségvédő és hosszú élet gyakorlatok része, A leírásból tudtam, hogy sok ember fog érdeklődni irántuk. stb., .....

    Ezt kaptam az OCR-től, amagyar nyelv beállítása után. Oprendszer: xubuntu, Firefox 3.2.8
    , u uhut küldi!!! kwlct. nincsenek a jú hamun! Így még mkzlhlv küldnwg uram I'xgngL
    ha "e mamut tilnkhan n nyakadat-Ahol, Ez a kim; nemm cum-km kulturális
    Rummal. Sikerük! nemem A IllÍASHAN l'czyrég Cucc [mnm már mind megindul
    e; a is hamu Ide markú-k Ha nem asme konc. lehet. bogv örökre eh cum-k és a TAO
    iga cvuámdm crúl'wsmc'm hiáhn'nlmk vnlml. l): W (' NIL? lu'nnivamzrikm hlhlógug.
    XII RENHE a pch'ngi Gmnlwxmm kórház korább-L veumjn IHAMJ DIANlllYA w
    Munkám) Kmnló IntúA'l luc-nm!" nunznalúiu. TAO HASIIAN a Pckmgq lmtkulxúm és

    Most erre mit mondjak?

    VálaszTörlés
    Válaszok
    1. Igazad van, frissítettem is az infót.
      Ezt próbáld ki: http://www.onlineocr.net/

      Törlés