Ako previesť naskenované dokumenty do programu Word - šťastný Android

Ak potrebujete digitalizovať knihu v textovom formáte, môžete mať niekoľko otázok. Dá sa to urobiť? Čo sa týka kvality, je to dobré? Nielen, že sa to dá urobiť, ale existuje aj niekoľko spôsobov, ako previesť naskenovaný dokument do Wordu. Pozrime sa:

  • Naskenovaním dokumentu vo formáte PDF a jeho neskoršou úpravou pomocou aplikácie Adobe Acrobat XI Pro, aby sa dokument uložil vo formáte Word. Pro verzia aplikácie Acrobat je platená, môžete si však kúpiť bezplatnú 30-dňovú skúšobnú licenciu.
  • Z webovej stránky OnlineOCR.net . Táto webová aplikácia vám umožňuje prevádzať dokumenty vo formátoch PDF, JPG, TIFF a GIF do formátu Word, Excel a text. V bezplatnej verzii môžeme prevádzať až 15 stránok za hodinu a dokumenty s maximálnou jednou stránkou.
  • Naskenovaním dokumentu vo formáte (OCR) a jeho uložením ako textu. Potom môžeme otvoriť Word a upraviť alebo uložiť ho vo formáte .doc.
  • Používanie programu na optické rozpoznávanie znakov :
    •  VueScan (k dispozícii pre Windows, Mac OS X a Linux)
    • Kooka  (pre Linux)
    • Kancelársky objektív (pre Android a iOS )
    • CamScanner (pre Android a iOS )

Najúčinnejším spôsobom zo všetkého, čo by sme mohli povedať, je program Adobe Acrobat Pro, ale iba ak je sken veľmi, veľmi čistý a vysoko kvalitný. Aplikácie optického rozpoznávania znakov prešli dlhou cestou, stále však vykazujú medzery v textoch ako tučná alebo kurzíva a prepis niektorých slov v závislosti od typu písma pôvodného dokumentu môže byť nesprávny.

Skúste tento dokument naskenovať a odovzdať do Wordu, aby ste zistili, čo sa stane

Zo samotného skenera

Niektoré skenery obsahujú funkciu optického rozpoznávania (OCR) v rámci vlastného skenovacieho programu. Ak chcete naskenovať dokument do textu, stačí nastaviť formát digitalizácie a pozrieť sa na formát, ktorý odkazuje na OCR alebo podobne (záleží na značke / modeli skenera).

Prejdite z PDF do Wordu pomocou aplikácie Adobe Acrobat XI Pro

Po stiahnutí a nainštalovaní aplikácie Adobe Acrobat XI Pro ( máte tu bezplatnú 30-dňovú skúšobnú verziu TU ) prejdite do ponuky „ Nástroje -> Rozpoznávanie textu -> V tomto súbore “.

V okne „ Rozpoznať text “ kliknite na „ Upraviť “ a vyberte jazyk textu, štýl výstupu a rozlíšenie.

Nakoniec sa vráťte späť do časti „ Nástroje -> Úpravy obsahu -> Upraviť text a obrázky “ a upravte text, ak potrebujete opraviť akékoľvek slovo. Dokončite to kliknutím na „ Súbor -> Uložiť ako “ a uložte ju vo formáte Word.

OnlineOCR

OnlineOCR je webová aplikácia na prenos obrázkov alebo súborov PDF do aplikácie Word a jej použitie je veľmi jednoduché. Vysvetlím, ako to funguje: Zadajte //www.onlineocr.net/ a kliknite na „ Vybrať súbor “. Vyberte naskenovaný dokument a potom vyberte jazyk a výstupný formát z 2 rozbaľovacích ponúk, ktoré máte v strede obrazovky.

Na záver kliknite na „ Konvertovať “. Pod ním sa zobrazí ukážka obyčajného textu, ktorú môžete upraviť, ak potrebujete opraviť nejaké slová. Nakoniec kliknite na „ Stiahnuť výstupný súbor “ a môžete si stiahnuť súbor vo formáte Word. Tu je príklad PDF prevedeného do Wordu pomocou OnlineOCR:

  • Originál PDF:

  • Prevedený dokument:

Ak vám táto webová aplikácia nevyhovuje, môžete vyskúšať iné podobné alternatívy, ako napríklad FreeOCR alebo Free-Online-OCR .

Programy optického rozpoznávania znakov (OCR)

Ak nechcete upravovať svoje dokumenty online a potrebujete počítačovú aplikáciu, môžete použiť aplikácie ako VueScan (ktorý je okrem všadeprítomného systému Windows k dispozícii aj pre systémy Mac a Linux).

Ďalšou možnosťou je použiť zariadenie so systémom Android alebo iOS na skenovanie dokumentu a jeho priamu konverziu na text. Existujú aplikácie ako Office Lens (pre Android a iOS ) alebo CamScanner (pre Android a iOS ), ktoré vykonávajú celý proces z tej istej aplikácie. V týchto prípadoch sa odporúča obrázok pred prevedením na text vyčistiť. Ak sa chcete dozvedieť viac o tejto metóde, pozrite si TENTO POŠT .

Podľa môjho názoru je technika optického rozpoznávania znakov, aj keď sa za posledné roky veľmi zlepšila, ešte stále vzdialená svetelné roky od dokonalej techniky. Veľa detailov, veľa slov, ktoré „preloží“, nesprávnymi písmenami a symbolmi, ktoré vrhajú text. Stále mu chýba extra inteligencia , vďaka ktorej vidí, že „ t &! $ Olog1a “ nemôže byť platným prekladom žiadneho slova v texte. Stále nevidím čítanie s porozumením, ale jednoduché vizuálne rozpoznanie jednotlivých písmen, ktoré tvoria slová, bez ich integrácie so zvyškom textu. Som však presvedčený, že okamih, keď urobíme ten posledný veľký skok, sa každým dňom približuje.

Máte nainštalovaný Telegram ? Dostávajte najlepšie príspevky každého dňa na našom kanáli . Alebo ak chcete, zistite všetko z našej facebookovej stránky .