VORTEXVstup na vlastné riziko!

Z papiera do PC

Publikované 10.09.2014 v 10:39 v kategórii UŽITOČNÝ SOFTVÉR, prečítané: 1203x

Napísať niečo a vytlačiť je bežná vec, ale občas sa stáva, že by sme to potrebovali naopak. Dostať niečo z papiera do počítača a potom to ešte môcť upravovať.
Núdza človeka občas donúti hľadať možnosti a riešenia a to je aj tento prípad. Potreboval som upraviť viac papierových dokumentov - zmeniť nejaké údaje, opraviť a doplniť obsah a potom znova vytlačiť. Asi sa v podobnej situácii občas ocitne skoro každý. Vytlačíte si napríklad životopis a potom ho zmažete, alebo oň prídete inak a ked už je neaktuálny, potrebujete tam niečo doplniť. V tomto prípade ide o krátky dokument a dá sa za pár minút napísať nový. Horšie je to, ked ide o textové súbory, ktoré majú viac strán, alebo dokonca desiatky či stovky strán. Dôvodom na to môže byť čokoľvek:
  • potreba mať dokument vo väčšom formáte (nejaký návod k výrobku)
  • kopírovanie obsahu (namiesto vystrihovania z časopisov sa dá koprípovať a upravovať obsah podľa potreby)
  • potreba zmeniť alebo doplniť údaje (úprava študijných materiálov, rôzna dokumnetácia pre prácu alebo podnikanie)
  • iba prevod z papierovej do elektronickej formy pre odosielanie mailom (ak nestačí sken)
  • potreba preložiť dokument do iného jazyka pomocou softvéru
Tak na toto je tu užitočný nástroj OCR - optical character recognition. Je to softvér, ktorý dokáže rozoznať písmo z naskenovaného obrázku alebo dokumentu. Takže ak budete potrebovať preniesť text z papiera do počítača aby ste ho mohli akokoľvek upraviť, neváhajte a skúste to. Je to podstatne jednoduchšie ako prepisovať text. Jednu stránku je asi lepšie prepísať ale už dve a viac je lepšie spracovať týmto programom. samozrejme, že sa nezaobídete bez tlačiarne - teda vlastne scanera, ktorý má každá bežná domáca tlačiareň, ktorá funguje ak kopírka skener a tlačiareň.
V prípade jednorázového použitia odporúčam online služby, ktoré som odskúšal:
  1. free online OCR
  2. free-ocr.com
Postup je jednoduchý: Vložíte papier do skenera a skenujete stránky. Ak je to väčší dokument s veľký počtom strán, ukladajte ich tak po 5-6 stránok. Takže ked skopírujete napríklad 5 stránok uložte súbor vo formáte PDF. OCR softvér lepšie rozozná písmo z tohto formátu ako z obrázku jpg či iného. Mali by te tam mať voľbu pre uloženie " - uložiť ako viacstránkový dokument pdf ". Ukladaný súbor označte napríklad Text1z8 a další Text2z8 alebo inak aby ste mali prehľad ak toho bude viac. Dokument delíme na menšie z toho dôvodu, že niektoré online OCR služby majú obmedzený objem na jedno spracovania a to napríklad 2MB alebo 5MB. Preto to rozdelenie po 5-6 stránok. Potom nakopírované pdf dokumenty po jednom nahráme na server a spracujeme asi takto na stránke služby:
  • vybrať -vyhľadať súbor (search file)
  • nahrať na server (upload) - zobrazí sa nahraný súbor
  • spracovať (run OCR)
  • po pár sekundách sa objaví pole s rozoznaným  textom.


A teraz to náročnejšie. Program rozozná text v závislosti od písma, kvality skenu a stavu papiera. Z políčka z textom potom kopírujeme text a vkladáme do programu, ktorým ho budeme upravovať - Libre Writer, OO Writer, Word, alebo iný textový editor. Postupne dáme spracovať ostatné stránky jednotlivých súborov. Hotové texty upravujeme podľa potreby, veľkosť, font, nadpisy a podobne. OCR softvér rozoznáva len text nezobrazí nadpisy a tučné písmo a podobne, to si musí každý prispôsobiť následne v editore. V každom prípade je to veľmi užitočný nástroj, ktorý určite dokáže ušetri more času niekomu, kto ho využije. Je dobré mať po ruke niečo také a tak odporúčam dať si tieto služby do záložiek, alebo proste mať na pamäti že rozpoznávanie písma z naskenovaných obrázkov a dokumentov vykonáva softvér s označení OCR.
Okrem online služieb  sú samozrejme aj programy, ktoré si stiahnete a inštalujete. To vyhovuje tomu, kto by to potreboval opakovane, alebo na náročnú úlohu. Stačí hľadať OCR na stiahnutie. Osobne som skúsil " gscan2pdf" pre Linux a fungovalo to. Pre Windows je tu určite pár takýchto aplikácia a určite aj zadarmo - freeware, open source a podobne. Vdaka vývojárom za takéto skvelé nástroje.

Komentáre

Celkom 0 kometárov

  • Neregistrovaný uživatel

    Meno: Prihlásiť sa

    Blog:

    Obsah správy*:

    Kontrolní kód*:
    Odpovedzte na otázku: Čo je dnes za deň?