Z papiera do PC
Publikované 10.09.2014 v 10:39 v kategórii UŽITOČNÝ SOFTVÉR, prečítané: 1203x
Napísať niečo a vytlačiť je bežná vec, ale občas sa stáva, že by sme to potrebovali naopak. Dostať niečo z papiera do počítača a potom to ešte môcť upravovať.
Núdza človeka občas donúti hľadať možnosti a riešenia a to je aj tento prípad. Potreboval som upraviť viac papierových dokumentov - zmeniť nejaké údaje, opraviť a doplniť obsah a potom znova vytlačiť. Asi sa v podobnej situácii občas ocitne skoro každý. Vytlačíte si napríklad životopis a potom ho zmažete, alebo oň prídete inak a ked už je neaktuálny, potrebujete tam niečo doplniť. V tomto prípade ide o krátky dokument a dá sa za pár minút napísať nový. Horšie je to, ked ide o textové súbory, ktoré majú viac strán, alebo dokonca desiatky či stovky strán. Dôvodom na to môže byť čokoľvek:
V prípade jednorázového použitia odporúčam online služby, ktoré som odskúšal:
Postup je jednoduchý: Vložíte papier do skenera a skenujete stránky. Ak je to väčší dokument s veľký počtom strán, ukladajte ich tak po 5-6 stránok. Takže ked skopírujete napríklad 5 stránok uložte súbor vo formáte PDF. OCR softvér lepšie rozozná písmo z tohto formátu ako z obrázku jpg či iného. Mali by te tam mať voľbu pre uloženie " - uložiť ako viacstránkový dokument pdf ". Ukladaný súbor označte napríklad Text1z8 a další Text2z8 alebo inak aby ste mali prehľad ak toho bude viac. Dokument delíme na menšie z toho dôvodu, že niektoré online OCR služby majú obmedzený objem na jedno spracovania a to napríklad 2MB alebo 5MB. Preto to rozdelenie po 5-6 stránok. Potom nakopírované pdf dokumenty po jednom nahráme na server a spracujeme asi takto na stránke služby:

A teraz to náročnejšie. Program rozozná text v závislosti od písma, kvality skenu a stavu papiera. Z políčka z textom potom kopírujeme text a vkladáme do programu, ktorým ho budeme upravovať - Libre Writer, OO Writer, Word, alebo iný textový editor. Postupne dáme spracovať ostatné stránky jednotlivých súborov. Hotové texty upravujeme podľa potreby, veľkosť, font, nadpisy a podobne. OCR softvér rozoznáva len text nezobrazí nadpisy a tučné písmo a podobne, to si musí každý prispôsobiť následne v editore. V každom prípade je to veľmi užitočný nástroj, ktorý určite dokáže ušetri more času niekomu, kto ho využije. Je dobré mať po ruke niečo také a tak odporúčam dať si tieto služby do záložiek, alebo proste mať na pamäti že rozpoznávanie písma z naskenovaných obrázkov a dokumentov vykonáva softvér s označení OCR.
Okrem online služieb sú samozrejme aj programy, ktoré si stiahnete a inštalujete. To vyhovuje tomu, kto by to potreboval opakovane, alebo na náročnú úlohu. Stačí hľadať OCR na stiahnutie. Osobne som skúsil " gscan2pdf" pre Linux a fungovalo to. Pre Windows je tu určite pár takýchto aplikácia a určite aj zadarmo - freeware, open source a podobne. Vdaka vývojárom za takéto skvelé nástroje.
- potreba mať dokument vo väčšom formáte (nejaký návod k výrobku)
- kopírovanie obsahu (namiesto vystrihovania z časopisov sa dá koprípovať a upravovať obsah podľa potreby)
- potreba zmeniť alebo doplniť údaje (úprava študijných materiálov, rôzna dokumnetácia pre prácu alebo podnikanie)
- iba prevod z papierovej do elektronickej formy pre odosielanie mailom (ak nestačí sken)
- potreba preložiť dokument do iného jazyka pomocou softvéru
V prípade jednorázového použitia odporúčam online služby, ktoré som odskúšal:
Postup je jednoduchý: Vložíte papier do skenera a skenujete stránky. Ak je to väčší dokument s veľký počtom strán, ukladajte ich tak po 5-6 stránok. Takže ked skopírujete napríklad 5 stránok uložte súbor vo formáte PDF. OCR softvér lepšie rozozná písmo z tohto formátu ako z obrázku jpg či iného. Mali by te tam mať voľbu pre uloženie " - uložiť ako viacstránkový dokument pdf ". Ukladaný súbor označte napríklad Text1z8 a další Text2z8 alebo inak aby ste mali prehľad ak toho bude viac. Dokument delíme na menšie z toho dôvodu, že niektoré online OCR služby majú obmedzený objem na jedno spracovania a to napríklad 2MB alebo 5MB. Preto to rozdelenie po 5-6 stránok. Potom nakopírované pdf dokumenty po jednom nahráme na server a spracujeme asi takto na stránke služby:
- vybrať -vyhľadať súbor (search file)
- nahrať na server (upload) - zobrazí sa nahraný súbor
- spracovať (run OCR)
- po pár sekundách sa objaví pole s rozoznaným textom.

A teraz to náročnejšie. Program rozozná text v závislosti od písma, kvality skenu a stavu papiera. Z políčka z textom potom kopírujeme text a vkladáme do programu, ktorým ho budeme upravovať - Libre Writer, OO Writer, Word, alebo iný textový editor. Postupne dáme spracovať ostatné stránky jednotlivých súborov. Hotové texty upravujeme podľa potreby, veľkosť, font, nadpisy a podobne. OCR softvér rozoznáva len text nezobrazí nadpisy a tučné písmo a podobne, to si musí každý prispôsobiť následne v editore. V každom prípade je to veľmi užitočný nástroj, ktorý určite dokáže ušetri more času niekomu, kto ho využije. Je dobré mať po ruke niečo také a tak odporúčam dať si tieto služby do záložiek, alebo proste mať na pamäti že rozpoznávanie písma z naskenovaných obrázkov a dokumentov vykonáva softvér s označení OCR.
Okrem online služieb sú samozrejme aj programy, ktoré si stiahnete a inštalujete. To vyhovuje tomu, kto by to potreboval opakovane, alebo na náročnú úlohu. Stačí hľadať OCR na stiahnutie. Osobne som skúsil " gscan2pdf" pre Linux a fungovalo to. Pre Windows je tu určite pár takýchto aplikácia a určite aj zadarmo - freeware, open source a podobne. Vdaka vývojárom za takéto skvelé nástroje.
Komentáre
Celkom 0 kometárov