Kako pretvoriti skenirane dokumente u Word - sretni Android

Ako trebate digitalizirati knjigu u tekstualnom formatu, možda ćete imati nekoliko pitanja. Može li se to učiniti? Što kažete na kvalitetu, je li dobra? Ne samo da se to može učiniti, već postoji i nekoliko načina za pretvaranje skeniranog dokumenta u Word. Da vidimo:

  • Skeniranje dokumenta u PDF formatu i njegovo uređivanje kasnije s Adobe Acrobat XI Pro za spremanje u Word formatu. Pro verzija Acrobata se plaća, ali možete kupiti besplatnu probnu licencu od 30 dana.
  • S web stranice OnlineOCR.net. Ova web aplikacija omogućuje vam pretvaranje dokumenata u PDF, JPG, TIFF i GIF formatima u Word, Excel i tekst. U besplatnoj verziji možemo pretvoriti do 15 stranica na sat i dokumente ne više od jedne stranice.
  • Skeniranje dokumenta u (OCR) formatu i spremajući ga kao tekst. Tada možemo otvoriti Word i urediti ga ili spremiti u .doc formatu.
  • Korištenje nekog optičkog programa za prepoznavanje znakova:
    •  VueScan (dostupno za Windows, Mac OS X i Linux)
    • Kooka(za Linux)
    • Uredska leća (za Android i ios)
    • CamScanner (za Android i ios)

Najučinkovitiji način od svega što bismo mogli reći je putem Adobe Acrobat Pro, ali samo ako je skeniranje vrlo, vrlo čisto i visokokvalitetno. Optičke aplikacije za prepoznavanje znakova daleko su napredovale, ali i dalje pokazuju rupe s stvarima poput podebljane ili kurzivne oznake, a transkripcija nekih riječi ovisno o vrsti fonta izvornog dokumenta može biti pogrešna.

Pokušajte skenirati i proslijediti ovaj dokument u Word da biste vidjeli što se događa

Iz samog skenera

Neki skeneri uključuju optičko prepoznavanje (OCR) u svoj vlastiti program za skeniranje. Da biste dokument skenirali u tekst, morate postaviti format digitalizacije i pogledati onaj koji se odnosi na OCR ili slično (to ovisi o marki / modelu skenera).

Pređite s PDF-a na Word pomoću programa Adobe Acrobat XI Pro

Jednom kada je Adobe Acrobat XI Pro (OVDJE imate 30-dnevno besplatno probno razdoblje) idite na “Alati -> Prepoznavanje teksta -> U ovoj datoteci”.

U prozoru "Prepoznajte tekst"Kliknite na"Uredi”I odaberite jezik teksta, stil izlaza i razlučivost.

Napokon se vratite na "Alati -> Uređivanje sadržaja -> Uređivanje teksta i slika”I izmijenite tekst ako trebate ispraviti riječ. Za kraj kliknite "Datoteka -> Spremi kao”I spremite ga u Word formatu.

OnlineOCR

OnlineOCR je web aplikacija za prijenos slika ili pdfs-a u Word i vrlo je jednostavna za upotrebu. Objasnit ću kako to radi: Enter //www.onlineocr.net/ i kliknite na "Odaberite datoteku". Odaberite skenirani dokument, a zatim odaberite jezik i format izlaza iz 2 padajuća izbornika koja imate u središtu zaslona.

Za kraj kliknite na "Pretvoriti". Odmah ispod pojavit će se pregled običnog teksta koji možete urediti ako trebate ispraviti bilo koju riječ. Na kraju kliknite "Preuzmite izlaznu datoteku”I datoteku ćete moći preuzeti u Word formatu. Evo primjera PDF-a pretvorenog u Word pomoću OnlineOCR:

  • Izvorni PDF:

  • Pretvoreni dokument:

Ako vas ova web aplikacija ne zadovoljava, možete isprobati druge slične alternative poput FreeOCR ili Besplatno-Online-OCR.

Programi za optičko prepoznavanje znakova (OCR)

Ako ne želite mijenjati svoje dokumente na mreži i trebate stolnu aplikaciju, možete koristiti programe kao što su VueScan (koji je uz sveprisutni Windows dostupan i za Mac i Linux).

Druga je mogućnost koristiti svoj Android ili iOS uređaj za skeniranje dokumenta i njegovo izravno pretvaranje u tekst. Postoje aplikacije poput Uredska leća (da bi Android i ios) ili CamScanner (da bi Android i ios) koji izvode cijeli postupak iz iste aplikacije. U tim se slučajevima preporučuje očistiti sliku prije pretvaranja u tekst. Ako želite znati više o ovoj metodi, pogledajte OVAJ POST.

Po mom mišljenju, tehnika optičkog prepoznavanja znakova, iako se znatno poboljšala posljednjih godina, još uvijek je udaljena svjetlosne godine od savršenog postupka. Puno detalja, puno riječi koje "prevodi" pogrešnim slovima i simbolima koji smetaju tekstu. Još mu nedostaje ta dodatna inteligencija da vidite da «t &! $ olog1a»Ne može biti važeći prijevod bilo koje riječi u tekstu. Još uvijek ne vidim razumijevanje čitanja, već jednostavno vizualno prepoznavanje pojedinih slova koja tvore riječi bez njihovog integriranja s ostatkom teksta. Međutim, uvjeren sam da se trenutak kada ćemo napraviti taj posljednji veliki iskorak svakim danom sve više približava.

Imaš li Telegram instaliran? Primite najbolji post svakog dana naš kanal. Ili ako želite, saznajte sve od naših Facebook stranica.

$config[zx-auto] not found$config[zx-overlay] not found