If-Koubou

5 bezmaksas tiešsaistes OCR pakalpojumi, kurus testē un pārbauda

5 bezmaksas tiešsaistes OCR pakalpojumi, kurus testē un pārbauda (Atdzist vietnes)

Vai jums ir PDF dokuments vai attēls, kuru vēlaties pārvērst par tekstu? Nesen kāds man nosūtīja dokumentu pa pastu, kas man bija nepieciešams rediģēt un nosūtīt atpakaļ ar labojumiem. Persona nevarēja atrast ciparu kopiju, tāpēc man bija pienākums iegūt visu šo tekstu ciparu formātā.

Nebija tā, ka es gribētu pavadīt stundas, rakstot visu atpakaļ, tāpēc es beidzot uzņēma jauku un kvalitatīvu dokumenta attēlu un pēc tam sadedzināja manu ceļu caur daudzām OCR pakalpēm, lai redzētu, kurš no tiem man dos vislabāko rezultātus.

Šajā rakstā es ietu pāris manas iecienītākās OCR vietas, kuras ir pieejamas bez maksas. Ir vērts atzīmēt, ka lielākā daļa no šīm vietnēm nodrošina bezmaksas bezmaksas pakalpojumu, un pēc tam ir apmaksātas iespējas, ja vēlaties izmantot papildu iespējas, piemēram, lielākus attēlus, vairāku lapu PDF dokumentus, dažādas ievades valodas u.c.

Ieteicams arī iepriekš zināt, ka lielākā daļa no šiem pakalpojumiem nespēs saskaņot sākotnējā dokumenta formatējumu. Tie galvenokārt ir teksta ieguvei, un tas tā ir. Ja jums ir nepieciešams viss, lai tas būtu konkrētā izkārtojumā vai formātā, jums tas būs jāveic manuāli, tiklīdz jūs saņemsiet visu tekstu no OCR.

Turklāt labākie teksta iegūšanas rezultāti tiks iegūti no dokumentiem ar izšķirtspēju no 200 līdz 400 DPI. Ja jums ir zems DPI attēls, rezultāti nebūs tik labi.

Visbeidzot, tika pārbaudītas tik daudz vietnes, ka nedarbojās. Ja jūs izmantojat Google bezmaksas tiešsaistes optisko saiti, jūs redzēsiet vairākas vietnes, taču no 10 populārākajām vietnēm vairākas vietnes pat neveica reklāmguvumu. Daži no tiem varētu zaudēt laiku, citi radītu kļūdas, un daži vienkārši iestrēdza lapas "konvertēšana", tāpēc es pat neuztraucu pieminēt šīs vietnes.

Katrai vietnei es pārbaudīju divus dokumentus, lai noskaidrotu, cik labi produkcija būtu. Maniem testiem es vienkārši izmantoju savu iPhone 5S, lai uzņemtu abu dokumentu attēlu un pēc tam tos augšupielādētu tieši reklāmguvumu vietnēs.

Ja vēlaties redzēt, kādi attēli izskatījās, ko izmantoju manam pārbaudījumam, es tos pievienoju šeit: Test1 un Test2. Ņemiet vērā, ka no tālruņa nav ņemtas pilnīgas izšķirtspējas versijas. Augšupielādējot vietnes, es izmantoju pilnas izšķirtspējas attēlu.

OnlineOCR

OnlineOCR.net ir tīra un vienkārša vietne, kas manā testā sniedza ļoti labus rezultātus. Galvenais, kas man patīk, ir tāds, ka tam nav daudz reklāmu visā vietā, kas parasti notiek ar šīm nišas pakalpojumu vietnēm.

Lai sāktu, izvēlieties failu un gaidiet, kamēr tā beigsies augšupielāde. Šīs vietnes maksimālais augšupielādes lielums ir 100 MB. Ja reģistrējat bezmaksas kontu, jums ir dažas papildu funkcijas, piemēram, lielāks augšupielādes lielums, vairāku lapu PDF faili, dažādas ievades valodas, vairāk reklāmguvumu stundā utt.

Pēc tam izvēlieties ievades valodu un pēc tam izvēlieties izvades formātu. Jūs varat izvēlēties no Word, Excel vai Plain Text. Noklikšķiniet uz Konvertēšana pogu un jūs redzēsiet tekstu lodziņā apakšā un lejupielādes saiti.

Ja viss, ko vēlaties, ir teksts, vienkārši kopējiet un ielīmējiet to no lodziņa. Tomēr es iesaku jums lejupielādēt Word dokumentu, jo tas pārsteidzoši lieliski veicina sākotnējā dokumenta izkārtojuma saglabāšanu.

Piemēram, kad atveru Word dokumentu manam otrajam testam, esmu pārsteigts, ka dokumentā ir iekļauta tabula ar trim kolonnām, tāpat kā attēlā.

No visām vietnēm šis bija vislabākais līdz šim. Tas ir pilnīgi vērts reģistrēties, ja jums ir nepieciešams veikt daudz reklāmguvumu.

Lai iegūtu pilnību, es arī gatavojas izveidot saiti uz katra pakalpojuma izveidotajiem izvades failiem, lai jūs varētu redzēt rezultātus sev. Šeit ir rezultāti OnlineOCR: Test1 Doc un Test2 Doc.

Ņemiet vērā, ka, atverot šos Word dokumentus savā datorā, jūs saņemsit ziņu Word, norādot, ka tas ir no interneta, un rediģēšana ir atspējota. Tas ir pilnīgi pareizi, jo Word neuzticas dokumentiem no interneta un jums tiešām nav jāiespējo rediģēšana, ja vēlaties vienkārši skatīt dokumentu.

i2OCR

Vēl viena vietne, kas sniedza diezgan labus rezultātus, bija i2OCR. Process ir ļoti līdzīgs: izvēlieties savu valodu, failu un pēc tam nospiediet Teksta izvilkums.

Tev jāgaida minūti vai divi šeit, jo šī vietne aizņem mazliet ilgāku laiku. Tāpat arī 2. darbībā pārliecinieties, ka priekšskatījumā labajā pusē attēla attēls tiek rādīts labajā pusē, pretējā gadījumā jūs saņemsiet ķekarus, kā izejas. Kādu iemeslu dēļ mana iPhone attēli portreta režīmā tika rādīti manā datorā, bet ainavu, kad augšupielādēju šo vietni.

Man vajadzēja manuāli atvērt attēlu fotoattēlu rediģēšanas lietojumprogrammā, pagriezt to par 90 grādiem, pēc tam pagriezt atpakaļ uz portretu un pēc tam to vēlreiz saglabāt. Kad tas ir pabeigts, ritiniet uz leju un tā parādīs teksta priekšskatījumu kopā ar lejupielādes pogu.

Šī vietne veiksmīgi izturēja pirmā testa rezultātu, taču tā nebija tik veiksmīga kā otrais tests ar kolonnu izkārtojumu. Šeit ir i2OCR rezultāti: Test1 Doc un Test2 Doc.

FreeOCR

Free-OCR.com uzņems jūsu attēlus un pārvērsīs tos vienkāršā tekstā. Tai nav iespēju eksportēt uz Word formātu. Izvēlieties savu failu, izvēlieties valodu un pēc tam noklikšķiniet uz Sākt.

Vietne ir ātra un jūs saņemsiet izvadi diezgan ātri. Vienkārši noklikšķiniet uz saites, lai lejupielādētu teksta failu savā datorā.

Tāpat kā ar NewOCR, kas minēts tālāk, šī vietne kapitalizē visus T dokumentā. Man nav ne jausmas, kāpēc tas būtu jādara, taču par kādu nepāra iemeslu dēļ šī vietne un NewOCR abi to darīja. Tas nav liels darījums, lai to mainītu, bet tas ir garlaicīgs process, kas jums patiešām nebūtu jādara.

Šeit ir rezultāti no FreeOCR: Test1 Doc un Test2 Doc.

ABBYY FineReader Online

Lai izmantotu FineReader Online, jums ir jāreģistrējas kontam, kas jums piešķir 15 dienu bezmaksas izmēģinājuma versiju, lai OCR atbrīvotu līdz pat 10 lappusēm bez maksas. Ja jums tikai jāveic pāris lappušu vienreizējs OCR, varat izmantot šo pakalpojumu. Pārbaudiet, vai esat noklikšķinājis uz verificēšanas saites, kas atrodas apstiprinājuma e-pasta ziņojumā pēc reģistrēšanās.

Klikšķiniet uz Atpazīt augšpusē un pēc tam noklikšķiniet uz Augšupielādēt lai atlasītu failu. Izvēlieties savu valodu, izvades formātu un pēc tam noklikšķiniet uz Atpazīt apakšā. Šai vietnei ir tīrs interfeiss, kā arī nav reklāmu.

Manos testos šī vietne varēja greifers tekstu no pirmā testa dokumenta, bet tā bija absolūti milzīga, kad es atvēru Word doc, tāpēc es beidzot to darīju atkal un izvēlējos tekstu kā izejas formātu.

Otrajam testam ar kolonnām Word dokuments bija tukšs, un es to pat nevarēju atrast. Neesat pārliecināts, kas šeit noticis, bet nešķiet, ka varētu rīkoties nekas, kas nav vienkārši punkti. Šeit ir rezultāti no FineReader: Test1 Doc un Test2 Doc.

NewOCR

Nākamā vietne, NewOCR.com, bija kārtībā, bet ne gandrīz tikpat labi kā pirmā vietne. Pirmkārt, tam ir reklāmas, bet par laimi nav ton. Vispirms izvēlieties failu un pēc tam noklikšķiniet uz Priekšskatījums poga

Pēc tam varat pagriezt attēlu un pielāgot apgabalu, kurā vēlaties skenēt tekstu. Tas ir diezgan daudz, piemēram, kā skenēšanas process darbojas datorā ar pievienoto skeneri.

Ja dokumentam ir vairākas slejas, varat pārbaudīt Lapas izkārtojuma analīze pogu, un tā centīsies sadalīt tekstu uz augšu kolonnās. Noklikšķiniet uz OCR pogas, pagaidiet dažas sekundes, lai to pabeigtu, un pēc tam ritiniet lejup līdz lejup, kad lapa tiek atsvaidzināta.

Pirmajā testā tas pareizi uztvēra visu tekstu, bet kāda iemesla dēļ katrs T dokumentā tika kapitalizēts! Neviena ideja, kāpēc tas būtu izdarīts, bet tas notika. Otrajā testā, kurā tika iespējota lapu analīze, tā ieguva lielāko daļu teksta, taču izkārtojums bija pilnīgi izslēgts.

Šeit ir rezultāti no NewOCR: Test1 Doc un Test2 Doc.

Secinājums

Kā redzat, brīvais laiks diemžēl nedod jums ļoti labus rezultātus. Iepriekš minētā pirmā vietne ir labākā, jo tā ne tikai padarīja lielisku darbu, atzīstot visu tekstu, bet arī izdevās saglabāt oriģinālā dokumenta formātu.

Tomēr, ja jums vajag tikai tekstu, lielākā daļa no iepriekš minētajām vietnēm var to izdarīt jums. Ja jums ir kādi jautājumi, nekautrējieties komentēt. Izbaudi!