Alla ämnen

+
Home > Ressurs > PDF > kunnskap om optisk tegngjenkjenning (OCR)

Kunnskap om optisk tegngjenkjenning (OCR)

Hva er OCR?

Optisk tegngjenkjenning, vanligvis forkortet til OCR, er den mekanisk eller elektronisk oversettelsen av skannede bilder av håndskrevet, maskinskrevet eller trykt tekst til maskin-kodet tekst.

Hvorfor bruke OCR?

OCR er mye brukt til å konvertere ulike typer dokumenter, for eksempel skannede papirdokumenter, PDF-filer eller bilder tatt med et digitalkamera til redigerbare og søkbare data. I noen profesjonelle miljøer (for eksempel biblioteker, kontorer) skannes tusenvis av bøker og dokumenter regelmessig for sikkerhetskopiering og arkiv. En skanner tar bare bilder av de opprinnelige papirdokumenter og resulterer i avbildningsbaserte skannede dokumenter i PDF-format. De største problemet med behandling og lagring av slike store mengder skannede dokumenter er manglende evne til å søke etter en bestemt setning eller et navn i en fil. Også kan ingen tekst være uthevet, kopiert eller endret, fordi dokumentet inneholder én stor bildefil i motsetning til individuelle tekstsymboler.

OCR Sample

Før du utfører OCR, hele området på siden er valgt og uthevet og ingen tekst kan søkte og redigeres.

Etter utføre OCR, teksten kan velges med valgt verktøyet, kan du søke og redigere tegn, ord og avsnitt lett.

Hvordan Wondershare PDF OCR verktøy hjelper du?

Wondershare PDF OCR verktøy kan hjelpe deg med å gjenkjenne tekst fra skannede PDF raskt og nøyaktig og bevare anerkjent resultatene i mangfoldig redigerbar formatter.

Wondershare PDF Editor Pro for Mac: med fremragende OCR nøyaktighet og format bevaring, kan du søke i, rette opp og kopiere teksten i en skannet eller bilde-basert PDF direkte på Mac. Den likeledes innrømmer du å eksportere skannede PDF filer til formatert tekst basert Word, Excel, PowerPoint, EPUB, HTML og tekst formatter.

Wondershare PDF Converter Pro: gjenkjenne tekst fra skannede PDF med fremragende OCR-nøyaktighet og kan konvertere flere skannede PDF-filer til tekstbaserte Word, Excel, PowerPoint, EPUB, HTML og tekst dokumenter på Windows.


Wondershare PDF Converter Pro for Mac: gjenkjenne tekst fra skannede PDF med fremragende OCR-nøyaktighet og kan konvertere flere skannede PDF-filer til tekstbaserte Word, Excel, PowerPoint, EPUB, HTML og tekst dokumenter på Mac.

Hvordan forbedre OCR anerkjennelse kvalitet?

OCR anerkjennelse kvalitet avhenger i stor grad på kvaliteten på bildet, som mye avhenger av innstillingene under dokumentet skanneprosess. For å få bedre OCR anerkjennelse kvalitet for skannede dokumenter, er her noen tips for dokumentet skanning:

Skriften er for liten
For optimal resultater, kan du skanne dokumenter i svært små skrifter ved høyere oppløsninger.
Du kan angi ønsket oppløsning i oppløsning -egenskapen for ScanSourceSettings .


Kildebilde Anbefalt oppløsning
Reader 300 ppt for typiske tekster (trykket i skrifter av størrelse 10 punkt eller større)
Reader 400-600 ppt for tekster trykt i små fonter (9pt eller mindre)

Tuning lysstyrke
Du må kanskje justere innstillingen for lysstyrke når du skanner i svart-hvitt-modus. Du kan angi ønsket lysstyrke i lysstyrke -egenskapen for ScanSourceSettings . En middels verdi av rundt 50% bør være tilstrekkelig i de fleste tilfeller.
Hvis det resulterende bildet inneholder for mange «revet» eller "fast" sammen bokstaver, må du feilsøke tabellen under.

Bildet ser slik ut Anbefalinger
Good Quality Dette bildet er egnet for anerkjennelse
Very Light
tegn er "oppstykket" eller veldig lett
  • Senk lysstyrken for å gjøre bildet mørkere.
  • Skann i gråtone. Lysstyrke vil være innstilt på automatisk.
  • Very Dark
    tegnene er veldig forvrengt, holdt sammen, eller fylt ut
  • Øke å gjøre bildet lysere
  • Skann i gråtone. Lysstyrke vil være innstilt på automatisk.
  • Utskriftskvalitet
    Dårlig kvalitet dokumenter med "støy" (dvs. tilfeldig svarte prikker eller flekker), uklare og ujevn bokstaver eller skjev linjer og skiftet tabellkantlinjer kan kreve skanning innstillinger. For eksempel denne faks og avis:

    Print Quality

    Dårlig kvalitet dokumenter skannes best i gråtoner. Når du skanner i gråtone, vil programmet velge optimal lysstyrkeverdien automatisk.
    Gråtonemodus beholder mer om bokstavene i den skannede teksten å oppnå bedre resultater når erkjenner dokumenter av middels til dårlig kvalitet.


    Relaterte artikler

    Produktrelaterte spørsmål? Snakker direkte til vårt Support Team >>

    Topp