OCR-skannade PDF-filer: Hur man gör dem sökbara
Du har en bunt skannade kontrakt, ett gammalt bokkapitel som du fotograferat eller en mapp med kvittobilder. De ser ut som PDF-filer, men du kan inte söka i dem, kopiera text från dem eller klistra in ett namn i en sökruta. Välkommen till en värld av "bild-PDF-filer" — och OCR är din väg ut.
Vad OCR faktiskt gör
OCR (Optical Character Recognition) läser varje sida som en person skulle göra: den identifierar bokstavsformer, grupperar dem i ord och skriver dessa ord som ett textlager bakom originalbilden. Sidan ser fortfarande identisk ut – men nu är den också sökbar, kopierbar och redigerbar.
Precisionsförväntningar
- Kartig tryckt text: 95–99 % noggrannhet
- Tidning/äldre böcker: 90–95 %
- Telefonskanningar av rena dokument: 88–94 %
- Handskrift: 50–80 %, beror mycket på författaren
- Formler för matematik/kemi: Begränsat – specialiserade verktyg fungerar bättre
Språk vi stöder
Vår PDF OCR hanterar över 50 språk inklusive engelska, turkiska, tyska, franska, spanska, italienska, portugisiska, ryska, kinesiska, japanska, koreanska, arabiska, hindi. Du kan välja flera språk för dokument som blandar skript.
Tips för bättre OCR-resultat
- Använd rätt språk. Om du väljer "Engelska" på ett turkiskt dokument minskar noggrannheten till 60 %. Välj alltid språket du skannar.
- Skannningar med högre upplösning = bättre OCR. 300 DPI är det bästa stället. Under 200 DPI sjunker noggrannheten snabbt.
- Raka sidor. Om skanningen är roterad eller skev, åtgärda den med PDF-rotation först.
- Rena original. Kaffefläckar, fingrar i hörnet och mörka skuggor förvirrar OCR. Beskära den faktiska sidan om du kan.
Vad du kan göra efter OCR
När en skanning har ett textlager:
- Sök i PDF-filen (Ctrl+F)
- Kopiera text och klistra in i Word, e-post eller anteckningar
- Konvertera till Word med PDF till Word
- Översätt textinnehållet
- Gör dokumentet tillgängligt för skärmläsare
Sekretess
OCR körs på europeiska servrar. Dokument krypteras under överföring och raderas efter bearbetning. Vi behåller, delar eller analyserar inte dina skanningar.