PDF OCR — Metin Çıkar
Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.
Laddar upp…
Så utför du OCR på PDF
-
1
Ladda upp skannad PDFDra filen till uppladdningsområdet. Vi stöder skanningar upp till 100 MB, hundratals sidor.
-
2
Välj dokumentspråkAnge textens huvudspråk för att öka igenkänningsnoggrannheten. Flera språk kan väljas.
-
3
Ladda ner PDF med igenkänd textKlicka på «Känn igen» och få en PDF där du kan välja, kopiera och söka i text.
Vem är det för?
PDF OCR är till för alla som sitter fast med skanningar de inte kan söka i eller kopiera — studenter som digitaliserar gamla läroböcker, jurister som plockar ut en klausul ur ett inskannat avtal och ekonomer som arkiverar pappersfakturor. Tänk dig att du har fotograferat en utskriven sida och nu behöver ett stycke ur den: kör OCR så kan du markera och kopiera den texten rakt in i ett e-postmeddelande eller i Word i stället för att skriva av den för hand.
Hjälp oss att förbättra
Betygsätt detta verktyg, din feedback är värdefull!
Vad är OCR för PDF?
OCR (Optisk Teckenigenkänning) förvandlar skannade PDF till redigerbara och sökbara dokument. En bild med text blir text som du kan kopiera, söka i och redigera.
Vi använder egen OCR-teknik som förfinats under åren för högsta möjliga noggrannhet. Över 100 språk inklusive turkiska, engelska, tyska, spanska, arabiska, japanska, kinesiska – dina skanningar blir verklig sökbar text.
Bakom kulisserna skannar OCR varje sida efter formerna på bokstäver och siffror, matchar dem mot tränade teckenmodeller och skriver tillbaka resultatet som ett dolt textlager som är inriktat på var orden visas i bilden. Eftersom den ursprungliga sidbilden lämnas orörd ser dokumentet exakt likadant ut — du märker skillnaden först när du söker, markerar eller kopierar. Ju renare källa, desto bättre resultat: skarpa skanningar på 300 DPI, raka sidor och god kontrast ger nästan perfekt text, medan sneda, suddiga eller dåligt belysta bilder leder till fel. Att välja rätt dokumentspråk hjälper också motorn att skilja på tecken som liknar varandra och bokstäver med accenter. När det är klart fungerar den sökbara PDF-filen i vilken läsare som helst och är redo för arkivering, indexering eller vidare redigering.
Varför OCR med PDF7?
50+ språk
Utbildade modeller för allt från engelska till gammelgrekiska. Välj ditt språk för bästa noggrannhet.
Hög noggrannhet
95-99% noggrannhet på kvalitetsskanningar. Stöd för flerkolumnslayouter och tabeller.
Behåll layout
Text känns igen ovanpå bilden — sidorna ser likadana ut som tidigare.
Sökning och kopiering
Efter OCR kan du söka i PDF, kopiera och markera text. Användbart för arkivhantering.
Vanliga frågor
Hur noggrann är igenkänningen?
Vår OCR-motor når 95-99% noggrannhet på rena moderna skanningar (300 DPI, väl upplyst). Gamla, bleka eller lågupplösta skanningar sjunker till 80–90 %. Skanna om eller ta ett tydligare foto för bättre resultat.
Fungerar det med handstil?
Vår OCR är tränad på tryckt text. Kursiv handstil är i stort sett oläslig. Blockutskrift med penna fungerar ibland — prova och se.
Bevaras originalets utseende?
Ja, text läggs ovanpå bilden. Sidor ser likadana ut, men text är kopierbar.
Hur lång tid tar OCR?
Ungefär 2-5 sekunder per sida. Ett 100-sidigt dokument bearbetas på 5-10 minuter.
Förändrar OCR hur min PDF ser ut?
Nej. De ursprungliga inskannade sidbilderna lämnas precis som de är. PDF7 lägger bara till ett osynligt textlager bakom bilden, så att filen ser identisk ut men blir sökbar och markerbar. Teckensnitt, stämplar, signaturer och layout sitter alla kvar på sin plats.
Finns det någon gräns för filstorlek eller antal sidor?
Du kan bearbeta dokument med flera sidor på en gång; stora inskannade PDF-filer på tiotals MB hanteras utan problem. Bildsidor med mycket hög upplösning tar bara lite längre tid att bearbeta. Om en fil är ovanligt stor går det snabbare om du först delar upp den i mindre PDF-filer.