Hoe een gescande PDF te vertalen
TABLE OF CONTENTS
Gescande PDF’s lijken op gewone documenten, maar elke pagina is slechts een platte afbeelding. Als je dat bestand direct in machinevertaling stopt, verlies je de opmaak, worden karakters verkeerd gelezen en loop je het risico gevoelige gegevens naar de verkeerde dienst te lekken. Een betere workflow: reinig de scan, voer nauwkeurige OCR uit, vertaal op een veilig platform en herstel de lay-out voordat je publiceert.
In een oogopslag:
- Controleer de scankwaliteit zodat OCR een kans heeft en je secties opmerkt die onaangetast moeten blijven.
- Kies OCR-software met taalpakketten en privacy-instellingen die overeenkomen met de inhoud van het document.
- Vertaal vanuit een schoon DOCX of doorzoekbare PDF die koppen, tabellen en verwijzingen behoudt.
- Herstel de tekst in de doeltaal, voer vervolgens tweetalige QA uit om te bevestigen dat nummers, namen en juridische formuleringen behouden zijn gebleven.
Waarom Gesaneerde PDF’s Extra Werk Nodig Hebben
Een op afbeeldingen gebaseerde PDF heeft nul live tekstlagen. Dat betekent:
- Zoekmachines en CAT-tools kunnen de woorden niet lezen zonder OCR.
- Kopiëren en plakken dupliceert visuele glitches, verborgen kolommen en artefacten.
- Machinevertaling behandelt het bestand als een afbeelding, waardoor je ontbrekende alinea’s of verminkte karakters krijgt.
- Gevoelige gegevens blijven blootgesteld als je het volledige bestand uploadt naar een openbare OCR-webapp.
Het vertalen van een gescand document is eerst een conversieproject en daarna een taalproject. Investeer tijd in voorbereiding en je verkort de correctielus later.
Pre-Vertaling Checklist
Gebruik deze snelle controle voordat je enige tools opent:
- Rechten en naleving: Bevestig dat u de bevoegdheid heeft om te vertalen, vooral voor medische, juridische of HR-bestanden. Bepaal of het document uw netwerk mag verlaten.
- Scan basisprincipes: Zoek naar een resolutie van 300 DPI of hoger, rechte pagina’s, duidelijk contrast en minimale doorschijnendheid. Let op eventuele handgeschreven notities of stempels.
- Taalbereik: Identificeer de bron-dialect, speciale terminologie en de exacte doeltaalvariant (bijv. en-GB vs en-US). Haal nu termenbanken of woordenlijsten op.
- Opmaak eigenaardigheden: Markeer tabellen, lay-outs met meerdere kolommen, handtekeningen, zegels of watermerken zodat u kunt plannen hoe u deze kunt behouden.
- Verwachtingen voor doorlooptijd: Stem belanghebbenden af op het leveringsformaat (DOCX, doorzoekbare PDF, tweetalige tabel), tijdlijn en beoordelingsverantwoordelijkheden.
Als meer dan twee checklistitems niet voldoen, opnieuw scannen of een beter origineel aanvragen voordat u verder gaat.
Stap 1 — Maak de Scan Snel Schoon
Een paar minuten schoonmaken verbetert de OCR-nauwkeurigheid aanzienlijk.
- Rechtzetten en bijsnijden: Rechtzetten van scheve pagina’s, randen bijsnijden en zwarte randen verwijderen. De meeste PDF-editors en gratis tools zoals ScanTailor of Adobe Acrobat’s Enhance Scans doen dit snel.
- Contrast verhogen: Voor zwakke tekst, contrast verhogen of overschakelen naar grijstinten; het ophelderen van de achtergrond vermindert ruis.
- Bestand splitsen: Scheid niet-gerelateerde documenten of extra invoegingen zodat de OCR-engine consistente opmaak ziet.
- Annoteren van een kopie: Noteer secties die onaangeroerd moeten blijven (handtekeningen, stempels). Zet deze apart als referentiebeelden.
Als de scan slecht is: Wanneer pagina’s wazig of uit het midden zijn, opnieuw scannen op 300 DPI in grijstinten, automatische compressie uitschakelen en een flatbed gebruiken als het origineel gebonden is.
Stap 2 — Voer OCR Uit Die U Kunt Vertrouwen
Kies voor OCR-software die uw taalpaar begrijpt en vertrouwelijkheid respecteert.
- Kies de engine: Desktop (ABBYY FineReader, Adobe Acrobat, Readiris) biedt de hoogste nauwkeurigheid en lokale verwerking. Cloud (Google Drive OCR, Azure AI Vision) schaalt voor grote batches. Mobiele scanners (Prizmo, Microsoft Lens) werken voor het vastleggen onderweg, maar controleer de nauwkeurigheid dubbel.
- Installeer taalpakketten: Schakel woordenboeken in voor de brontaal, doeltaal en aanvullende scripts (Cyrillisch, Arabisch, vereenvoudigd/traditioneel Chinees).
- Stel exportopties in: Kies DOCX of doorzoekbare PDF met tekst over afbeelding. Behoud tabellen en houd verborgen tekst zichtbaar voor latere QA.
- Controleer pagina’s: Controleer complexe secties—kolommen, voetnoten, zegels—om te bevestigen dat tekens correct zijn geconverteerd. Sla zowel de OCR-uitvoer als de originele scan op.
Upload geen vertrouwelijke bestanden naar cloud OCR-diensten zonder expliciete toestemming en een ondertekende gegevensverwerkingsovereenkomst.
Stap 3 — Bereid de Export voor op Vertaling
Je doel is nu een schoon, gestructureerd bestand dat vertalers of tools kunnen verwerken zonder de lay-out te verstoren.
- Normaliseer stijlen: Pas kop- en alinea-stijlen toe, stem lettertypefamilies af en standaardiseer de ruimte. Dit voorkomt dat AI-tools nieuwe opmaak verzinnen.
- Herstel tabellen en lijsten: Herbouw samengevoegde cellen, zorg ervoor dat opsommingstekens een enkele stijl gebruiken, en zet afbeeldingen-met-tekst om in bewerkbare vormen of callouts.
- Extraheer niet-tekst elementen: Voor stempels of handgeschreven aantekeningen die je wilt vertalen, maak ze opnieuw met vectortools of bereid vertaalde labels voor.
- Beveilig referenties: Vergrendel secties zoals financiële tabellen of juridische clausules die onaangeroerd moeten blijven; voeg opmerkingen toe met de aanduiding “niet vertalen” waar nodig.
- Maak een vertaalbriefing: Voeg publiek, toonrichtlijnen, woordenlijstlinks en opmaakinstructies toe zodat degene die vertaalt de beperkingen kent.
Sla dit voorbereide bestand op als je master .docx of .idml, en bewaar de OCR-uitvoer als back-up.
Stap 4 — Vertaal met de Juiste Workflow
Kies het vertaalpad dat past bij de inzet, het volume en het budget van het document.
- Computer-assisted translation (CAT): Importeer de DOCX in SDL Trados, memoQ, Phrase of Lokalise. Maak gebruik van vertaalgeheugens en termenbanken om consistentie te waarborgen en te voorkomen dat vergrendelde secties per ongeluk worden bewerkt.
- AI-assisted translation: Voor interne concepten, gebruik privacygerichte AI-diensten waarmee u documenten veilig kunt uploaden. Voer kleine batches uit en beoordeel vervolgens elk segment aan de hand van de bron.
- Human experts: Gevoelige, juridische of klantgerichte documenten moeten naar professionele vertalers gaan. Geef de briefing, woordenlijst en QA-verwachtingen vooraf.
Welke weg u ook kiest, plan een interne reviewer of taalkundige in om het doelbestand te verifiëren. Machine-output heeft altijd menselijke QA nodig voor namen, nummers en toon.
Stap 5 — Herstel Lay-out en QA
Zodra de vertaling is goedgekeurd, zorg ervoor dat het eindproduct eruitziet als het origineel.
- Herstel de lay-out: Pas tekstvakken, kolommen en tabelbreedtes aan voor de doeltaal. Voeg witruimte toe of verklein deze waar zinnen uitzetten of krimpen.
- Herplaats afbeeldingen: Vervang of werk afbeeldingen, zegels en handtekeningen bij. Wanneer vertalingen in afbeeldingen zijn verwerkt, exporteer dan vervangingen van hoge resolutie.
- Typografie-audit: Bevestig dat lettertypen het doeltekenset ondersteunen; vervang met gelicentieerde equivalenten indien nodig.
- Tweetalige QA: Gebruik een checklist om bron en doel naast elkaar te vergelijken. Verifieer nummers, datums, juridische verwijzingen, kruisverwijzingen en hyperlinks.
- Eindcorrectie: Laat een native speaker de doel-PDF in context lezen. Exporteer het eindbestand naar een afgevlakte PDF en een volledig bewerkbare DOCX voor toekomstige updates.
Archiveer de bronscan, OCR-output en vertaalmiddelen samen zodat toekomstige updates uren in plaats van dagen duren.
Op zoek naar een end-to-end snelkoppeling?
OpenL ondersteunt directe vertaling van gescande PDF’s met ingebouwde OCR, privacycontroles en behoud van de lay-out. Upload het bestand, kies je doeltaal en bekijk de tweetalige output voordat je exporteert. Zie de workflow op doc.openl.io/translate/pdf.
Aanbevolen Tools en Sjablonen
| Behoefte | Beste voor | Voorbeeld Tool | Opmerkingen |
|---|---|---|---|
| Scan opschonen | Rechtzetten, contrastcorrecties | Adobe Acrobat Enhance Scans, ScanTailor Advanced | Lokale verwerking; houd originelen ongewijzigd. |
| OCR nauwkeurigheid | Meertalige documenten | ABBYY FineReader, Tesseract (met GUIs), Azure AI Vision | Installeer taalpakketten en aangepaste woordenboeken. |
| Veilige vertaling | Gevoelige inhoud | memoQ, Phrase On-Premise, DeepL Teams | Controleer gegevenslocatie en vertrouwelijkheidsclausules. |
| Alles-in-één pipeline | Directe vertaling van gescande PDF’s | OpenL PDF Translator | Upload eenmaal, pas OCR + vertaling toe en exporteer dan tweetalige bestanden. |
| Lay-out herbouwen | Complexe tabellen & grafieken | Microsoft Word Styles, InDesign, Affinity Publisher | Dupliceer stijlen voordat je vertalingen importeert. |
| QA checklist | Tweetalige beoordeling | Xbench, Verifika, aangepaste Google Sheet | Markeer namen, nummers, afkortingen en opmaak. |
Heb je een snelle start nodig? Bouw een gedeelde map met de scan, OCR-uitvoer, vertaalbrief, woordenlijst en QA-checklist. Iedereen die halverwege het project instapt, kan direct aan de slag.
Laatste Tips
- Sla incrementele versies op bij elke mijlpaal (voorbereide OCR, overdracht vertaler, QA voltooid) zodat je direct kunt terugkeren als de opmaak breekt.
- Als je twijfelt over de betrouwbaarheid van OCR, voer dan een woordentelling vergelijking uit: het OCR-bestand en het vertaalde bestand moeten nauwkeurig overeenkomen.
- Voor terugkerende documenttypen (maandelijkse overzichten, producthandleidingen), maak van deze workflow een standaard operationele procedure en hergebruik je woordenlijsten en sjablonen.
Vertaal eerste versies snel, maar bescherm de nauwkeurigheid met gestructureerde voorbereiding en kwaliteitscontrole—deze combinatie zorgt ervoor dat klanten, regelgevers en lezers vertrouwen hebben in elke pagina.


