كيفية ترجمة ملف PDF ممسوح ضوئيًا
TABLE OF CONTENTS
تبدو ملفات PDF الممسوحة ضوئيًا مثل المستندات العادية، ولكن كل صفحة هي مجرد صورة مسطحة. إذا قمت بإدخال هذا الملف مباشرة في الترجمة الآلية، فإنك تفقد التنسيق، وتخطئ في قراءة الأحرف، وتخاطر بتسريب البيانات الحساسة إلى الخدمة الخاطئة. سير عمل أفضل: نظف المسح الضوئي، قم بتشغيل OCR دقيق، ترجم على منصة آمنة، وأعد بناء التخطيط قبل النشر.
نظرة سريعة:
- قم بمراجعة جودة المسح الضوئي حتى يكون لـ OCR فرصة جيدة وتلتقط الأقسام التي تحتاج إلى البقاء دون تغيير.
- اختر برنامج OCR مع حزم لغات وإعدادات خصوصية تتناسب مع محتوى المستند.
- ترجم من ملف DOCX نظيف أو PDF قابل للبحث يحافظ على العناوين والجداول والمراجع.
- أعد تدفق النص بلغة الهدف، ثم قم بتشغيل QA ثنائي اللغة لتأكيد الأرقام والأسماء والصياغة القانونية.
لماذا تحتاج ملفات PDF الممسوحة ضوئيًا إلى عمل إضافي
ملف PDF المستند إلى الصور لا يحتوي على طبقات نص حية. هذا يعني:
- لا يمكن لمحركات البحث وأدوات CAT قراءة الكلمات بدون OCR.
- النسخ واللصق يكرر العيوب البصرية والأعمدة المخفية والآثار.
- تعامل الترجمة الآلية الملف كصورة، لذلك تحصل على فقرات مفقودة أو أحرف مشوشة.
- تبقى البيانات الحساسة مكشوفة إذا قمت بتحميل الملف الكامل إلى تطبيق ويب OCR عام.
ترجمة مستند ممسوح ضوئيًا هو مشروع تحويل أولاً ومشروع لغة ثانيًا. استثمر الوقت في التحضير وستقلل من دورة التصحيح لاحقًا.
قائمة التحقق قبل الترجمة
استخدم هذا الفحص السريع قبل فتح أي أدوات:
- حقوق الامتثال: تأكد من أن لديك السلطة لترجمة المستندات، خاصةً للملفات الطبية أو القانونية أو الموارد البشرية. قرر ما إذا كان يمكن للمستند مغادرة شبكتك.
- أساسيات المسح الضوئي: ابحث عن دقة 300 DPI أو أعلى، صفحات مستقيمة، تباين واضح، ونزيف ضئيل. لاحظ أي ملاحظات مكتوبة بخط اليد أو أختام.
- نطاق اللغة: حدد اللهجة المصدرية، المصطلحات الخاصة، والنسخة المستهدفة الدقيقة من اللغة (مثل en-GB مقابل en-US). اسحب قواعد المصطلحات أو القواميس الآن.
- غرائب التنسيق: حدد الجداول، التخطيطات متعددة الأعمدة، التوقيعات، الأختام، أو العلامات المائية حتى تتمكن من التخطيط لكيفية الحفاظ عليها.
- توقعات التحويل: توافق مع أصحاب المصلحة على تنسيق التسليم (DOCX، PDF قابل للبحث، جدول ثنائي اللغة)، الجدول الزمني، ومسؤوليات المراجعة.
إذا فشل أكثر من عنصرين من قائمة التحقق، أعد المسح أو اطلب نسخة أصلية أفضل قبل المتابعة.
الخطوة 1 — تنظيف المسح بسرعة
بضع دقائق من التنظيف تحسن دقة OCR بشكل كبير.
- تصحيح الانحراف والقص: صحح الصفحات المائلة، قص الحدود، وأزل الحواف السوداء. تقوم معظم محررات PDF والأدوات المجانية مثل ScanTailor أو Adobe Acrobat’s Enhance Scans بذلك بسرعة.
- زيادة التباين: للنصوص الباهتة، زد التباين أو انتقل إلى التدرج الرمادي؛ تفتيح الخلفية يقلل الضوضاء.
- تقسيم الملف: افصل المستندات غير ذات الصلة أو الإضافات حتى يرى محرك OCR تنسيقًا متسقًا.
- توضيح نسخة: لاحظ الأقسام التي يجب أن تبقى دون تغيير (التوقيعات، الأختام). ضع هذه جانبًا كصور مرجعية.
إذا كان المسح سيئًا: عندما تكون الصفحات ضبابية أو غير مركزية، أعد المسح بدقة 300 DPI في التدرج الرمادي، عطل الضغط التلقائي، واستخدم ماسحًا مسطحًا إذا كان الأصل مجلدًا.
الخطوة 2 — تشغيل OCR يمكنك الوثوق به
اختر برنامج OCR يفهم زوج لغتك ويحترم السرية.
- اختر المحرك: تقدم برامج سطح المكتب (ABBYY FineReader, Adobe Acrobat, Readiris) أعلى دقة ومعالجة محلية. السحابة (Google Drive OCR, Azure AI Vision) تتوسع لمعالجة دفعات كبيرة. تعمل الماسحات الضوئية المحمولة (Prizmo, Microsoft Lens) لالتقاط الصور أثناء التنقل ولكن تحقق من الدقة مرتين.
- تثبيت حزم اللغات: قم بتمكين القواميس للغة المصدر، واللغة الهدف، والنصوص الإضافية (السيريلية، العربية، الصينية المبسطة/التقليدية).
- تعيين خيارات التصدير: اختر DOCX أو PDF قابل للبحث مع نص فوق الصورة. حافظ على الجداول واجعل النص المخفي مرئيًا للمراجعة لاحقًا.
- تحقق من الصفحات: تحقق من الأقسام المعقدة - الأعمدة، الحواشي السفلية، الأختام - للتأكد من تحويل الأحرف بشكل صحيح. احفظ كل من ناتج OCR والمسح الأصلي.
لا تقم بتحميل ملفات سرية إلى خدمات OCR السحابية دون إذن صريح واتفاقية معالجة بيانات موقعة.
الخطوة 3 — إعداد التصدير للترجمة
هدفك الآن هو ملف نظيف ومنظم يمكن للمترجمين أو الأدوات استيعابه دون تفجير التنسيق.
- توحيد الأنماط: قم بتطبيق أنماط العناوين والفقرات، ووافق بين عائلات الخطوط، وقم بتوحيد التباعد. هذا يمنع الأدوات الذكية من اختراع تنسيقات جديدة.
- إصلاح الجداول والقوائم: أعد بناء الخلايا المدمجة، تأكد من أن قوائم النقاط تستخدم نمطًا واحدًا، وحول الصور مع النص إلى أشكال قابلة للتحرير أو تعليقات.
- استخراج العناصر غير النصية: بالنسبة للأختام أو التعليقات اليدوية التي تخطط لترجمتها، إما أعد إنشائها باستخدام أدوات الرسم أو أعد تحضير الملصقات المترجمة.
- تأمين المراجع: قم بقفل الأقسام مثل الجداول المالية أو البنود القانونية التي يجب أن تبقى دون تغيير؛ أضف تعليقات تشير إلى “لا تترجم” حيثما كان ذلك ضروريًا.
- إنشاء موجز الترجمة: قم بتضمين الجمهور، إرشادات النغمة، روابط القاموس، وتعليمات التنسيق حتى يعرف من يترجم القيود.
احفظ هذا الملف المُعد كملف رئيسي .docx أو .idml، واحتفظ بناتج OCR كنسخة احتياطية.
الخطوة 4 — الترجمة باستخدام سير العمل الصحيح
اختر مسار الترجمة الذي يناسب أهمية المستند وحجمه وميزانيته.
- الترجمة بمساعدة الحاسوب (CAT): قم باستيراد DOCX إلى SDL Trados أو memoQ أو Phrase أو Lokalise. استخدم ذاكرات الترجمة وقواعد المصطلحات لضمان الاتساق ومنع التعديلات العرضية على الأقسام المقفلة.
- الترجمة بمساعدة الذكاء الاصطناعي: للمسودات الداخلية، استخدم خدمات الذكاء الاصطناعي التي تركز على الخصوصية والتي تتيح لك تحميل المستندات بأمان. قم بتشغيل دفعات صغيرة، ثم راجع كل جزء مقابل المصدر.
- الخبراء البشريون: يجب أن تذهب المستندات الحساسة أو القانونية أو التي تواجه العملاء إلى مترجمين محترفين. قدم الملخص والقاموس وتوقعات ضمان الجودة مسبقاً.
أياً كان المسار الذي تختاره، قم بجدولة مراجع داخلي أو لغوي للتحقق من الملف المستهدف. دائماً ما تحتاج مخرجات الآلة إلى ضمان جودة بشري للأسماء والأرقام والنبرة.
الخطوة 5 — إعادة بناء التخطيط وضمان الجودة
بمجرد الموافقة على الترجمة، اجعل المنتج النهائي يبدو مثل الأصل.
- إعادة تدفق التخطيط: ضبط صناديق النصوص والأعمدة وعرض الجداول للغة المستهدفة. أضف أو قلل المساحات البيضاء حيث تتوسع أو تتقلص الجمل.
- إعادة إدراج الرسوم البيانية: استبدل أو حدث الصور والأختام والتوقيعات. عندما تكون الترجمات مدمجة في الرسوم البيانية، قم بتصدير بدائل عالية الدقة.
- تدقيق الطباعة: تأكد من أن الخطوط تدعم مجموعة الأحرف المستهدفة؛ استبدلها بنظائر مرخصة إذا لزم الأمر.
- ضمان الجودة ثنائي اللغة: استخدم قائمة تحقق لمقارنة المصدر والهدف جنباً إلى جنب. تحقق من الأرقام والتواريخ والمراجع القانونية والمراجع المتقاطعة والروابط التشعبية.
- التدقيق النهائي: اجعل متحدثاً أصلياً يقرأ ملف PDF المستهدف في السياق. قم بتصدير الملف النهائي إلى PDF مسطح وDOCX قابل للتحرير بالكامل للتحديثات المستقبلية.
أرشفة مسح المصدر ومخرجات OCR وأصول الترجمة معاً حتى تستغرق التحديثات المستقبلية ساعات وليس أياماً.
هل تحتاج إلى اختصار شامل؟
يدعم OpenL الترجمة المباشرة لملفات PDF الممسوحة ضوئيًا مع التعرف الضوئي على الحروف (OCR) المدمج، وعناصر التحكم في الخصوصية، والحفاظ على التنسيق. قم بتحميل الملف، واختر لغتك المستهدفة، وراجع المخرجات ثنائية اللغة قبل التصدير. انظر سير العمل على doc.openl.io/translate/pdf.
الأدوات والقوالب الموصى بها
| الحاجة | الأفضل لـ | أداة المثال | ملاحظات |
|---|---|---|---|
| تنظيف المسح الضوئي | تصحيح الانحراف، إصلاح التباين | Adobe Acrobat Enhance Scans, ScanTailor Advanced | معالجة محلية؛ احتفظ بالأصول دون تغيير. |
| دقة التعرف الضوئي على الحروف | الوثائق متعددة اللغات | ABBYY FineReader, Tesseract (with GUIs), Azure AI Vision | قم بتثبيت حزم اللغات والقواميس المخصصة. |
| الترجمة الآمنة | المحتوى الحساس | memoQ, Phrase On-Premise, DeepL Teams | تحقق من إقامة البيانات وبنود السرية. |
| خط أنابيب شامل | الترجمة المباشرة لملفات PDF الممسوحة ضوئيًا | OpenL PDF Translator | قم بالتحميل مرة واحدة، وطبق التعرف الضوئي على الحروف + الترجمة، ثم قم بتصدير الملفات ثنائية اللغة. |
| إعادة بناء التنسيق | الجداول والرسوم البيانية المعقدة | Microsoft Word Styles, InDesign, Affinity Publisher | قم بتكرار الأنماط قبل استيراد الترجمات. |
| قائمة التحقق من الجودة | مراجعة ثنائية اللغة | Xbench, Verifika, custom Google Sheet | حدد الأسماء والأرقام والاختصارات والتنسيق. |
هل تحتاج إلى بداية سريعة؟ قم بإنشاء مجلد مشترك يحتوي على المسح الضوئي، ومخرجات التعرف الضوئي على الحروف، وموجز الترجمة، والمصطلحات، وقائمة التحقق من الجودة. يمكن لأي شخص ينضم في منتصف المشروع أن يبدأ فورًا.
نصائح نهائية
- احفظ الإصدارات المتزايدة عند كل معلم (تحضير التعرف الضوئي على الحروف، تسليم المترجم، اكتمال الجودة) حتى تتمكن من الرجوع فورًا إذا تعطل التنسيق.
- عندما تكون في شك بشأن دقة التعرف الضوئي على الحروف، قم بإجراء مقارنة لعدد الكلمات: يجب أن تتطابق ملف التعرف الضوئي على الحروف والملف المترجم بشكل وثيق.
- بالنسبة لأنواع الوثائق المتكررة (البيانات الشهرية، أدلة المنتجات)، حول سير العمل هذا إلى إجراء تشغيلي قياسي وأعد استخدام المصطلحات والقوالب الخاصة بك.
ترجم المسودات الأولى بسرعة، ولكن احمِ الدقة من خلال التحضير المنظم وضمان الجودة—هذا المزيج يحافظ على ثقة العملاء والجهات التنظيمية والقراء في كل صفحة.


