วิธีแปลคำบรรยายใต้ภาพ

OpenL Team 11/24/2025

TABLE OF CONTENTS

คำบรรยายที่ยอดเยี่ยมทำได้มากกว่าการเปลี่ยนคำ—พวกเขาซิงค์อารมณ์, จังหวะเวลา, และความสามารถในการอ่าน คำบรรยายที่มีจังหวะหรือรูปแบบที่ไม่ดีสามารถลดการมีส่วนร่วมและความเข้าใจของผู้ชมได้ ไม่ว่าคุณจะกำลังแปลผลิตภัณฑ์สาธิต, สัมมนาออนไลน์, หรือภาพยนตร์ ให้ใช้กระบวนการทำงานที่มีโครงสร้างซึ่งปกป้องจังหวะเวลา, รักษาสไตล์, และรักษาชื่อทางกฎหมายให้ถูกต้อง

ภาพรวม

  • ระบุประเภทไฟล์ (SRT, VTT, ASS/SSA, STL) และว่าจังหวะเวลาต้องการการซ่อมแซมก่อนการแปลหรือไม่
  • ตัดสินใจระหว่างร่าง AI อย่างรวดเร็ว, กระบวนการทำงานด้วยเครื่องมือ CAT, หรือผู้เชี่ยวชาญด้านภาษาตามความสำคัญและงบประมาณ
  • ปกป้องเครื่องหมายและแท็กการจัดรูปแบบเพื่อให้การตัดบรรทัด, ตัวเอียง, และการจัดตำแหน่งยังคงอยู่
  • ทำการตรวจสอบคุณภาพสองภาษาเพื่อชื่อ, ตัวเลข, ข้อความบนหน้าจอ, และความเร็วในการอ่าน (CPS) ก่อนส่งมอบ

คู่มือการตัดสินใจอย่างรวดเร็ว

สถานการณ์ของคุณเส้นทางที่แนะนำเวลาค่าใช้จ่าย
ความเข้าใจส่วนตัวของคลิปสั้นแปลอัตโนมัติใน YouTube หรือ VLC; ยอมรับจังหวะเวลาคร่าวๆ5–10 นาทีฟรี
วิดีโอการฝึกอบรมภายใน (<30 นาที)ตัวแปลคำบรรยาย AI พร้อมการตรวจสอบโดยมนุษย์30–60 นาที$5–30
สัมมนาออนไลน์การตลาด / การสาธิตการขายส่งออก SRT, แปลในเครื่องมือ CAT พร้อมพจนานุกรม, จากนั้นทำ QA1–3 ชั่วโมง$50–200
เนื้อหาสตรีมมิ่งหรือกฎหมายผู้เชี่ยวชาญด้านคำบรรยาย + คู่มือสไตล์ + การตรวจสอบคุณภาพ1–3 วัน$6–12/นาที

การประมาณเวลาอิงจาก 1,500–2,500 บรรทัดคำบรรยายและคู่ภาษาหนึ่งคู่ ความซับซ้อน, จำนวนผู้พูด, และศัพท์เทคนิคอาจขยายเวลาขึ้น 20–50%


ขั้นตอนที่ 1 — ตรวจสอบไฟล์ต้นฉบับ

รูปแบบมีความสำคัญ
SRT และ VTT เป็นรูปแบบข้อความธรรมดาที่มีการประทับเวลา; ASS/SSA รวมข้อมูลการจัดรูปแบบ; STL และ DFXP เหมาะสำหรับการออกอากาศ แปลงรูปแบบที่แปลกใหม่ (TTML, WebVTT พร้อมการจัดตำแหน่ง) เป็น SRT หรือ VTT เพื่อการจัดการที่ง่ายขึ้นในเครื่องมือแปล

สุขภาพของจังหวะเวลา
เล่นวิดีโอและมองหาการทับซ้อน, รหัสเวลาเชิงลบ, หรือการเข้าช้ากว่าเวลา แก้ไขสิ่งเหล่านี้ก่อนการแปลเพื่อไม่ให้ข้อผิดพลาดทวีคูณในหลายภาษา การจัดคิวที่ไม่ตรงเพียงครั้งเดียวสามารถทำให้เกิดปัญหาจังหวะเวลาหลายสิบในผลลัพธ์สุดท้าย

ความเร็วในการอ่าน
ตั้งเป้าหมายที่ 12–17 ตัวอักษรต่อวินาที (CPS) และ 35–42 ตัวอักษรต่อบรรทัด มาตรฐานนี้คำนึงถึงความเร็วในการอ่านเฉลี่ยและความชัดเจนบนหน้าจอ คำบรรยายภาษาอังกฤษที่กระชับจะขยายอย่างมากในภาษาเยอรมัน (+30%), สเปน (+25%), หรือฝรั่งเศส (+20%) ซึ่งเสี่ยงต่อการล้นของข้อความและปัญหาการอ่าน

ข้อมูลเมตาและความสม่ำเสมอ
จดชื่อผู้พูด, ข้อความบนหน้าจอ, คำศัพท์แบรนด์, และคำนามเฉพาะ รวบรวมพจนานุกรมแบรนด์ของคุณ, คำต้องห้าม, และตัวแปรเฉพาะภูมิภาค (เช่น “center” vs. “centre”) สิ่งเหล่านี้จะเป็นข้อมูลอ้างอิงของคุณในระหว่าง QA


ขั้นตอนที่ 2 — เตรียมสำเนาที่ใช้งานได้

  1. ทำสำเนาและล็อค ไฟล์ต้นฉบับเป็นการสำรองข้อมูลอ้างอิง
  2. ปรับการเข้ารหัส เป็น UTF-8 และแทนที่เครื่องหมายคำพูดอัจฉริยะ, อักขระมีเครื่องหมาย, หรือไกลฟ์ที่เสียหาย
  3. ทำความสะอาดสิ่งรบกวน: ลบคำบรรยายที่ว่างเปล่า, รวมช่องว่างสองช่อง, และตรวจสอบให้แน่ใจว่ามีคำบรรยายสูงสุดสองบรรทัดต่อคำบรรยาย
  4. เพิ่มหมายเหตุการแปล: แสดงความคิดเห็นเกี่ยวกับเพลง, เสียงพากย์, SDH cues (เช่น [ประตูปิด]), เนื้อหาที่อ่อนไหวทางวัฒนธรรม, หรือส่วนที่ต้องไม่แปล (ชื่อแบรนด์, ตัวย่อ)

ขั้นตอนที่ 3 — เลือกกระบวนการแปลที่เหมาะสม

ตัวเลือก A: ร่าง AI + การตรวจสอบโดยมนุษย์ (เร็วที่สุด)

เหมาะสำหรับ: เนื้อหาที่มีความเสี่ยงต่ำ, ภายใน, หรือเนื้อหาสั้น

  • อัปโหลด SRT หรือ VTT ไปยังโปรแกรมแปลคำบรรยาย AI ที่คำนึงถึงความเป็นส่วนตัว (เช่น OpenL, DeepL)
  • รักษาแท็กสไตล์ (<i>, ตัวบ่งชี้ตำแหน่ง) ให้คงอยู่; หลีกเลี่ยงการวางข้อความดิบโดยไม่มีการประทับเวลา
  • ส่งออกและตรวจสอบชื่อ, คำศัพท์แบรนด์, โทนเสียง, และการเบี่ยงเบนของเวลาในทันที
  • เวลาที่ใช้โดยทั่วไป: 30–60 นาทีสำหรับ 500–1,500 บรรทัด

ข้อแลกเปลี่ยน: ความเร็วเหนือความละเอียดอ่อน; เหมาะสำหรับวิดีโอการฝึกอบรมหรือการใช้งานภายใน

ตัวเลือก B: เครื่องมือ CAT เพื่อความสม่ำเสมอ (ดีที่สุดสำหรับทีม)

เหมาะสำหรับ: โครงการที่เกิดขึ้นซ้ำ, หลายตอน, หรือการปกป้องเสียงของแบรนด์

  • นำเข้า SRT ไปยัง Trados, memoQ, Phrase หรือ OmegaT พร้อมฐานคำศัพท์และหน่วยความจำการแปล (TM)
  • ล็อคไทม์โค้ดและแท็กสไตล์เพื่อให้ผู้เชี่ยวชาญด้านภาษาปรับแก้เฉพาะบทสนทนาและคำบรรยาย
  • ใช้ TM เพื่อรักษาวลีที่เกิดซ้ำ (ชื่อผลิตภัณฑ์, ป้าย UI, สโลแกน) ให้สอดคล้องกันในทุกตอน
  • รันการตรวจสอบ QA ในตัวสำหรับตัวเลข, เครื่องหมายวรรคตอน, และข้อจำกัดความยาวของตัวอักษรก่อนส่งออก
  • เวลาที่ใช้โดยทั่วไป: 1–3 ชั่วโมงสำหรับ 1,500–2,500 บรรทัด; ค่าใช้จ่ายรวมถึงใบอนุญาตเครื่องมือและเวลาของผู้เชี่ยวชาญด้านภาษา

การเปรียบเทียบเครื่องมือ:

  • memoQ / Trados: ค่าใช้จ่ายสูงล่วงหน้า; เหมาะสำหรับองค์กรและทีมที่มีปริมาณงานสูง
  • Phrase: ระดับกลาง; เนทีฟบนคลาวด์, การทำงานร่วมกันง่าย
  • OmegaT: ฟรีและโอเพ่นซอร์ส; มีความซับซ้อนในการเรียนรู้มากกว่าแต่ไม่มีค่าใช้จ่ายใบอนุญาต

การแลกเปลี่ยน: การตั้งค่าเริ่มต้นที่ช้ากว่า; ความสม่ำเสมอและการประหยัดค่าใช้จ่ายในระยะยาว

ตัวเลือก C: ผู้เชี่ยวชาญด้านการสร้างคำบรรยาย (เดิมพันสูง)

เหมาะสำหรับ: แพลตฟอร์มสตรีมมิ่ง, เนื้อหาทางกฎหมาย, หรือโครงการที่สำคัญต่อแบรนด์

  • ให้ข้อมูลสรุปที่ครอบคลุม: ผู้ชม, โทนเสียง, ระดับความเป็นทางการ, ข้อจำกัดความเร็วในการอ่าน, นโยบายคำหยาบคาย, และเอกสารอ้างอิง
  • แชร์ไฟล์วิดีโอ (หรือลิงก์), คำบรรยายต้นฉบับ (SRT/VTT), พจนานุกรม, รายชื่อบุคลิก, และกราฟิกบนหน้าจอหรือข้อความที่สามล่าง
  • ขอผลลัพธ์ SRT/VTT ที่แปลแล้วและรายงานการจับเวลาหากจำเป็นต้องปรับเวลาใหม่
  • เวลาที่ใช้โดยทั่วไป: 1–3 วัน; ค่าใช้จ่าย $6–12 ต่อหนึ่งนาทีของวิดีโอ

การแลกเปลี่ยน: ค่าใช้จ่ายสูงกว่า; คุณภาพระดับมืออาชีพและการสนับสนุนการปฏิบัติตามข้อกำหนด


ขั้นตอนที่ 4 — แก้ไขเวลาและรูปแบบหลังการแปล

การปรับเวลาใหม่
ภาษาอาจขยายตัว ภาษาอังกฤษเฉลี่ย 5–6 ตัวอักษรต่อคำ; ภาษาเยอรมันเฉลี่ย 7–8 หากบรรทัดที่แปลเกินเวลา ให้ปรับเวลาเริ่ม/สิ้นสุดเล็กน้อยหรือแบ่งคำบรรยายยาวแทนที่จะลดขนาดตัวอักษร รักษาช่องว่างขั้นต่ำ 1 เฟรมระหว่างคำบรรยายเพื่อป้องกันการทับซ้อน

การแบ่งบรรทัด
จัดเรียงบรรทัดใหม่ที่จุดแบ่งวลีธรรมชาติ (เช่น ที่เครื่องหมายจุลภาคหรือการหยุดเชิงตรรกะ) หลีกเลี่ยงการแบ่งชื่อ, ตำแหน่ง, หรือวลีคำนามข้ามบรรทัด เนื่องจากจะทำให้การอ่านไม่คล่องตัว

การจัดตำแหน่ง
สำหรับไฟล์ ASS/SSA หรือ VTT ที่มีคำแนะนำการจัดตำแหน่ง ตรวจสอบให้แน่ใจว่าภาษาที่เขียนจากขวาไปซ้าย (RTL) เช่น ภาษาอาหรับและภาษาฮีบรู ถูกยึดไว้อย่างถูกต้องและไม่บดบังกราฟิกที่อยู่ในส่วนล่างของจอภาพหรือข้อความบนหน้าจอ ทดสอบบนแพลตฟอร์มเป้าหมาย

ข้อความบนหน้าจอ
หากวิดีโอมีกราฟิกหรือข้อความที่ฝังอยู่ในภาพ ให้พิจารณาคำบรรยายที่อธิบายหรือแปลข้อความนั้น หรือสร้างกราฟิกทดแทนหากผู้จัดจำหน่าย (Netflix, YouTube, ฯลฯ) ต้องการ


ขั้นตอนที่ 5 — ทำการตรวจสอบคุณภาพสองภาษา

ใช้รายการตรวจสอบนี้ก่อนการส่งมอบขั้นสุดท้าย:

ความถูกต้องและคำศัพท์

  • ชื่อ ตัวเลข วันที่ สกุลเงิน URL และข้อจำกัดทางกฎหมายตรงกับต้นฉบับ
  • คำศัพท์แบรนด์และชื่อเฉพาะถูกใช้ตัวพิมพ์ใหญ่และจัดรูปแบบอย่างสม่ำเสมอ
  • คำต้องห้ามหรือคำสแลงถูกแปลให้เข้ากับท้องถิ่น ไม่ใช่แปลตรงตัว

โทนและสไตล์

  • โทนตามที่กำหนด (ทางการ/ไม่เป็นทางการ, เทคนิค/สบายๆ)
  • การอ้างอิงทางวัฒนธรรมถูกปรับให้เข้ากับกลุ่มเป้าหมาย ไม่ใช่ปล่อยไว้ตามเดิม
  • สำนวนและอารมณ์ขันถูกแปลให้เข้ากับภาษาเป้าหมาย ไม่ใช่แปลคำต่อคำ

มาตรฐานทางเทคนิค

  • CPS และความยาวบรรทัดตรงตามมาตรฐานภาษาของคุณ (ปกติ 12–17 CPS; ปรับสำหรับภาษาที่เขียนจากขวาไปซ้าย)
  • ไม่มีบรรทัดสั้นๆ ที่ถูกทิ้งไว้หรือการแบ่งที่ไม่เหมาะสม
  • ไม่มีคำแนะนำที่ทับซ้อนกันหรือตราประทับเวลาที่เป็นลบ; ไฟล์เปิดโดยไม่มีข้อผิดพลาดใน VLC, Aegisub หรือแพลตฟอร์มการเล่นของคุณ

เนื้อหาพิเศษ

  • คำแนะนำ SDH ยังคงอยู่ในวงเล็บและสม่ำเสมอ (เช่น [ประตูปิดดัง], [เพลงเล่น])
  • เพลงรักษาการแบ่งบรรทัดและรูปแบบสัมผัสหากจำเป็น
  • การพากย์เสียงและการบรรยายถูกทำเครื่องหมายอย่างชัดเจนหากโทนเสียงแตกต่างกัน

การปฏิบัติตามแพลตฟอร์ม

  • คำบรรยาย YouTube: สูงสุด 80–90 ตัวอักษรต่อบรรทัด; การเข้ารหัส UTF-8
  • Netflix: ปฏิบัติตามแนวทาง CPS และรูปแบบเฉพาะของ Netflix; ไม่มีความขัดแย้งในการฝัง
  • LMS / Moodle: ตรวจสอบการเข้ารหัสและคุณสมบัติการเข้าถึง

เครื่องมือที่แนะนำ

งานเครื่องมือทำไมถึงช่วยได้ค่าใช้จ่าย
การจับเวลา & การแก้ไขภาพAegisub, Subtitle Editไทม์ไลน์ภาพ, การตรวจจับการทับซ้อน, การตรวจสอบ CPSฟรี
ร่าง AI อย่างรวดเร็วOpenL Subtitle Translator, DeepL, แอปที่ใช้ Whisperรักษาเวลาไว้; ผ่านครั้งแรกได้เร็ว$5–30
ความสม่ำเสมอของทีมmemoQ, Trados, Phraseล็อคโค้ดเวลา; บังคับใช้คำศัพท์และ TM$1K–5K/ปี
ทางเลือกฟรีOmegaTCAT แบบโอเพ่นซอร์ส; รองรับ TM และฐานคำศัพท์ฟรี
มาตรฐาน QCNetflix Guidelines, BBC Subtitle Rules, EBU Guidelinesมาตรฐานอุตสาหกรรมสำหรับ CPS, การแบ่งบรรทัด, เครื่องหมายวรรคตอนฟรี (ออนไลน์)
การตรวจสอบการเล่นVLC, mpvทดสอบการเข้ารหัสและการซิงค์บนแพลตฟอร์มจริงฟรี

ข้อผิดพลาดทั่วไปที่ควรหลีกเลี่ยง

  • การแก้ไขใน Word / Google Docs — ลบโค้ดเวลาและการเข้ารหัสออกไป ใช้โปรแกรมแก้ไขซับไตเติลหรือเครื่องมือ CAT เสมอ
  • การแปลแท็กตำแหน่งหรือ HTML — ทำให้การแสดงผลเสียหาย ล็อคเครื่องหมายรูปแบบในเครื่องมือ CAT ของคุณหรือป้องกันด้วยตนเอง (เช่น <i><i>, ไม่แปลเป็นภาษาเป้าหมาย)
  • การไม่สนใจการขยายข้อความ — ภาษาเยอรมันและสเปนขยาย 20–30%; การไม่ปรับเวลาใหม่ทำให้ข้อความล้นและบังกราฟิก
  • การข้ามการทดสอบเฉพาะแพลตฟอร์ม — YouTube, Netflix, และ LMS มีสเปคต่างกัน ทดสอบบนแพลตฟอร์มจริงของคุณก่อนส่งมอบครั้งสุดท้าย
  • การอัปโหลดเนื้อหาที่ละเอียดอ่อนไปยังเครื่องมือเว็บที่ไม่ปลอดภัย — ใช้ผู้ให้บริการที่คำนึงถึงความเป็นส่วนตัว (เซิร์ฟเวอร์ในองค์กร, ปฏิบัติตาม SOC 2) สำหรับโครงการที่เป็นความลับ
  • การผสมผู้แปลโดยไม่มีคำศัพท์ — นำไปสู่คำศัพท์ที่ไม่สอดคล้องกัน (เช่น “app” vs. “application”) แบ่งปันฐานคำศัพท์เสมอ
  • การไม่ตรวจสอบการเข้ารหัส — อักขระพิเศษ, เครื่องหมายเน้นเสียง, และอิโมจิอาจแสดงผลไม่ถูกต้องบนแพลตฟอร์มเป้าหมาย ตรวจสอบ UTF-8 ก่อนอัปโหลด

เทมเพลตการส่งต่อ

เมื่อมอบหมายให้ผู้แปล, ฟรีแลนซ์, หรือผู้ให้บริการ, ให้:

Materials

  • ไฟล์วิดีโอหรือลิงก์ที่แชร์ได้ซึ่งมีการป้องกันด้วยรหัสผ่าน
  • คำบรรยายต้นฉบับ (SRT/VTT) และไฟล์สไตล์ใดๆ (ASS/SSA)
  • อภิธานศัพท์, คู่มือโทนเสียง, ชื่อตัวละคร, คำต้องห้าม, และแนวทางเสียงของแบรนด์

Specifications

  • ภาษาที่ต้องการและรูปแบบ (เช่น pt-BR vs pt-PT, es-ES vs es-MX)
  • ข้อจำกัด CPS และความยาวบรรทัด; กฎเฉพาะแพลตฟอร์มใดๆ (Netflix, YouTube, LMS)
  • รูปแบบการส่ง (SRT, VTT, ASS) และการเข้ารหัสไฟล์ (UTF-8)

Timeline & Contact

  • วันที่ครบกำหนดและจุดตรวจสอบเหตุการณ์สำคัญใดๆ
  • บุคคลที่ติดต่อและช่องทางการสื่อสารที่ต้องการสำหรับการชี้แจง
  • กระบวนการ QA ที่คาดหวังและขั้นตอนการลงนาม

Real-World Example

Scenario: การสาธิตผลิตภัณฑ์ 5 นาที (300 บรรทัดคำบรรยาย) ต้องการแปลจากภาษาอังกฤษ → สเปน (สเปน) และเยอรมัน

  1. Source check (15 นาที): ตรวจสอบเวลา, ระบุ 2 การทับซ้อน, แก้ไข. บันทึกชื่อผลิตภัณฑ์: “CloudSync” (ไม่แปล), “API” (ไม่แปล)
  2. CAT tool import (10 นาที): นำเข้า SRT เข้า memoQ. สร้างฐานคำศัพท์ด้วยอภิธานศัพท์ผลิตภัณฑ์และคำต้องห้าม
  3. Translation (90 นาที): นักภาษามืออาชีพแปลโดยใช้ TM; การตรวจสอบ QA พบการเกินความยาว 3 ครั้ง
  4. Retiming (20 นาที): แบ่ง 3 คิวที่ยาว, ปรับเวลา. ตรวจสอบช่องว่าง 1 เฟรม
  5. Playback test (10 นาที): ตรวจสอบบน YouTube และใน Aegisub. อนุมัติสำหรับการอัปโหลด

Total time: ~2.5 ชั่วโมง. Cost: ~$80–120 (2 ภาษา, อัตรามืออาชีพ)


Workflow Summary

การแปลคำบรรยายเป็นกระบวนการที่ทำซ้ำได้ ไม่ใช่ปุ่มคลิกเดียว เส้นทางที่คุณเลือกขึ้นอยู่กับความสำคัญ, งบประมาณ, และความเร่งด่วน:

  • Lowest cost: ร่าง AI + การตรวจสอบด้วยมือ
  • Best consistency: เครื่องมือ CAT พร้อมอภิธานศัพท์และ TM ที่แชร์
  • Highest quality: นักแปลคำบรรยายมืออาชีพพร้อมการตรวจสอบ QC

ปกป้องเวลา, เคารพความเร็วในการอ่าน, บังคับใช้คำศัพท์, และผู้ชมของคุณจะลืมว่าพวกเขากำลังอ่าน—เป้าหมายที่แท้จริง


Want a Faster Path?

ลองใช้ OpenL Subtitle Translator เพื่ออัปโหลดไฟล์ SRT รับร่าง AI ที่คงเวลาไว้ครบถ้วน และตรวจสอบผลลัพธ์แบบสองภาษา เหมาะสำหรับการพลิกกลับอย่างรวดเร็วในเนื้อหาการตลาดและการฝึกอบรม