วิธีแปลคำบรรยายใต้ภาพ
TABLE OF CONTENTS
คำบรรยายที่ยอดเยี่ยมทำได้มากกว่าการเปลี่ยนคำ—พวกเขาซิงค์อารมณ์, จังหวะเวลา, และความสามารถในการอ่าน คำบรรยายที่มีจังหวะหรือรูปแบบที่ไม่ดีสามารถลดการมีส่วนร่วมและความเข้าใจของผู้ชมได้ ไม่ว่าคุณจะกำลังแปลผลิตภัณฑ์สาธิต, สัมมนาออนไลน์, หรือภาพยนตร์ ให้ใช้กระบวนการทำงานที่มีโครงสร้างซึ่งปกป้องจังหวะเวลา, รักษาสไตล์, และรักษาชื่อทางกฎหมายให้ถูกต้อง
ภาพรวม
- ระบุประเภทไฟล์ (SRT, VTT, ASS/SSA, STL) และว่าจังหวะเวลาต้องการการซ่อมแซมก่อนการแปลหรือไม่
- ตัดสินใจระหว่างร่าง AI อย่างรวดเร็ว, กระบวนการทำงานด้วยเครื่องมือ CAT, หรือผู้เชี่ยวชาญด้านภาษาตามความสำคัญและงบประมาณ
- ปกป้องเครื่องหมายและแท็กการจัดรูปแบบเพื่อให้การตัดบรรทัด, ตัวเอียง, และการจัดตำแหน่งยังคงอยู่
- ทำการตรวจสอบคุณภาพสองภาษาเพื่อชื่อ, ตัวเลข, ข้อความบนหน้าจอ, และความเร็วในการอ่าน (CPS) ก่อนส่งมอบ
คู่มือการตัดสินใจอย่างรวดเร็ว
| สถานการณ์ของคุณ | เส้นทางที่แนะนำ | เวลา | ค่าใช้จ่าย |
|---|---|---|---|
| ความเข้าใจส่วนตัวของคลิปสั้น | แปลอัตโนมัติใน YouTube หรือ VLC; ยอมรับจังหวะเวลาคร่าวๆ | 5–10 นาที | ฟรี |
| วิดีโอการฝึกอบรมภายใน (<30 นาที) | ตัวแปลคำบรรยาย AI พร้อมการตรวจสอบโดยมนุษย์ | 30–60 นาที | $5–30 |
| สัมมนาออนไลน์การตลาด / การสาธิตการขาย | ส่งออก SRT, แปลในเครื่องมือ CAT พร้อมพจนานุกรม, จากนั้นทำ QA | 1–3 ชั่วโมง | $50–200 |
| เนื้อหาสตรีมมิ่งหรือกฎหมาย | ผู้เชี่ยวชาญด้านคำบรรยาย + คู่มือสไตล์ + การตรวจสอบคุณภาพ | 1–3 วัน | $6–12/นาที |
การประมาณเวลาอิงจาก 1,500–2,500 บรรทัดคำบรรยายและคู่ภาษาหนึ่งคู่ ความซับซ้อน, จำนวนผู้พูด, และศัพท์เทคนิคอาจขยายเวลาขึ้น 20–50%
ขั้นตอนที่ 1 — ตรวจสอบไฟล์ต้นฉบับ
รูปแบบมีความสำคัญ
SRT และ VTT เป็นรูปแบบข้อความธรรมดาที่มีการประทับเวลา; ASS/SSA รวมข้อมูลการจัดรูปแบบ; STL และ DFXP เหมาะสำหรับการออกอากาศ แปลงรูปแบบที่แปลกใหม่ (TTML, WebVTT พร้อมการจัดตำแหน่ง) เป็น SRT หรือ VTT เพื่อการจัดการที่ง่ายขึ้นในเครื่องมือแปล
สุขภาพของจังหวะเวลา
เล่นวิดีโอและมองหาการทับซ้อน, รหัสเวลาเชิงลบ, หรือการเข้าช้ากว่าเวลา แก้ไขสิ่งเหล่านี้ก่อนการแปลเพื่อไม่ให้ข้อผิดพลาดทวีคูณในหลายภาษา การจัดคิวที่ไม่ตรงเพียงครั้งเดียวสามารถทำให้เกิดปัญหาจังหวะเวลาหลายสิบในผลลัพธ์สุดท้าย
ความเร็วในการอ่าน
ตั้งเป้าหมายที่ 12–17 ตัวอักษรต่อวินาที (CPS) และ 35–42 ตัวอักษรต่อบรรทัด มาตรฐานนี้คำนึงถึงความเร็วในการอ่านเฉลี่ยและความชัดเจนบนหน้าจอ คำบรรยายภาษาอังกฤษที่กระชับจะขยายอย่างมากในภาษาเยอรมัน (+30%), สเปน (+25%), หรือฝรั่งเศส (+20%) ซึ่งเสี่ยงต่อการล้นของข้อความและปัญหาการอ่าน
ข้อมูลเมตาและความสม่ำเสมอ
จดชื่อผู้พูด, ข้อความบนหน้าจอ, คำศัพท์แบรนด์, และคำนามเฉพาะ รวบรวมพจนานุกรมแบรนด์ของคุณ, คำต้องห้าม, และตัวแปรเฉพาะภูมิภาค (เช่น “center” vs. “centre”) สิ่งเหล่านี้จะเป็นข้อมูลอ้างอิงของคุณในระหว่าง QA
ขั้นตอนที่ 2 — เตรียมสำเนาที่ใช้งานได้
- ทำสำเนาและล็อค ไฟล์ต้นฉบับเป็นการสำรองข้อมูลอ้างอิง
- ปรับการเข้ารหัส เป็น UTF-8 และแทนที่เครื่องหมายคำพูดอัจฉริยะ, อักขระมีเครื่องหมาย, หรือไกลฟ์ที่เสียหาย
- ทำความสะอาดสิ่งรบกวน: ลบคำบรรยายที่ว่างเปล่า, รวมช่องว่างสองช่อง, และตรวจสอบให้แน่ใจว่ามีคำบรรยายสูงสุดสองบรรทัดต่อคำบรรยาย
- เพิ่มหมายเหตุการแปล: แสดงความคิดเห็นเกี่ยวกับเพลง, เสียงพากย์, SDH cues (เช่น [ประตูปิด]), เนื้อหาที่อ่อนไหวทางวัฒนธรรม, หรือส่วนที่ต้องไม่แปล (ชื่อแบรนด์, ตัวย่อ)
ขั้นตอนที่ 3 — เลือกกระบวนการแปลที่เหมาะสม
ตัวเลือก A: ร่าง AI + การตรวจสอบโดยมนุษย์ (เร็วที่สุด)
เหมาะสำหรับ: เนื้อหาที่มีความเสี่ยงต่ำ, ภายใน, หรือเนื้อหาสั้น
- อัปโหลด SRT หรือ VTT ไปยังโปรแกรมแปลคำบรรยาย AI ที่คำนึงถึงความเป็นส่วนตัว (เช่น OpenL, DeepL)
- รักษาแท็กสไตล์ (
<i>, ตัวบ่งชี้ตำแหน่ง) ให้คงอยู่; หลีกเลี่ยงการวางข้อความดิบโดยไม่มีการประทับเวลา - ส่งออกและตรวจสอบชื่อ, คำศัพท์แบรนด์, โทนเสียง, และการเบี่ยงเบนของเวลาในทันที
- เวลาที่ใช้โดยทั่วไป: 30–60 นาทีสำหรับ 500–1,500 บรรทัด
ข้อแลกเปลี่ยน: ความเร็วเหนือความละเอียดอ่อน; เหมาะสำหรับวิดีโอการฝึกอบรมหรือการใช้งานภายใน
ตัวเลือก B: เครื่องมือ CAT เพื่อความสม่ำเสมอ (ดีที่สุดสำหรับทีม)
เหมาะสำหรับ: โครงการที่เกิดขึ้นซ้ำ, หลายตอน, หรือการปกป้องเสียงของแบรนด์
- นำเข้า SRT ไปยัง Trados, memoQ, Phrase หรือ OmegaT พร้อมฐานคำศัพท์และหน่วยความจำการแปล (TM)
- ล็อคไทม์โค้ดและแท็กสไตล์เพื่อให้ผู้เชี่ยวชาญด้านภาษาปรับแก้เฉพาะบทสนทนาและคำบรรยาย
- ใช้ TM เพื่อรักษาวลีที่เกิดซ้ำ (ชื่อผลิตภัณฑ์, ป้าย UI, สโลแกน) ให้สอดคล้องกันในทุกตอน
- รันการตรวจสอบ QA ในตัวสำหรับตัวเลข, เครื่องหมายวรรคตอน, และข้อจำกัดความยาวของตัวอักษรก่อนส่งออก
- เวลาที่ใช้โดยทั่วไป: 1–3 ชั่วโมงสำหรับ 1,500–2,500 บรรทัด; ค่าใช้จ่ายรวมถึงใบอนุญาตเครื่องมือและเวลาของผู้เชี่ยวชาญด้านภาษา
การเปรียบเทียบเครื่องมือ:
- memoQ / Trados: ค่าใช้จ่ายสูงล่วงหน้า; เหมาะสำหรับองค์กรและทีมที่มีปริมาณงานสูง
- Phrase: ระดับกลาง; เนทีฟบนคลาวด์, การทำงานร่วมกันง่าย
- OmegaT: ฟรีและโอเพ่นซอร์ส; มีความซับซ้อนในการเรียนรู้มากกว่าแต่ไม่มีค่าใช้จ่ายใบอนุญาต
การแลกเปลี่ยน: การตั้งค่าเริ่มต้นที่ช้ากว่า; ความสม่ำเสมอและการประหยัดค่าใช้จ่ายในระยะยาว
ตัวเลือก C: ผู้เชี่ยวชาญด้านการสร้างคำบรรยาย (เดิมพันสูง)
เหมาะสำหรับ: แพลตฟอร์มสตรีมมิ่ง, เนื้อหาทางกฎหมาย, หรือโครงการที่สำคัญต่อแบรนด์
- ให้ข้อมูลสรุปที่ครอบคลุม: ผู้ชม, โทนเสียง, ระดับความเป็นทางการ, ข้อจำกัดความเร็วในการอ่าน, นโยบายคำหยาบคาย, และเอกสารอ้างอิง
- แชร์ไฟล์วิดีโอ (หรือลิงก์), คำบรรยายต้นฉบับ (SRT/VTT), พจนานุกรม, รายชื่อบุคลิก, และกราฟิกบนหน้าจอหรือข้อความที่สามล่าง
- ขอผลลัพธ์ SRT/VTT ที่แปลแล้วและรายงานการจับเวลาหากจำเป็นต้องปรับเวลาใหม่
- เวลาที่ใช้โดยทั่วไป: 1–3 วัน; ค่าใช้จ่าย $6–12 ต่อหนึ่งนาทีของวิดีโอ
การแลกเปลี่ยน: ค่าใช้จ่ายสูงกว่า; คุณภาพระดับมืออาชีพและการสนับสนุนการปฏิบัติตามข้อกำหนด
ขั้นตอนที่ 4 — แก้ไขเวลาและรูปแบบหลังการแปล
การปรับเวลาใหม่
ภาษาอาจขยายตัว ภาษาอังกฤษเฉลี่ย 5–6 ตัวอักษรต่อคำ; ภาษาเยอรมันเฉลี่ย 7–8 หากบรรทัดที่แปลเกินเวลา ให้ปรับเวลาเริ่ม/สิ้นสุดเล็กน้อยหรือแบ่งคำบรรยายยาวแทนที่จะลดขนาดตัวอักษร รักษาช่องว่างขั้นต่ำ 1 เฟรมระหว่างคำบรรยายเพื่อป้องกันการทับซ้อน
การแบ่งบรรทัด
จัดเรียงบรรทัดใหม่ที่จุดแบ่งวลีธรรมชาติ (เช่น ที่เครื่องหมายจุลภาคหรือการหยุดเชิงตรรกะ) หลีกเลี่ยงการแบ่งชื่อ, ตำแหน่ง, หรือวลีคำนามข้ามบรรทัด เนื่องจากจะทำให้การอ่านไม่คล่องตัว
การจัดตำแหน่ง
สำหรับไฟล์ ASS/SSA หรือ VTT ที่มีคำแนะนำการจัดตำแหน่ง ตรวจสอบให้แน่ใจว่าภาษาที่เขียนจากขวาไปซ้าย (RTL) เช่น ภาษาอาหรับและภาษาฮีบรู ถูกยึดไว้อย่างถูกต้องและไม่บดบังกราฟิกที่อยู่ในส่วนล่างของจอภาพหรือข้อความบนหน้าจอ ทดสอบบนแพลตฟอร์มเป้าหมาย
ข้อความบนหน้าจอ
หากวิดีโอมีกราฟิกหรือข้อความที่ฝังอยู่ในภาพ ให้พิจารณาคำบรรยายที่อธิบายหรือแปลข้อความนั้น หรือสร้างกราฟิกทดแทนหากผู้จัดจำหน่าย (Netflix, YouTube, ฯลฯ) ต้องการ
ขั้นตอนที่ 5 — ทำการตรวจสอบคุณภาพสองภาษา
ใช้รายการตรวจสอบนี้ก่อนการส่งมอบขั้นสุดท้าย:
ความถูกต้องและคำศัพท์
- ชื่อ ตัวเลข วันที่ สกุลเงิน URL และข้อจำกัดทางกฎหมายตรงกับต้นฉบับ
- คำศัพท์แบรนด์และชื่อเฉพาะถูกใช้ตัวพิมพ์ใหญ่และจัดรูปแบบอย่างสม่ำเสมอ
- คำต้องห้ามหรือคำสแลงถูกแปลให้เข้ากับท้องถิ่น ไม่ใช่แปลตรงตัว
โทนและสไตล์
- โทนตามที่กำหนด (ทางการ/ไม่เป็นทางการ, เทคนิค/สบายๆ)
- การอ้างอิงทางวัฒนธรรมถูกปรับให้เข้ากับกลุ่มเป้าหมาย ไม่ใช่ปล่อยไว้ตามเดิม
- สำนวนและอารมณ์ขันถูกแปลให้เข้ากับภาษาเป้าหมาย ไม่ใช่แปลคำต่อคำ
มาตรฐานทางเทคนิค
- CPS และความยาวบรรทัดตรงตามมาตรฐานภาษาของคุณ (ปกติ 12–17 CPS; ปรับสำหรับภาษาที่เขียนจากขวาไปซ้าย)
- ไม่มีบรรทัดสั้นๆ ที่ถูกทิ้งไว้หรือการแบ่งที่ไม่เหมาะสม
- ไม่มีคำแนะนำที่ทับซ้อนกันหรือตราประทับเวลาที่เป็นลบ; ไฟล์เปิดโดยไม่มีข้อผิดพลาดใน VLC, Aegisub หรือแพลตฟอร์มการเล่นของคุณ
เนื้อหาพิเศษ
- คำแนะนำ SDH ยังคงอยู่ในวงเล็บและสม่ำเสมอ (เช่น [ประตูปิดดัง], [เพลงเล่น])
- เพลงรักษาการแบ่งบรรทัดและรูปแบบสัมผัสหากจำเป็น
- การพากย์เสียงและการบรรยายถูกทำเครื่องหมายอย่างชัดเจนหากโทนเสียงแตกต่างกัน
การปฏิบัติตามแพลตฟอร์ม
- คำบรรยาย YouTube: สูงสุด 80–90 ตัวอักษรต่อบรรทัด; การเข้ารหัส UTF-8
- Netflix: ปฏิบัติตามแนวทาง CPS และรูปแบบเฉพาะของ Netflix; ไม่มีความขัดแย้งในการฝัง
- LMS / Moodle: ตรวจสอบการเข้ารหัสและคุณสมบัติการเข้าถึง
เครื่องมือที่แนะนำ
| งาน | เครื่องมือ | ทำไมถึงช่วยได้ | ค่าใช้จ่าย |
|---|---|---|---|
| การจับเวลา & การแก้ไขภาพ | Aegisub, Subtitle Edit | ไทม์ไลน์ภาพ, การตรวจจับการทับซ้อน, การตรวจสอบ CPS | ฟรี |
| ร่าง AI อย่างรวดเร็ว | OpenL Subtitle Translator, DeepL, แอปที่ใช้ Whisper | รักษาเวลาไว้; ผ่านครั้งแรกได้เร็ว | $5–30 |
| ความสม่ำเสมอของทีม | memoQ, Trados, Phrase | ล็อคโค้ดเวลา; บังคับใช้คำศัพท์และ TM | $1K–5K/ปี |
| ทางเลือกฟรี | OmegaT | CAT แบบโอเพ่นซอร์ส; รองรับ TM และฐานคำศัพท์ | ฟรี |
| มาตรฐาน QC | Netflix Guidelines, BBC Subtitle Rules, EBU Guidelines | มาตรฐานอุตสาหกรรมสำหรับ CPS, การแบ่งบรรทัด, เครื่องหมายวรรคตอน | ฟรี (ออนไลน์) |
| การตรวจสอบการเล่น | VLC, mpv | ทดสอบการเข้ารหัสและการซิงค์บนแพลตฟอร์มจริง | ฟรี |
ข้อผิดพลาดทั่วไปที่ควรหลีกเลี่ยง
- การแก้ไขใน Word / Google Docs — ลบโค้ดเวลาและการเข้ารหัสออกไป ใช้โปรแกรมแก้ไขซับไตเติลหรือเครื่องมือ CAT เสมอ
- การแปลแท็กตำแหน่งหรือ HTML — ทำให้การแสดงผลเสียหาย ล็อคเครื่องหมายรูปแบบในเครื่องมือ CAT ของคุณหรือป้องกันด้วยตนเอง (เช่น
<i>→<i>, ไม่แปลเป็นภาษาเป้าหมาย) - การไม่สนใจการขยายข้อความ — ภาษาเยอรมันและสเปนขยาย 20–30%; การไม่ปรับเวลาใหม่ทำให้ข้อความล้นและบังกราฟิก
- การข้ามการทดสอบเฉพาะแพลตฟอร์ม — YouTube, Netflix, และ LMS มีสเปคต่างกัน ทดสอบบนแพลตฟอร์มจริงของคุณก่อนส่งมอบครั้งสุดท้าย
- การอัปโหลดเนื้อหาที่ละเอียดอ่อนไปยังเครื่องมือเว็บที่ไม่ปลอดภัย — ใช้ผู้ให้บริการที่คำนึงถึงความเป็นส่วนตัว (เซิร์ฟเวอร์ในองค์กร, ปฏิบัติตาม SOC 2) สำหรับโครงการที่เป็นความลับ
- การผสมผู้แปลโดยไม่มีคำศัพท์ — นำไปสู่คำศัพท์ที่ไม่สอดคล้องกัน (เช่น “app” vs. “application”) แบ่งปันฐานคำศัพท์เสมอ
- การไม่ตรวจสอบการเข้ารหัส — อักขระพิเศษ, เครื่องหมายเน้นเสียง, และอิโมจิอาจแสดงผลไม่ถูกต้องบนแพลตฟอร์มเป้าหมาย ตรวจสอบ UTF-8 ก่อนอัปโหลด
เทมเพลตการส่งต่อ
เมื่อมอบหมายให้ผู้แปล, ฟรีแลนซ์, หรือผู้ให้บริการ, ให้:
Materials
- ไฟล์วิดีโอหรือลิงก์ที่แชร์ได้ซึ่งมีการป้องกันด้วยรหัสผ่าน
- คำบรรยายต้นฉบับ (SRT/VTT) และไฟล์สไตล์ใดๆ (ASS/SSA)
- อภิธานศัพท์, คู่มือโทนเสียง, ชื่อตัวละคร, คำต้องห้าม, และแนวทางเสียงของแบรนด์
Specifications
- ภาษาที่ต้องการและรูปแบบ (เช่น pt-BR vs pt-PT, es-ES vs es-MX)
- ข้อจำกัด CPS และความยาวบรรทัด; กฎเฉพาะแพลตฟอร์มใดๆ (Netflix, YouTube, LMS)
- รูปแบบการส่ง (SRT, VTT, ASS) และการเข้ารหัสไฟล์ (UTF-8)
Timeline & Contact
- วันที่ครบกำหนดและจุดตรวจสอบเหตุการณ์สำคัญใดๆ
- บุคคลที่ติดต่อและช่องทางการสื่อสารที่ต้องการสำหรับการชี้แจง
- กระบวนการ QA ที่คาดหวังและขั้นตอนการลงนาม
Real-World Example
Scenario: การสาธิตผลิตภัณฑ์ 5 นาที (300 บรรทัดคำบรรยาย) ต้องการแปลจากภาษาอังกฤษ → สเปน (สเปน) และเยอรมัน
- Source check (15 นาที): ตรวจสอบเวลา, ระบุ 2 การทับซ้อน, แก้ไข. บันทึกชื่อผลิตภัณฑ์: “CloudSync” (ไม่แปล), “API” (ไม่แปล)
- CAT tool import (10 นาที): นำเข้า SRT เข้า memoQ. สร้างฐานคำศัพท์ด้วยอภิธานศัพท์ผลิตภัณฑ์และคำต้องห้าม
- Translation (90 นาที): นักภาษามืออาชีพแปลโดยใช้ TM; การตรวจสอบ QA พบการเกินความยาว 3 ครั้ง
- Retiming (20 นาที): แบ่ง 3 คิวที่ยาว, ปรับเวลา. ตรวจสอบช่องว่าง 1 เฟรม
- Playback test (10 นาที): ตรวจสอบบน YouTube และใน Aegisub. อนุมัติสำหรับการอัปโหลด
Total time: ~2.5 ชั่วโมง. Cost: ~$80–120 (2 ภาษา, อัตรามืออาชีพ)
Workflow Summary
การแปลคำบรรยายเป็นกระบวนการที่ทำซ้ำได้ ไม่ใช่ปุ่มคลิกเดียว เส้นทางที่คุณเลือกขึ้นอยู่กับความสำคัญ, งบประมาณ, และความเร่งด่วน:
- Lowest cost: ร่าง AI + การตรวจสอบด้วยมือ
- Best consistency: เครื่องมือ CAT พร้อมอภิธานศัพท์และ TM ที่แชร์
- Highest quality: นักแปลคำบรรยายมืออาชีพพร้อมการตรวจสอบ QC
ปกป้องเวลา, เคารพความเร็วในการอ่าน, บังคับใช้คำศัพท์, และผู้ชมของคุณจะลืมว่าพวกเขากำลังอ่าน—เป้าหมายที่แท้จริง
Want a Faster Path?
ลองใช้ OpenL Subtitle Translator เพื่ออัปโหลดไฟล์ SRT รับร่าง AI ที่คงเวลาไว้ครบถ้วน และตรวจสอบผลลัพธ์แบบสองภาษา เหมาะสำหรับการพลิกกลับอย่างรวดเร็วในเนื้อหาการตลาดและการฝึกอบรม


