
โปรแกรมแก้ไขวิดีโอโอเพ่นซอร์สที่เป็นที่รู้จักมากที่สุดบนเดสก์ท็อป Linux เขาทำการเคลื่อนไหวอีกครั้ง. Shotcut 25.10 มีวางจำหน่ายแล้วและมาพร้อมฟีเจอร์ต่างๆ ที่มุ่งเป้าไปที่ประสิทธิภาพการทำงานโดยตรง ได้แก่ ปัญญาประดิษฐ์ในพื้นที่ เครื่องสร้าง HTML สำหรับชื่อเรื่องที่มีสไตล์ และการบันทึกหน้าจอดั้งเดิมที่หลีกเลี่ยงการพึ่งพายูทิลิตี้ภายนอก
หลังจากช่วงการทดสอบเบต้า การเปิดตัวเป็นเวอร์ชันเสถียรยืนยันว่าโครงการกำลังดำเนินไปอย่างต่อเนื่องตามแผนงาน นวัตกรรมที่โดดเด่นคือการแปลงข้อความเป็นเสียง (TTS) สำหรับบันทึกและคำบรรยาย พร้อมด้วยฟิลเตอร์เครื่องพิมพ์ เครื่องสร้างรูปภาพ/วิดีโอจาก HTML และการอัปเดตเป็น FFmpeg 8 ไม่ลืมแพ็คเกจการแก้ไขและการปรับปรุงความเข้ากันได้ที่ดี
ภาพรวม: มีอะไรเปลี่ยนแปลงใน Shotcut 25.10
ทีมงานได้นำคุณสมบัติ AI มาใช้ในช่วงไม่นานมานี้ โดยเริ่มจากการถอดเสียงด้วย Whisper (การแปลงเสียงเป็นข้อความ) และตอนนี้วงกลมก็เสร็จสมบูรณ์ด้วย การแปลงข้อความเป็นเสียงแบบบูรณาการและแบบท้องถิ่นการรวมกันนี้เปิดโอกาสให้มีเวิร์กโฟลว์อันทรงพลังสำหรับการบรรยาย การสร้างคำบรรยาย และการสร้างเนื้อหาที่สามารถเข้าถึงได้โดยไม่ต้องออกจากตัวแก้ไข
ภาคนี้มาพร้อมกับ AI ที่จะแนะนำ เครื่องมือสร้างสรรค์ที่รองรับโดย HTML และฟีเจอร์ต่างๆ ที่ชุมชนร้องขอ เช่น การบันทึกหน้าจอแบบข้ามแพลตฟอร์ม การเปิดตัวครั้งนี้ยังช่วยยกระดับพื้นฐานทางเทคนิคด้วย FFmpeg 8 และไลบรารีหลักที่ได้รับการอัปเดต
Shotcut 25.10 แนะนำการแปลงข้อความเป็นเสียงสำหรับบันทึกและคำบรรยาย
การนำ TTS ไปใช้ใน Shotcut ขึ้นอยู่กับ KokoroDoki และรุ่น Kokoro 82Mเป็นเครื่องมือสังเคราะห์เสียงแบบโอเพนซอร์สที่สามารถทำงานแบบเรียลไทม์ สิ่งที่ควรทราบคือเวอร์ชัน 25.07 ได้รวมเอาโมเดลของ คำพูดเป็นข้อความคุณสมบัติที่โดดเด่นที่สุดคือทุกอย่างเกิดขึ้นบนคอมพิวเตอร์ของคุณ ไม่มีการส่งข้อมูลไปยังคลาวด์ ดังนั้นความเป็นส่วนตัวและการควบคุมโครงการจึงได้รับการรับประกัน
เพื่อเร่งการประมวลผล KokoroDoki สามารถใช้ CPU หรือ GPU ของ NVIDIA กับ CUDA ได้ในเครื่องที่มีการ์ดจอที่รองรับ คุณจะสังเกตเห็นว่าเวลาในการสร้างเสียงนั้นสั้นลงอย่างเห็นได้ชัด ซึ่งจะเห็นได้ชัดเจนเมื่อต้องทำซ้ำคำบรรยายหลายบรรทัดหรือเตรียมเสียงพากย์ที่ยาว
ในส่วนของเสียงนั้นแพ็กเกจปัจจุบันมีความสมบูรณ์มากขึ้นเป็นภาษาอังกฤษ ภาษาอังกฤษแบบอเมริกันมีเสียงมากกว่ายี่สิบเสียงเวอร์ชันภาษาอังกฤษมีให้บริการประมาณแปดภาษา และขณะนี้การรองรับภาษาอื่นๆ ยังมีจำกัด คาดว่าจะมีการขยายขอบเขตการใช้งานในรุ่นปรับปรุงในอนาคต แต่ในเบื้องต้นมีเนื้อหาเพียงพอสำหรับโมเดล ต้นแบบ และโครงการขั้นสุดท้ายในภาษาอังกฤษแล้ว
มีรายละเอียดทางเทคนิคหนึ่งประการที่ต้องจำไว้: การรวมจะดำเนินการโดยใช้ Dockerการทำเช่นนี้จะเพิ่มขั้นตอนการตั้งค่าพิเศษเมื่อเทียบกับฟีเจอร์อื่นๆ โดยเฉพาะอย่างยิ่งหากคุณไม่เคยใช้งานคอนเทนเนอร์มาก่อน แม้จะไม่ใช่อุปสรรคที่ยากเกินแก้ไข แต่ก็คุ้มค่าที่จะสละเวลาสักสองสามนาทีเพื่อปรับแต่งทุกอย่างให้เหมาะสม
Shotcut 25.10 สร้างจาก HTML และเอฟเฟกต์เครื่องพิมพ์ดีด
ความคิดสร้างสรรค์ขยายตัวด้วยการมีส่วนร่วมสองประการที่ดำเนินไปควบคู่กัน: ใหม่ เครื่องสร้าง "รูปภาพ/วิดีโอจาก HTML" และเอฟเฟกต์ข้อความที่จำลองเครื่องพิมพ์ดีด แนวทางนี้ชัดเจน: การนำความสามารถของเบราว์เซอร์มาใช้กับไทม์ไลน์เพื่อสร้างชื่อเรื่อง คำบรรยายภาพ และแอนิเมชันที่มีพื้นหลังโปร่งใสและไม่ต้องใช้ปลั๊กอินพิเศษใดๆ
เครื่องสร้าง HTML สร้าง รูปภาพหรือคลิปที่มีความโปร่งใสตามค่าเริ่มต้นเพื่อรักษาเสถียรภาพ วิดีโอที่สร้างขึ้นจึงถูกจำกัดความเร็วไว้ที่ 15 เฟรมต่อวินาที ซึ่งเพียงพอสำหรับกราฟิกและภาพซ้อนทับที่หลีกเลี่ยงปัญหาคอขวด ผลลัพธ์จะปรากฏให้เห็นทันที จะเปิดโดยอัตโนมัติใน Origin Viewer พร้อมด้วย HTML เพื่อให้คุณสามารถตรวจสอบหรือปรับเปลี่ยนโค้ดได้ทันที
เอฟเฟกต์ "Text: Typewriter" ประกอบด้วยพรีเซ็ตแบบพร้อมใช้งานและพรีเซ็ตอื่นๆ ที่ออกแบบมาเพื่อการปรับแต่ง โปรไฟล์ที่รวมอยู่ ได้แก่: ภาพสามมิติ ลายเส้นยืดหยุ่น พับ โลหะสีทอง o ช่วงเวลาสังสรรค์เครื่องมือเหล่านี้ครอบคลุมทุกอย่าง ตั้งแต่การตกแต่งภาพให้สวยงาม ไปจนถึงแอนิเมชันวิดีโอที่สนุกสนานยิ่งขึ้น หากคุณคุ้นเคยกับ CSS และ JS คุณก็มีโอกาสที่จะสร้างสรรค์ผลงานที่จริงจังได้
- เข้ากันได้กับ โค้ดรวบรวมจาก CodePenเหมาะสำหรับการนำชิ้นส่วนและการออกแบบที่มีอยู่แล้วมาใช้ซ้ำ
- เรนเดอร์ที่มีขีดจำกัด 15 FPS เพื่อความเสถียร ในยุคที่ใช้เบราว์เซอร์
- ความเป็นไปได้เชิงสร้างสรรค์ด้วย พื้นหลังโปร่งใส โดยไม่ต้องมีองค์ประกอบที่ซับซ้อน
การบันทึกหน้าจอแบบเนทีฟและข้ามแพลตฟอร์ม
ในที่สุดคำขอคลาสสิกจากชุมชนอีกอันก็มาถึงแล้ว: การบันทึกหน้าจอแบบบูรณาการการใช้งานจะแตกต่างกันไปขึ้นอยู่กับสภาพแวดล้อม แต่ในทุกกรณี ได้มีการแสวงหาแบ็คเอนด์ดั้งเดิมที่เชื่อถือได้มากที่สุดเพื่อลดความขัดแย้ง
- X11- ใช้ FFmpeg เป็นแบ็คเอนด์หลัก
- เวย์แลนด์ (GNOME): การบูรณาการกับเครื่องมือจับภาพ/บันทึกหน้าจอดั้งเดิม
- KDE Plasma: รองรับการจับภาพใน Spectacle
- ทางเลือกหากไม่มีสิ่งใดข้างต้นเกิดขึ้น ให้ใช้ สตูดิโอ OBS เป็นไวด์การ์ด
วิธีนี้จะหลีกเลี่ยงการติดตั้งยูทิลิตี้เพิ่มเติมในกรณีส่วนใหญ่และ รวมเวิร์กโฟลว์ให้เป็นหนึ่งเดียวคุณสามารถบันทึก แก้ไข และส่งออกทั้งหมดได้จากแอปพลิเคชันเดียวกัน สำหรับผู้สร้างบทช่วยสอน รีวิวซอฟต์แวร์ หรือเซสชันการฝึกอบรม นี่คือการพัฒนาที่เห็นได้ชัดตั้งแต่วันแรก
Shotcut 25.10 อัปเดตเอนจิ้นมัลติมีเดีย: FFmpeg 8 และไลบรารี
มีการเคลื่อนไหวอยู่ใต้ฝากระโปรงด้วย แอปจะสลับไปที่ FFmpeg 8ซึ่งหมายถึงการปรับปรุงการเข้ารหัส/ถอดรหัส ฟิลเตอร์ใหม่ และความเข้ากันได้ที่กว้างขึ้นกับรูปแบบไฟล์สมัยใหม่ ในทางปฏิบัติ สิ่งนี้จะส่งผลให้การส่งออกมีความสอดคล้องกันมากขึ้นและการเล่นไฟล์โปรเจกต์ที่ซับซ้อนราบรื่นยิ่งขึ้น
ส่วนประกอบที่สำคัญยังได้รับการอัปเดต เช่น SVT-AV1, libaom, dav1d, libvpx, libwebp y กระซิบ.cppชิ้นส่วนเหล่านี้ส่งผลต่อตัวแปลงสัญญาณ AV1, VP9, WebP หรือการถอดรหัส AI เอง ทำให้วงจรปิดสำหรับเวิร์กโฟลว์ที่แข็งแกร่งยิ่งขึ้น
การปรับปรุงอินเทอร์เฟซและเวิร์กโฟลว์ Shotcut 25.10
รายละเอียดเล็กๆ น้อยๆ ที่เพิ่มขึ้น: ตัวเลือกต่างๆ พร้อมใช้งานในแผงคุณสมบัติแล้ว “เปิดด้วย” และ “ชาร์จพลัง”การเปลี่ยนแปลงเหล่านี้เป็นเพียงการเปลี่ยนแปลงเล็กๆ น้อยๆ แต่มีประโยชน์เมื่อคุณต้องรีเฟรชสื่อที่แก้ไขภายนอกหรือเปิดใช้งานอย่างรวดเร็วด้วยแอประบบ
ใหม่ เครื่องสร้าง "รูปภาพ/วิดีโอจาก HTML" มันอยู่ร่วมกับตัวกรอง "ข้อความ: เครื่องพิมพ์ดีด" ดังนั้นคุณจึงสามารถ รวมการสร้าง HTML นอกไทม์ไลน์ (เป็นสื่อ) พร้อมแอนิเมชันแบบเครื่องพิมพ์ดีดที่นำไปใช้กับคลิปที่แทรกไว้แล้ว ความยืดหยุ่นโดยรวมขึ้นอยู่กับกรณีการใช้งาน
แก้ไขข้อบกพร่องและปรับปรุงเสถียรภาพของ Shotcut 25.10
การเปิดตัวนี้แก้ไขปัญหาที่น่ารำคาญหลายประการที่ได้รับการรายงาน คล้ายกับ อัปเดต 25.08. ยกตัวอย่างเช่น ความล้มเหลวในการส่งออกเมื่อชื่อหรือเส้นทางมีเครื่องหมายแอมเพอร์แซนด์ (&)ซึ่งเป็นปัญหาที่พบได้บ่อยกว่าในโครงการที่ใช้ร่วมกัน
มันยังช่วยแก้ปัญหา ปัญหาในการเริ่ม AppImage บน Linux เมื่อติดตั้ง AppImageLauncher แล้ว และได้รับการแก้ไข คีย์เฟรมขั้นสูงใน «Text: Rich» ซึ่งไม่ได้ประพฤติตนอย่างที่ควรจะเป็น สุดท้าย ข้อผิดพลาดในช่องอัลฟาเมื่อถอดรหัสวิดีโอ Ut, กุญแจสำคัญสำหรับผู้ที่ทำงานอย่างโปร่งใสในระบบมืออาชีพ
การติดตั้งและความเข้ากันได้
เพื่อให้ชีวิตใน Linux ง่ายขึ้น โปรเจ็กต์จึงแจกจ่าย แอปอิมเมจสากล ซึ่งคุณสามารถดาวน์โหลดและรันได้โดยไม่ต้องติดตั้ง dependencies ในทางปฏิบัติ เพียงแค่ให้สิทธิ์รันก็เสร็จเรียบร้อย
ในด้านความเข้ากันได้ ได้รับการยืนยันการรองรับแล้ว glibc 2.35 บน Ubuntu 22.04 LTSดังนั้นเวอร์ชัน LTS จึงครอบคลุมการแจกจ่ายสมัยใหม่ด้วย เคอร์เนลสูงกว่า 5.10 มันควรจะดำเนินไปอย่างราบรื่น ในขณะที่ระบบเก่ากว่านั้น คุณอาจต้องปรับแต่งไลบรารี
กรณีการใช้งาน: จากผู้สร้างไปจนถึงนักการศึกษาและนักพัฒนา
สำหรับผู้ที่สร้างคอนเทนต์บนโซเชียลมีเดียหรือ YouTube แพ็กเกจนี้ถือว่าเหมาะสมอย่างยิ่ง คุณบันทึกหน้าจอโดยไม่ต้องออกจากโปรแกรมแก้ไขคุณใช้เอฟเฟกต์ข้อความที่มีสไตล์และสร้างเสียงสังเคราะห์สำหรับคำแนะนำ คำอธิบาย หรือคำกระตุ้นการดำเนินการโดยไม่ต้องบรรยายการเปลี่ยนแปลงแต่ละครั้ง
- วิดีโอสอน: การบันทึกแบบบูรณาการ + คำอธิบาย TTS สำหรับจังหวะไดนามิก
- การนำเสนอผลงานชื่อเรื่องแอนิเมชั่นระดับมืออาชีพโดยไม่ต้องใช้ปลั๊กอินที่ต้องชำระเงิน
- การเข้าถึงการรวม Whisper (เสียงเป็นข้อความ) และ TTS เข้าด้วยกันจะช่วยปรับปรุงคำบรรยายและการบรรยายได้
ในด้านการศึกษาและการฝึกอบรม คุณค่ามีความชัดเจน: ชั้นเรียนที่บันทึกไว้, บทเรียนวิดีโอ และสื่อประกอบพร้อมป้ายกำกับและเสียงพากย์ที่สร้างในท้องถิ่น โปรไฟล์เสียงภาษาอังกฤษหลายแบบช่วยให้สามารถปรับโทนเสียงได้ตามความต้องการของผู้ชม
- การสาธิตซอฟต์แวร์การจับภาพแอปพลิเคชันดั้งเดิมโดยไม่ต้องพึ่งพาเครื่องมือภายนอก
- เอกสารประกอบภาพวิดีโอที่มีคำอธิบายทางเทคนิคและข้อความที่อ่านได้เป็นช่วงๆ
- การทดสอบอินเทอร์เฟซ: บันทึกและตรวจสอบเวิร์กโฟลว์เพื่อรับข้อเสนอแนะอย่างรวดเร็ว
การเปรียบเทียบอย่างรวดเร็วกับเวอร์ชันก่อนหน้า
เมื่อเทียบกับเวอร์ชันก่อนหน้า มีการปรับปรุงที่สำคัญ การบันทึกแบบพื้นเมือง ช่วยขจัดความจำเป็นในการใช้โซลูชันเพิ่มเติมบนเดสก์ท็อปส่วนใหญ่ และการผสมผสาน HTML+Typewriter จะทำให้ตัวเลือกสำหรับชื่อเรื่องและส่วนล่างเพิ่มขึ้น
- ✅ การบันทึกแบบบูรณาการ โดยไม่ต้องผ่าน OBS (ยกเว้นในสถานการณ์ทางเลือก)
- ✅ เอฟเฟกต์ข้อความขั้นสูง ด้วยการรองรับ HTML/CSS และการตั้งค่าคุณภาพไว้ล่วงหน้า
- ✅ ข้อความเป็นคำพูด สำหรับบันทึกและคำบรรยายภายใน Shotcut เอง
- ✅ FFmpeg 8 เพื่อประสิทธิภาพที่ดีขึ้นและรูปแบบปัจจุบัน
- ✅ เสริมความมั่นคง พร้อมการแก้ไขในกรณีขอบทั่วไป
ข้อกำหนดและการกำหนดค่าที่แนะนำ
หากต้องการให้ทุกอย่างดำเนินไปอย่างราบรื่น วิธีที่ดีที่สุดคือการมีทีมที่สมดุล ด้วย RAM 8 GB คุณสามารถทำงานได้แต่ถ้าคุณทำงานโปรเจ็กต์ขนาดกลาง/ใหญ่ คุณจะชื่นชอบที่มี 16 GB
- ซีพียู:อย่างน้อย 4 คอร์สำหรับเอฟเฟกต์และการเข้ารหัสแบบหลวม ๆ
- แรมขั้นต่ำ 8 GB แนะนำ 16 GB
- GPU: เข้ากันได้กับ OpenGL 3.3+; หากคุณใช้ CUDA มันจะเร่งความเร็ว TTS ด้วย KokoroDoki
- การเก็บรักษาSSD สำหรับสื่อและแคช โดยเฉพาะในโปรเจ็กต์ที่มีโคเดกขนาดใหญ่
ในการตั้งค่าโครงการมันเป็นความคิดที่ดี ตรงกับ FPS และความละเอียด ไปยังจุดหมายปลายทางสุดท้ายของคุณเพื่อหลีกเลี่ยงการปรับขนาดที่ไม่จำเป็น การบำรุงรักษาพร็อกซีและการแสดงตัวอย่างที่ปรับแต่งแล้วจะช่วยให้คุณไม่เกิดความล่าช้าเมื่อเพิ่มตัวกรองและแทร็กหลายรายการ
เวิร์กโฟลว์ด้วย HTML, CodePen และ Typewriter
หากคุณจะผลักดันตัวสร้าง HTML จริงๆ ทำงานกับการออกแบบในโปรแกรมแก้ไขของคุณหรือบน CodePenคอมไพล์/แพ็กเกจทรัพยากรและวางลงในเทมเพลต Shotcut เพื่อให้แน่ใจว่าฟอนต์ สไตล์ และสคริปต์ได้รับการแก้ไขโดยไม่ต้องเรียกใช้จากภายนอก
สำหรับแอนิเมชั่นข้อความ ให้สลับ ตัวกรอง "ข้อความ: เครื่องพิมพ์ดีด" และการสร้างภายนอก: เมื่อคุณต้องการความเร็วและบางสิ่งที่มีน้ำหนักเบา ตัวกรองจะช่วยให้คุณไม่ต้องเจอกับปัญหา หากคุณต้องการงานที่ซับซ้อน การไหลของ HTML จะช่วยให้คุณควบคุมได้มากขึ้น (และความโปร่งใสดั้งเดิม)
หมายเหตุเกี่ยวกับประสิทธิภาพ ความเป็นส่วนตัว และข้อจำกัด
แนวทางในพื้นที่ต่อ TTS มีข้อได้เปรียบหลักสองประการ: ปกป้องเนื้อหาของคุณ ช่วยหลีกเลี่ยงความล่าช้าหรือค่าบริการออนไลน์ ในทางกลับกัน จำเป็นต้องมีการกำหนดค่า Docker และเพื่อความเร็วสูงสุด จำเป็นต้องใช้ GPU NVIDIA ที่มีคุณสมบัติ CUDA
ขีดจำกัดของ 15 FPS ในการสร้าง HTML ไม่ใช่แค่เรื่องบังเอิญ แต่มันช่วยทำให้การเรนเดอร์เสถียรขึ้นเมื่อเอ็นจิ้นเบราว์เซอร์สร้างวิดีโอหรือภาพที่มีความโปร่งใสและเลเยอร์ ในทางปฏิบัติ มันเพียงพอสำหรับการสร้างชื่อเรื่อง การเปลี่ยนฉาก และการซ้อนทับ
รายละเอียดเล็กๆ น้อยๆ ที่สร้างความแตกต่าง
ตัวเลือก "เปิดด้วย" ในคุณสมบัติ มันช่วยเพิ่มความเร็วในการแก้ไขคลิปในเครื่องมือภายนอกและย้อนกลับโดยไม่สูญเสียเธรดในขณะที่ "เติมเงิน" ช่วยให้คุณบังคับให้อัปเดตไฟล์มีเดียได้ หากไฟล์บนดิสก์มีการเปลี่ยนแปลง คีย์ทั้งสองนี้ บวกกับโปรแกรมดูซอร์สโค้ดที่เปิดเนื้อหาที่สร้างด้วย HTML โดยอัตโนมัติ ช่วยให้การทำงานประจำวันง่ายขึ้นมาก
ผลรวมของ FFmpeg 8 และไลบรารีที่ได้รับการปรับปรุงใหม่ นอกจากนี้ยังช่วยให้สบายใจได้มากขึ้นด้วย มีเรื่องเซอร์ไพรส์น้อยลงเมื่อนำเข้า/ส่งออก และจัดการรูปแบบใหม่ๆ เช่น AV1 ได้ดีขึ้น รวมถึงการถอดรหัสที่ละเอียดขึ้น
ผู้ที่มาจากเวอร์ชันก่อนหน้าจะพบตัวแก้ไขที่ ได้เติบโตเต็มที่โดยไม่สูญเสียแก่นสารฟรี รองรับหลายแพลตฟอร์ม และมีตัวเลือกการออกแบบทางเทคนิคที่เอื้อต่อการพัฒนาในท้องถิ่น ความรู้สึกคือโครงการนี้กำลังก้าวไปสู่จุดที่ต้องการ นั่นคือ ประสิทธิภาพ AI ที่ใช้งานได้จริง และเครื่องมือสร้างสรรค์ที่พร้อมเรียนรู้อย่างราบรื่น
