Shotcut 25.10 มาพร้อมกับ AI ในพื้นที่, HTML และการจับภาพดั้งเดิม

  • การแปลงข้อความเป็นเสียงในเครื่องด้วย KokoroDoki และการรองรับ CPU/GPU ผ่านทาง Docker
  • เครื่องสร้าง HTML และฟิลเตอร์ "เครื่องพิมพ์ดีด" พร้อมการตั้งค่าล่วงหน้า ความโปร่งใส และจำกัด FPS ไว้ที่ 15
  • การบันทึกหน้าจอดั้งเดิมตามสภาพแวดล้อม (FFmpeg, GNOME, Spectacle หรือ OBS)
  • อัปเดตเป็น FFmpeg 8 ปรับปรุงไลบรารีใหม่และแก้ไขจุดสำคัญหลายประการ

Shotcut 25.10

โปรแกรมแก้ไขวิดีโอโอเพ่นซอร์สที่เป็นที่รู้จักมากที่สุดบนเดสก์ท็อป Linux เขาทำการเคลื่อนไหวอีกครั้ง. Shotcut 25.10 มีวางจำหน่ายแล้วและมาพร้อมฟีเจอร์ต่างๆ ที่มุ่งเป้าไปที่ประสิทธิภาพการทำงานโดยตรง ได้แก่ ปัญญาประดิษฐ์ในพื้นที่ เครื่องสร้าง HTML สำหรับชื่อเรื่องที่มีสไตล์ และการบันทึกหน้าจอดั้งเดิมที่หลีกเลี่ยงการพึ่งพายูทิลิตี้ภายนอก

หลังจากช่วงการทดสอบเบต้า การเปิดตัวเป็นเวอร์ชันเสถียรยืนยันว่าโครงการกำลังดำเนินไปอย่างต่อเนื่องตามแผนงาน นวัตกรรมที่โดดเด่นคือการแปลงข้อความเป็นเสียง (TTS) สำหรับบันทึกและคำบรรยาย พร้อมด้วยฟิลเตอร์เครื่องพิมพ์ เครื่องสร้างรูปภาพ/วิดีโอจาก HTML และการอัปเดตเป็น FFmpeg 8 ไม่ลืมแพ็คเกจการแก้ไขและการปรับปรุงความเข้ากันได้ที่ดี

ภาพรวม: มีอะไรเปลี่ยนแปลงใน Shotcut 25.10

ทีมงานได้นำคุณสมบัติ AI มาใช้ในช่วงไม่นานมานี้ โดยเริ่มจากการถอดเสียงด้วย Whisper (การแปลงเสียงเป็นข้อความ) และตอนนี้วงกลมก็เสร็จสมบูรณ์ด้วย การแปลงข้อความเป็นเสียงแบบบูรณาการและแบบท้องถิ่นการรวมกันนี้เปิดโอกาสให้มีเวิร์กโฟลว์อันทรงพลังสำหรับการบรรยาย การสร้างคำบรรยาย และการสร้างเนื้อหาที่สามารถเข้าถึงได้โดยไม่ต้องออกจากตัวแก้ไข

ภาคนี้มาพร้อมกับ AI ที่จะแนะนำ เครื่องมือสร้างสรรค์ที่รองรับโดย HTML และฟีเจอร์ต่างๆ ที่ชุมชนร้องขอ เช่น การบันทึกหน้าจอแบบข้ามแพลตฟอร์ม การเปิดตัวครั้งนี้ยังช่วยยกระดับพื้นฐานทางเทคนิคด้วย FFmpeg 8 และไลบรารีหลักที่ได้รับการอัปเดต

Shotcut 25.10 แนะนำการแปลงข้อความเป็นเสียงสำหรับบันทึกและคำบรรยาย

การนำ TTS ไปใช้ใน Shotcut ขึ้นอยู่กับ KokoroDoki และรุ่น Kokoro 82Mเป็นเครื่องมือสังเคราะห์เสียงแบบโอเพนซอร์สที่สามารถทำงานแบบเรียลไทม์ สิ่งที่ควรทราบคือเวอร์ชัน 25.07 ได้รวมเอาโมเดลของ คำพูดเป็นข้อความคุณสมบัติที่โดดเด่นที่สุดคือทุกอย่างเกิดขึ้นบนคอมพิวเตอร์ของคุณ ไม่มีการส่งข้อมูลไปยังคลาวด์ ดังนั้นความเป็นส่วนตัวและการควบคุมโครงการจึงได้รับการรับประกัน

เพื่อเร่งการประมวลผล KokoroDoki สามารถใช้ CPU หรือ GPU ของ NVIDIA กับ CUDA ได้ในเครื่องที่มีการ์ดจอที่รองรับ คุณจะสังเกตเห็นว่าเวลาในการสร้างเสียงนั้นสั้นลงอย่างเห็นได้ชัด ซึ่งจะเห็นได้ชัดเจนเมื่อต้องทำซ้ำคำบรรยายหลายบรรทัดหรือเตรียมเสียงพากย์ที่ยาว

ในส่วนของเสียงนั้นแพ็กเกจปัจจุบันมีความสมบูรณ์มากขึ้นเป็นภาษาอังกฤษ ภาษาอังกฤษแบบอเมริกันมีเสียงมากกว่ายี่สิบเสียงเวอร์ชันภาษาอังกฤษมีให้บริการประมาณแปดภาษา และขณะนี้การรองรับภาษาอื่นๆ ยังมีจำกัด คาดว่าจะมีการขยายขอบเขตการใช้งานในรุ่นปรับปรุงในอนาคต แต่ในเบื้องต้นมีเนื้อหาเพียงพอสำหรับโมเดล ต้นแบบ และโครงการขั้นสุดท้ายในภาษาอังกฤษแล้ว

มีรายละเอียดทางเทคนิคหนึ่งประการที่ต้องจำไว้: การรวมจะดำเนินการโดยใช้ Dockerการทำเช่นนี้จะเพิ่มขั้นตอนการตั้งค่าพิเศษเมื่อเทียบกับฟีเจอร์อื่นๆ โดยเฉพาะอย่างยิ่งหากคุณไม่เคยใช้งานคอนเทนเนอร์มาก่อน แม้จะไม่ใช่อุปสรรคที่ยากเกินแก้ไข แต่ก็คุ้มค่าที่จะสละเวลาสักสองสามนาทีเพื่อปรับแต่งทุกอย่างให้เหมาะสม

Shotcut 25.10 สร้างจาก HTML และเอฟเฟกต์เครื่องพิมพ์ดีด

ความคิดสร้างสรรค์ขยายตัวด้วยการมีส่วนร่วมสองประการที่ดำเนินไปควบคู่กัน: ใหม่ เครื่องสร้าง "รูปภาพ/วิดีโอจาก HTML" และเอฟเฟกต์ข้อความที่จำลองเครื่องพิมพ์ดีด แนวทางนี้ชัดเจน: การนำความสามารถของเบราว์เซอร์มาใช้กับไทม์ไลน์เพื่อสร้างชื่อเรื่อง คำบรรยายภาพ และแอนิเมชันที่มีพื้นหลังโปร่งใสและไม่ต้องใช้ปลั๊กอินพิเศษใดๆ

เครื่องสร้าง HTML สร้าง รูปภาพหรือคลิปที่มีความโปร่งใสตามค่าเริ่มต้นเพื่อรักษาเสถียรภาพ วิดีโอที่สร้างขึ้นจึงถูกจำกัดความเร็วไว้ที่ 15 เฟรมต่อวินาที ซึ่งเพียงพอสำหรับกราฟิกและภาพซ้อนทับที่หลีกเลี่ยงปัญหาคอขวด ผลลัพธ์จะปรากฏให้เห็นทันที จะเปิดโดยอัตโนมัติใน Origin Viewer พร้อมด้วย HTML เพื่อให้คุณสามารถตรวจสอบหรือปรับเปลี่ยนโค้ดได้ทันที

เอฟเฟกต์ "Text: Typewriter" ประกอบด้วยพรีเซ็ตแบบพร้อมใช้งานและพรีเซ็ตอื่นๆ ที่ออกแบบมาเพื่อการปรับแต่ง โปรไฟล์ที่รวมอยู่ ได้แก่: ภาพสามมิติ ลายเส้นยืดหยุ่น พับ โลหะสีทอง o ช่วงเวลาสังสรรค์เครื่องมือเหล่านี้ครอบคลุมทุกอย่าง ตั้งแต่การตกแต่งภาพให้สวยงาม ไปจนถึงแอนิเมชันวิดีโอที่สนุกสนานยิ่งขึ้น หากคุณคุ้นเคยกับ CSS และ JS คุณก็มีโอกาสที่จะสร้างสรรค์ผลงานที่จริงจังได้

  • เข้ากันได้กับ โค้ดรวบรวมจาก CodePenเหมาะสำหรับการนำชิ้นส่วนและการออกแบบที่มีอยู่แล้วมาใช้ซ้ำ
  • เรนเดอร์ที่มีขีดจำกัด 15 FPS เพื่อความเสถียร ในยุคที่ใช้เบราว์เซอร์
  • ความเป็นไปได้เชิงสร้างสรรค์ด้วย พื้นหลังโปร่งใส โดยไม่ต้องมีองค์ประกอบที่ซับซ้อน

การบันทึกหน้าจอแบบเนทีฟและข้ามแพลตฟอร์ม

ในที่สุดคำขอคลาสสิกจากชุมชนอีกอันก็มาถึงแล้ว: การบันทึกหน้าจอแบบบูรณาการการใช้งานจะแตกต่างกันไปขึ้นอยู่กับสภาพแวดล้อม แต่ในทุกกรณี ได้มีการแสวงหาแบ็คเอนด์ดั้งเดิมที่เชื่อถือได้มากที่สุดเพื่อลดความขัดแย้ง

  • X11- ใช้ FFmpeg เป็นแบ็คเอนด์หลัก
  • เวย์แลนด์ (GNOME): การบูรณาการกับเครื่องมือจับภาพ/บันทึกหน้าจอดั้งเดิม
  • KDE Plasma: รองรับการจับภาพใน Spectacle
  • ทางเลือกหากไม่มีสิ่งใดข้างต้นเกิดขึ้น ให้ใช้ สตูดิโอ OBS เป็นไวด์การ์ด

วิธีนี้จะหลีกเลี่ยงการติดตั้งยูทิลิตี้เพิ่มเติมในกรณีส่วนใหญ่และ รวมเวิร์กโฟลว์ให้เป็นหนึ่งเดียวคุณสามารถบันทึก แก้ไข และส่งออกทั้งหมดได้จากแอปพลิเคชันเดียวกัน สำหรับผู้สร้างบทช่วยสอน รีวิวซอฟต์แวร์ หรือเซสชันการฝึกอบรม นี่คือการพัฒนาที่เห็นได้ชัดตั้งแต่วันแรก

Shotcut 25.10 อัปเดตเอนจิ้นมัลติมีเดีย: FFmpeg 8 และไลบรารี

มีการเคลื่อนไหวอยู่ใต้ฝากระโปรงด้วย แอปจะสลับไปที่ FFmpeg 8ซึ่งหมายถึงการปรับปรุงการเข้ารหัส/ถอดรหัส ฟิลเตอร์ใหม่ และความเข้ากันได้ที่กว้างขึ้นกับรูปแบบไฟล์สมัยใหม่ ในทางปฏิบัติ สิ่งนี้จะส่งผลให้การส่งออกมีความสอดคล้องกันมากขึ้นและการเล่นไฟล์โปรเจกต์ที่ซับซ้อนราบรื่นยิ่งขึ้น

ส่วนประกอบที่สำคัญยังได้รับการอัปเดต เช่น SVT-AV1, libaom, dav1d, libvpx, libwebp y กระซิบ.cppชิ้นส่วนเหล่านี้ส่งผลต่อตัวแปลงสัญญาณ AV1, VP9, ​​WebP หรือการถอดรหัส AI เอง ทำให้วงจรปิดสำหรับเวิร์กโฟลว์ที่แข็งแกร่งยิ่งขึ้น

การปรับปรุงอินเทอร์เฟซและเวิร์กโฟลว์ Shotcut 25.10

รายละเอียดเล็กๆ น้อยๆ ที่เพิ่มขึ้น: ตัวเลือกต่างๆ พร้อมใช้งานในแผงคุณสมบัติแล้ว “เปิดด้วย” และ “ชาร์จพลัง”การเปลี่ยนแปลงเหล่านี้เป็นเพียงการเปลี่ยนแปลงเล็กๆ น้อยๆ แต่มีประโยชน์เมื่อคุณต้องรีเฟรชสื่อที่แก้ไขภายนอกหรือเปิดใช้งานอย่างรวดเร็วด้วยแอประบบ

ใหม่ เครื่องสร้าง "รูปภาพ/วิดีโอจาก HTML" มันอยู่ร่วมกับตัวกรอง "ข้อความ: เครื่องพิมพ์ดีด" ดังนั้นคุณจึงสามารถ รวมการสร้าง HTML นอกไทม์ไลน์ (เป็นสื่อ) พร้อมแอนิเมชันแบบเครื่องพิมพ์ดีดที่นำไปใช้กับคลิปที่แทรกไว้แล้ว ความยืดหยุ่นโดยรวมขึ้นอยู่กับกรณีการใช้งาน

แก้ไขข้อบกพร่องและปรับปรุงเสถียรภาพของ Shotcut 25.10

การเปิดตัวนี้แก้ไขปัญหาที่น่ารำคาญหลายประการที่ได้รับการรายงาน คล้ายกับ อัปเดต 25.08. ยกตัวอย่างเช่น ความล้มเหลวในการส่งออกเมื่อชื่อหรือเส้นทางมีเครื่องหมายแอมเพอร์แซนด์ (&)ซึ่งเป็นปัญหาที่พบได้บ่อยกว่าในโครงการที่ใช้ร่วมกัน

มันยังช่วยแก้ปัญหา ปัญหาในการเริ่ม AppImage บน Linux เมื่อติดตั้ง AppImageLauncher แล้ว และได้รับการแก้ไข คีย์เฟรมขั้นสูงใน «Text: Rich» ซึ่งไม่ได้ประพฤติตนอย่างที่ควรจะเป็น สุดท้าย ข้อผิดพลาดในช่องอัลฟาเมื่อถอดรหัสวิดีโอ Ut, กุญแจสำคัญสำหรับผู้ที่ทำงานอย่างโปร่งใสในระบบมืออาชีพ

การติดตั้งและความเข้ากันได้

เพื่อให้ชีวิตใน Linux ง่ายขึ้น โปรเจ็กต์จึงแจกจ่าย แอปอิมเมจสากล ซึ่งคุณสามารถดาวน์โหลดและรันได้โดยไม่ต้องติดตั้ง dependencies ในทางปฏิบัติ เพียงแค่ให้สิทธิ์รันก็เสร็จเรียบร้อย

ในด้านความเข้ากันได้ ได้รับการยืนยันการรองรับแล้ว glibc 2.35 บน Ubuntu 22.04 LTSดังนั้นเวอร์ชัน LTS จึงครอบคลุมการแจกจ่ายสมัยใหม่ด้วย เคอร์เนลสูงกว่า 5.10 มันควรจะดำเนินไปอย่างราบรื่น ในขณะที่ระบบเก่ากว่านั้น คุณอาจต้องปรับแต่งไลบรารี

กรณีการใช้งาน: จากผู้สร้างไปจนถึงนักการศึกษาและนักพัฒนา

สำหรับผู้ที่สร้างคอนเทนต์บนโซเชียลมีเดียหรือ YouTube แพ็กเกจนี้ถือว่าเหมาะสมอย่างยิ่ง คุณบันทึกหน้าจอโดยไม่ต้องออกจากโปรแกรมแก้ไขคุณใช้เอฟเฟกต์ข้อความที่มีสไตล์และสร้างเสียงสังเคราะห์สำหรับคำแนะนำ คำอธิบาย หรือคำกระตุ้นการดำเนินการโดยไม่ต้องบรรยายการเปลี่ยนแปลงแต่ละครั้ง

  • วิดีโอสอน: การบันทึกแบบบูรณาการ + คำอธิบาย TTS สำหรับจังหวะไดนามิก
  • การนำเสนอผลงานชื่อเรื่องแอนิเมชั่นระดับมืออาชีพโดยไม่ต้องใช้ปลั๊กอินที่ต้องชำระเงิน
  • การเข้าถึงการรวม Whisper (เสียงเป็นข้อความ) และ TTS เข้าด้วยกันจะช่วยปรับปรุงคำบรรยายและการบรรยายได้

ในด้านการศึกษาและการฝึกอบรม คุณค่ามีความชัดเจน: ชั้นเรียนที่บันทึกไว้, บทเรียนวิดีโอ และสื่อประกอบพร้อมป้ายกำกับและเสียงพากย์ที่สร้างในท้องถิ่น โปรไฟล์เสียงภาษาอังกฤษหลายแบบช่วยให้สามารถปรับโทนเสียงได้ตามความต้องการของผู้ชม

  • การสาธิตซอฟต์แวร์การจับภาพแอปพลิเคชันดั้งเดิมโดยไม่ต้องพึ่งพาเครื่องมือภายนอก
  • เอกสารประกอบภาพวิดีโอที่มีคำอธิบายทางเทคนิคและข้อความที่อ่านได้เป็นช่วงๆ
  • การทดสอบอินเทอร์เฟซ: บันทึกและตรวจสอบเวิร์กโฟลว์เพื่อรับข้อเสนอแนะอย่างรวดเร็ว

การเปรียบเทียบอย่างรวดเร็วกับเวอร์ชันก่อนหน้า

เมื่อเทียบกับเวอร์ชันก่อนหน้า มีการปรับปรุงที่สำคัญ การบันทึกแบบพื้นเมือง ช่วยขจัดความจำเป็นในการใช้โซลูชันเพิ่มเติมบนเดสก์ท็อปส่วนใหญ่ และการผสมผสาน HTML+Typewriter จะทำให้ตัวเลือกสำหรับชื่อเรื่องและส่วนล่างเพิ่มขึ้น

  • การบันทึกแบบบูรณาการ โดยไม่ต้องผ่าน OBS (ยกเว้นในสถานการณ์ทางเลือก)
  • เอฟเฟกต์ข้อความขั้นสูง ด้วยการรองรับ HTML/CSS และการตั้งค่าคุณภาพไว้ล่วงหน้า
  • ข้อความเป็นคำพูด สำหรับบันทึกและคำบรรยายภายใน Shotcut เอง
  • FFmpeg 8 เพื่อประสิทธิภาพที่ดีขึ้นและรูปแบบปัจจุบัน
  • เสริมความมั่นคง พร้อมการแก้ไขในกรณีขอบทั่วไป

ข้อกำหนดและการกำหนดค่าที่แนะนำ

หากต้องการให้ทุกอย่างดำเนินไปอย่างราบรื่น วิธีที่ดีที่สุดคือการมีทีมที่สมดุล ด้วย RAM 8 GB คุณสามารถทำงานได้แต่ถ้าคุณทำงานโปรเจ็กต์ขนาดกลาง/ใหญ่ คุณจะชื่นชอบที่มี 16 GB

  • ซีพียู:อย่างน้อย 4 คอร์สำหรับเอฟเฟกต์และการเข้ารหัสแบบหลวม ๆ
  • แรมขั้นต่ำ 8 GB แนะนำ 16 GB
  • GPU: เข้ากันได้กับ OpenGL 3.3+; หากคุณใช้ CUDA มันจะเร่งความเร็ว TTS ด้วย KokoroDoki
  • การเก็บรักษาSSD สำหรับสื่อและแคช โดยเฉพาะในโปรเจ็กต์ที่มีโคเดกขนาดใหญ่

ในการตั้งค่าโครงการมันเป็นความคิดที่ดี ตรงกับ FPS และความละเอียด ไปยังจุดหมายปลายทางสุดท้ายของคุณเพื่อหลีกเลี่ยงการปรับขนาดที่ไม่จำเป็น การบำรุงรักษาพร็อกซีและการแสดงตัวอย่างที่ปรับแต่งแล้วจะช่วยให้คุณไม่เกิดความล่าช้าเมื่อเพิ่มตัวกรองและแทร็กหลายรายการ

เวิร์กโฟลว์ด้วย HTML, CodePen และ Typewriter

หากคุณจะผลักดันตัวสร้าง HTML จริงๆ ทำงานกับการออกแบบในโปรแกรมแก้ไขของคุณหรือบน CodePenคอมไพล์/แพ็กเกจทรัพยากรและวางลงในเทมเพลต Shotcut เพื่อให้แน่ใจว่าฟอนต์ สไตล์ และสคริปต์ได้รับการแก้ไขโดยไม่ต้องเรียกใช้จากภายนอก

สำหรับแอนิเมชั่นข้อความ ให้สลับ ตัวกรอง "ข้อความ: เครื่องพิมพ์ดีด" และการสร้างภายนอก: เมื่อคุณต้องการความเร็วและบางสิ่งที่มีน้ำหนักเบา ตัวกรองจะช่วยให้คุณไม่ต้องเจอกับปัญหา หากคุณต้องการงานที่ซับซ้อน การไหลของ HTML จะช่วยให้คุณควบคุมได้มากขึ้น (และความโปร่งใสดั้งเดิม)

หมายเหตุเกี่ยวกับประสิทธิภาพ ความเป็นส่วนตัว และข้อจำกัด

แนวทางในพื้นที่ต่อ TTS มีข้อได้เปรียบหลักสองประการ: ปกป้องเนื้อหาของคุณ ช่วยหลีกเลี่ยงความล่าช้าหรือค่าบริการออนไลน์ ในทางกลับกัน จำเป็นต้องมีการกำหนดค่า Docker และเพื่อความเร็วสูงสุด จำเป็นต้องใช้ GPU NVIDIA ที่มีคุณสมบัติ CUDA

ขีดจำกัดของ 15 FPS ในการสร้าง HTML ไม่ใช่แค่เรื่องบังเอิญ แต่มันช่วยทำให้การเรนเดอร์เสถียรขึ้นเมื่อเอ็นจิ้นเบราว์เซอร์สร้างวิดีโอหรือภาพที่มีความโปร่งใสและเลเยอร์ ในทางปฏิบัติ มันเพียงพอสำหรับการสร้างชื่อเรื่อง การเปลี่ยนฉาก และการซ้อนทับ

รายละเอียดเล็กๆ น้อยๆ ที่สร้างความแตกต่าง

ตัวเลือก "เปิดด้วย" ในคุณสมบัติ มันช่วยเพิ่มความเร็วในการแก้ไขคลิปในเครื่องมือภายนอกและย้อนกลับโดยไม่สูญเสียเธรดในขณะที่ "เติมเงิน" ช่วยให้คุณบังคับให้อัปเดตไฟล์มีเดียได้ หากไฟล์บนดิสก์มีการเปลี่ยนแปลง คีย์ทั้งสองนี้ บวกกับโปรแกรมดูซอร์สโค้ดที่เปิดเนื้อหาที่สร้างด้วย HTML โดยอัตโนมัติ ช่วยให้การทำงานประจำวันง่ายขึ้นมาก

ผลรวมของ FFmpeg 8 และไลบรารีที่ได้รับการปรับปรุงใหม่ นอกจากนี้ยังช่วยให้สบายใจได้มากขึ้นด้วย มีเรื่องเซอร์ไพรส์น้อยลงเมื่อนำเข้า/ส่งออก และจัดการรูปแบบใหม่ๆ เช่น AV1 ได้ดีขึ้น รวมถึงการถอดรหัสที่ละเอียดขึ้น

ผู้ที่มาจากเวอร์ชันก่อนหน้าจะพบตัวแก้ไขที่ ได้เติบโตเต็มที่โดยไม่สูญเสียแก่นสารฟรี รองรับหลายแพลตฟอร์ม และมีตัวเลือกการออกแบบทางเทคนิคที่เอื้อต่อการพัฒนาในท้องถิ่น ความรู้สึกคือโครงการนี้กำลังก้าวไปสู่จุดที่ต้องการ นั่นคือ ประสิทธิภาพ AI ที่ใช้งานได้จริง และเครื่องมือสร้างสรรค์ที่พร้อมเรียนรู้อย่างราบรื่น

Shotcut 25.05
บทความที่เกี่ยวข้อง:
Shotcut 25.05 เพิ่มการปรับปรุง HDR ขณะอัปเกรด Qt เป็นเวอร์ชัน 6.8.3