
บริษัท DeepSeek ของจีนได้ดำเนินการอีกครั้งในการแข่งขันด้านปัญญาประดิษฐ์ระดับโลก เมื่อมีการประกาศ DeepSeek-V3.2 และรุ่น V3.2-Specialeโมเดลโอเพนซอร์สทั้งสองรุ่นนี้มุ่งเป้าไปที่ตลาดระดับไฮเอนด์โดยเฉพาะ บริษัทอ้างว่าระบบการคิดวิเคราะห์ของตนเทียบเคียงได้กับเกณฑ์มาตรฐานชั้นนำอย่าง GPT-5 และ Gemini-3 Pro ซึ่งสร้างแรงกดดันให้กับยักษ์ใหญ่สัญชาติอเมริกันในยุคที่มีการแข่งขันทางเทคโนโลยีอย่างดุเดือด
ในยุโรปซึ่งมีการถกเถียงกันเรื่อง AI ที่มีความรับผิดชอบ กฎระเบียบ และอำนาจอธิปไตยทางเทคโนโลยี แนวโน้มเหล่านี้เป็นเรื่องปกติธรรมดา และการเคลื่อนไหวของ DeepSeek ก็ไม่เป็นที่มองข้าม ข้อเท็จจริงที่ว่าห้องปฏิบัติการแห่งหนึ่งในจีนได้เผยแพร่น้ำหนัก เอกสารทางเทคนิคโดยละเอียด และแบบจำลองการให้เหตุผลขั้นสูงในโอเพนซอร์ส ยิ่งตอกย้ำความรู้สึกว่าระบบนิเวศโอเพนซอร์สกำลังกลับมาแข็งแกร่งอีกครั้งเมื่อเทียบกับโซลูชันที่เป็นกรรมสิทธิ์อย่างสมบูรณ์ ซึ่งอาจเป็นเรื่องที่น่าสนใจอย่างยิ่งสำหรับมหาวิทยาลัย ศูนย์วิจัย และ SMEs ด้านเทคโนโลยีในยุโรป
DeepSeek-V3.2: การใช้เหตุผลในระดับโมเดลชั้นนำ
สตาร์ทอัพจากหางโจวได้นำเสนอ ดีพซีค-V3.2 ซึ่งเป็นเวอร์ชันสุดท้ายและเสถียรของโมเดลการให้เหตุผล ซึ่งมาแทนที่เวอร์ชันทดลองที่ออกมาก่อนหน้านี้หลายสัปดาห์ ตามที่บริษัทระบุ V3.2 มีประสิทธิภาพเทียบเท่ากับ GPT-5 ในหลากหลาย มาตรฐาน ผู้ชมที่มีการใช้เหตุผลและการคิดหลายขั้นตอน และอยู่ในตำแหน่งที่ต่ำกว่าเล็กน้อย เจมินี่-3.0 โปร ในการทดสอบประสิทธิภาพบางกรณี
แบบจำลองนี้รวม การใช้เหตุผลแบบมนุษย์พร้อมความสามารถในการใช้เครื่องมือภายนอกเช่น เครื่องมือค้นหาเว็บ เครื่องคิดเลข สภาพแวดล้อมการประมวลผลโค้ด หรือระบบจากภายนอกอย่าง Claude Code แนวคิดคือระบบไม่เพียงแต่สร้างข้อความเท่านั้น แต่ยังสามารถวางแผน สอบถามทรัพยากร ดำเนินการฟังก์ชันต่างๆ แล้วผสานรวมผลลัพธ์เหล่านั้นให้เป็นคำตอบที่สมบูรณ์ยิ่งขึ้น โดยไม่ต้องมีการควบคุมดูแลตลอดเวลา
DeepSeek ได้เน้นย้ำว่าโมเดลดังกล่าวเสนอ สองโหมดการโต้ตอบกับเครื่องมือหนึ่งมีเหตุผลที่มองเห็นได้ ซึ่งผู้ใช้สามารถทำตามขั้นตอนกลางๆ ได้ และอีกกรณีหนึ่งโดยไม่ต้องแสดงกระบวนการคิด ในทั้งสองกรณี “ความทรงจำแห่งเหตุผล” ยังคงมีอยู่ท่ามกลางการเรียกร้องเครื่องมือ ภายในการสนทนาเดียวกันและเริ่มต้นใหม่เมื่อมีข้อความใหม่มาถึงจากผู้ใช้ ซึ่งเป็นประโยชน์อย่างยิ่งสำหรับงานที่ยาวนานหรือกระแสข้อมูลประเภทตัวแทน
โหมด "การคิด" ที่ผสานเข้ากับการใช้เครื่องมือ
หนึ่งในคุณสมบัติใหม่ที่โดดเด่นที่สุดของ DeepSeek-V3.2 คือ การบูรณาการโดยตรงของโหมดการคิดในการใช้เครื่องมือในขณะที่ให้เหตุผล โมเดลสามารถส่งคำถามไปยังเครื่องมือค้นหา เรียกใช้เครื่องคิดเลข ดำเนินการโค้ด หรือโต้ตอบกับบริการอื่น ๆ โดยการรวมรอบการวิเคราะห์ภายในและการเรียกภายนอกเพื่อพยายามให้คำตอบ มีรายละเอียดและแม่นยำมากขึ้น เมื่องานต้องการมัน
ตามที่บริษัทระบุ แนวทางนี้ทำให้ V3.2 เป็น รุ่นแรกที่มีความสามารถในการใช้เหตุผลและใช้เครื่องมือโดยกำเนิดทั้งในโหมดมาตรฐานและโหมดการคิดอย่างเข้มข้น มันคือความมุ่งมั่นที่ชัดเจนต่อสิ่งที่เรียกว่า เวิร์กโฟลว์ตามตัวแทนในกรณีเหล่านี้ AI จะไม่เพียงแค่ตอบคำถามเดียว แต่จะทำหน้าที่เป็นตัวแทนอัตโนมัติที่แยกปัญหาออก ค้นหาข้อมูล คำนวณ และรวมทุกอย่างเข้าด้วยกันเป็นโซลูชันที่สอดคล้องกัน
DeepSeek ยังเน้นย้ำด้วยว่าโมเดลดังกล่าวมีอยู่แพร่หลาย: DeepSeek-V3.2 สามารถใช้งานได้ผ่านเว็บ แอป และ APIสิ่งนี้ช่วยให้สามารถผสานรวมเข้ากับผลิตภัณฑ์ ผู้ช่วยเสมือน หรือเครื่องมือทางธุรกิจ รวมถึงโครงการที่พัฒนาในยุโรปได้ง่ายขึ้น สำหรับชุมชนนักพัฒนาในยุโรปและบริษัทต่างๆ ที่กำลังมองหาทางเลือกแบบเปิด ความสามารถในการสำรวจและปรับใช้โมเดลโดยไม่ต้องพึ่งพาแพลตฟอร์มหลักเพียงแพลตฟอร์มเดียว ถือเป็นข้อได้เปรียบที่สำคัญ
สถาปัตยกรรม DeepSeek Sparse Attention (DSA) และประสิทธิภาพการประมวลผล
ในระดับเทคนิคแกนหลักของ DeepSeek-V3.2 คือ DeepSeek Sparse Attention (DSA)กลไกการใส่ใจที่ออกแบบมาเพื่อจัดการกับลำดับที่ยาวมากในขณะที่ลดต้นทุนการคำนวณ DeepSeek เปิดตัวระบบไฟล์คู่ขนานที่ได้รับการปรับให้เหมาะสมสำหรับ AI ซึ่งช่วยเสริมความพยายามด้านประสิทธิภาพและการนำไปใช้งาน โมเดลนี้มีประมาณ พารามิเตอร์รวม 671.000 พันล้านแต่ในแต่ละขั้นตอนการอนุมาน พวกมันจะถูกเปิดใช้งานเพียงรอบ ๆ เท่านั้น 37.000 พันล้านพารามิเตอร์ต่อโทเค็นวิธีนี้ช่วยให้สามารถรักษากำลังการผลิตได้โดยไม่ต้องเพิ่มการใช้ทรัพยากร
สถาปัตยกรรมแบบกระจายนี้ช่วยให้สามารถทำงานกับ หน้าต่างบริบทที่มีโทเค็นมากถึง 128.000 โทเค็น ในการผลิต ขนาดนี้มีประโยชน์อย่างยิ่งสำหรับการวิเคราะห์เอกสารจำนวนมาก งานวิจัยทางวิชาการ หรือการตรวจสอบข้อมูลทางกฎหมายและเทคนิคจำนวนมาก ซึ่งเป็นหัวข้อที่สถาบันในยุโรปให้ความสนใจอย่างมาก จากข้อมูลที่บริษัทให้มา DSA ลดต้นทุนการอนุมานได้ประมาณครึ่งหนึ่ง เมื่อเปรียบเทียบกับสถาปัตยกรรมหนาแน่นก่อนหน้านี้ในบริบทที่ยาวนาน
สำหรับองค์กรในสเปนและสหภาพยุโรปที่เหลือที่เผชิญกับข้อจำกัดด้านงบประมาณการประมวลผล การปรับปรุงประสิทธิภาพ มันเปิดประตูสู่การทดลองกับโมเดลขั้นสูงโดยไม่จำเป็นต้องใช้โครงสร้างพื้นฐานราคาแพงที่บริษัทเทคโนโลยียักษ์ใหญ่ของสหรัฐฯ ใช้ ถึงกระนั้น DeepSeek ก็ยอมรับว่ายังมีช่องว่างให้พัฒนาเมื่อเทียบกับคู่แข่ง ประสิทธิภาพของโทเค็นและความรู้ที่กว้างขวางของโลกสองพื้นที่สำคัญสำหรับการใช้งานในระดับขนาดใหญ่
DeepSeek-V3.2 ที่มีการเสริมแรงอย่างเข้มข้นโดยใช้ RL และข้อมูลสังเคราะห์สำหรับตัวแทน
นอกเหนือจากสถาปัตยกรรม DeepSeek ยืนกรานว่าการก้าวกระโดดในการใช้เหตุผลส่วนใหญ่มาจาก การฝึกอบรมหลังการฝึกครั้งใหญ่ผ่านการเรียนรู้แบบเสริมแรง (RL)บริษัทได้จัดสรรงบประมาณไว้มากกว่า 10% ของการคำนวณก่อนออกกำลังกายทั้งหมด ในระยะนี้เท่านั้น สัดส่วนที่ไม่ปกติในภาคส่วนนี้ โดยมีเป้าหมายเพื่อเสริมสร้างความสามารถของโมเดลให้แข็งแกร่งยิ่งขึ้น แก้ไขข้อผิดพลาด ให้เหตุผลอย่างละเอียด ใช้เครื่องมือ และดำเนินการในสภาพแวดล้อมแบบโต้ตอบ.
ทีมงานได้สร้าง ระบบนิเวศข้อมูลสังเคราะห์ที่ซับซ้อน ซึ่งรวมถึงมากกว่า สภาพแวดล้อมการฝึกอบรม 1.800 แห่ง และรอบๆ 85.000 คำแนะนำขั้นสูง เฉพาะสำหรับตัวแทน งานเหล่านี้ประกอบด้วยการค้นหาในโลกแห่งความเป็นจริง การจำลองแบบไดนามิก การรันโค้ด ปัญหาที่เชื่อมโยงกัน และสถานการณ์จำลองที่สร้างและตรวจสอบโดยอัตโนมัติ เพื่อลดข้อผิดพลาดในชุดข้อมูลให้น้อยที่สุด
แนวทางนี้มุ่งเน้นไปที่การสร้าง ตัวแทน AI ที่สามารถดำเนินการได้ในระดับหนึ่งการวิเคราะห์ข้อมูล การตัดสินใจ และการดำเนินการในเวิร์กโฟลว์แบบหลายขั้นตอน สำหรับบริษัทในยุโรปที่กำลังสำรวจระบบอัตโนมัติสำหรับกระบวนการที่ซับซ้อน ตั้งแต่การวิเคราะห์ทางการเงินไปจนถึงการสนับสนุนทางเทคนิคขั้นสูง ความก้าวหน้าเหล่านี้อาจเป็นที่น่าสนใจอย่างยิ่ง แม้ว่าจะยังต้องรอดูกันต่อไปว่าแบบจำลองเหล่านี้จะมีประสิทธิภาพอย่างไรนอกสภาพแวดล้อมการทดสอบที่มีการควบคุม
DeepSeek-V3.2-Speciale: คณิตศาสตร์ วิทยาการคอมพิวเตอร์ และการคิดขยาย
ควบคู่ไปกับโมเดลทั่วไป DeepSeek ได้เปิดตัว DeepSeek-V3.2-พิเศษ, รูปแบบที่มุ่งเป้าไปที่ แคลคูลัสขั้นสูง การพิสูจน์ทางคณิตศาสตร์ และกระบวนการคิดที่ยาวนานบริษัทอ้างว่าเวอร์ชันนี้เทียบเท่ากับ เจมินี่-3 โปร ประสิทธิภาพของ Google ในงานการใช้เหตุผลเชิงซ้อนและประสิทธิภาพที่เกือบจะได้เหรียญทองส่งผลให้สามารถแข่งขันในระดับนานาชาติได้
โดยเฉพาะอย่างยิ่ง Speciale จะถึง ระดับเทียบเท่าเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ (IMO)ที่ โอลิมปิกระหว่างประเทศด้านวิทยาการคอมพิวเตอร์ (IOI), การแข่งขันชิงแชมป์โลก ICPC และการแข่งขันคณิตศาสตร์โอลิมปิกของจีน นอกจากนี้ ยังผสานความสามารถที่ได้รับจากแบบจำลอง ดีพซีค-แมธ-V2ซึ่งมีความเชี่ยวชาญในการพิสูจน์ทฤษฎีบทและแก้ปัญหาที่ยากมาก ซึ่งช่วยเสริมความแข็งแกร่งให้กับตำแหน่งในกลุ่มโมเดลสำหรับการวิจัยทางวิทยาศาสตร์และเทคนิค
ต่างจากเวอร์ชันมาตรฐาน DeepSeek-V3.2-Speciale ไม่ได้มุ่งเน้นไปที่งานประจำวัน หรือการผสานรวมทั่วไปกับเครื่องมือ บริษัทเน้นย้ำว่านี่คือโมเดลที่ออกแบบมาเพื่อ งานวิจัยและงานวิชาการด้วยการบริโภคของ สัญญาณ เหนือกว่า ดังนั้นตอนนี้ มีให้ใช้งานผ่าน API เท่านั้น และไม่ใช่ผ่านการใช้งานทั่วไป
ความพร้อมใช้งานของ DeepSeek-V3.2 รูรับแสงและความคมชัดกับยักษ์ใหญ่ของอเมริกา
DeepSeek ได้เผยแพร่ น้ำหนัก DeepSeek-V3.2 เต็มรูปแบบและรายงานทางเทคนิคโดยละเอียด เกี่ยวกับการฝึกอบรมของพวกเขา ซึ่งแตกต่างกับนโยบายที่เข้มงวดมากขึ้นของบริษัทเทคโนโลยีขนาดใหญ่บางแห่งในสหรัฐฯ ซึ่งมักจำกัดการเข้าถึงโค้ดหรือขนาดของโมเดลขั้นสูงที่สุดของพวกเขา แม้แต่ในกรณีของ โอเพนซอร์ส บางส่วน เช่นเดียวกับเวอร์ชันลามะบางเวอร์ชัน การเปิดตัวมาพร้อมกับเงื่อนไขและรายละเอียดที่เฉพาะเจาะจง
ในบริบทของยุโรป ระดับนี้ ความโปร่งใสและเปิดกว้าง สิ่งนี้อาจเป็นกุญแจสำคัญสำหรับโครงการที่ต้องมีการตรวจสอบ การปฏิบัติตามกฎระเบียบ หรือความสามารถในการปรับโมเดลให้เข้ากับกรอบการกำกับดูแล เช่น พระราชบัญญัติ AI ของสหภาพยุโรปมหาวิทยาลัย ศูนย์วิจัย และหน่วยงานบริหารของรัฐสามารถศึกษารูปแบบจำลองในรายละเอียดมากขึ้น จำลองการทดลอง หรือแม้แต่ปรับบางส่วนให้ตรงกับความต้องการของตนเองโดยไม่ต้องพึ่งพา API ภายนอกแบบปิดอย่างสมบูรณ์
บริษัทได้วาง DeepSeek-V3.2 พร้อมให้บริการแก่ชุมชนบนแพลตฟอร์มต่างๆ เช่น Hugging Face และ ModelScopeนอกเหนือจากการเสนอการเข้าถึงผ่าน API แล้ว เวอร์ชัน Speciale นั้นยังจำกัดการใช้งานผ่านอินเทอร์เฟซแบบโปรแกรมเท่านั้น เนื่องจากมี ความต้องการในการคำนวณที่สูงขึ้นและต้นทุนต่อโทเค็นกลยุทธ์การจัดจำหน่ายแบบผสมผสานนี้สอดคล้องกับความสนใจของผู้เล่นในยุโรปหลายรายที่ต้องการมีโมเดลที่แข็งแกร่งสำหรับการวิจัย แม้ว่าการใช้งานเชิงพาณิชย์อาจต้องมีการวางแผนอย่างรอบคอบมากขึ้นก็ตาม
บทบาทของจีนในการแข่งขัน AI ระดับโลก
การเปิดตัว DeepSeek-V3.2 เกิดขึ้นในเวลาที่ จีนมุ่งเสริมความแข็งแกร่งความเป็นผู้นำด้าน AI แม้จะมีข้อจำกัดในการเข้าถึงเซมิคอนดักเตอร์ขั้นสูงและความตึงเครียดทางภูมิรัฐศาสตร์ที่เพิ่มมากขึ้น แต่ DeepSeek ก็กลายเป็นหนึ่งในชื่อที่ถูกพูดถึงมากที่สุดในระบบนิเวศของจีนหลังจากที่ได้บุกเบิกในช่วงต้นปีนี้ด้วยโมเดลที่ทำให้ทุกคนประหลาดใจด้วยอัตราส่วนพลังงานต่อต้นทุน และตอนนี้ DeepSeek ยังเพิ่มความสามารถเป็นสองเท่าด้วยตัวแทนระดับสูงและความสามารถในการใช้เหตุผล
สำหรับยุโรป ซึ่งการอภิปรายมุ่งเน้นไปที่วิธีการสร้างสมดุล นวัตกรรม การปกป้องข้อมูล และความปลอดภัยการพัฒนาประเภทนี้นำมาซึ่งทั้งโอกาสและความท้าทาย ในแง่หนึ่ง การมีอยู่ของโมเดลเปิดความจุสูงจากจีนช่วยขยายขอบเขตของเครื่องมือที่ห้องปฏิบัติการและบริษัทต่างๆ ในยุโรปสามารถใช้ได้ ในอีกแง่หนึ่ง ก็เกิดคำถามเกี่ยวกับ ความเข้ากันได้กับกฎระเบียบท้องถิ่นการไหลของข้อมูลข้ามพรมแดนและผลกระทบของ กฎระเบียบด้านเนื้อหาในประเทศจีนซึ่งผู้เชี่ยวชาญบางส่วนมองว่าอาจเป็นอุปสรรคต่อการขยายตัวของระบบเหล่านี้ในระดับนานาชาติได้
DeepSeek ยังได้รับการมองเห็นนอกตลาดในประเทศหลังจากที่โมเดล V3.1 เข้าร่วม การทดลองการลงทุนอัตโนมัติ เมื่อเทียบกับระบบอย่าง GPT-5 และ Gemini 2.5 Pro ซึ่งให้ผลลัพธ์ที่แข่งขันได้ กลยุทธ์นี้ได้รับการเสริมด้วยการเปิดตัวรุ่นอื่นๆ เช่น DeepSeek-OCRมุ่งเป้าไปที่การบีบอัดข้อความผ่านการรับรู้ภาพและประมวลผลด้วยทรัพยากรที่น้อยลง เสริมสร้างภาพลักษณ์ของบริษัทในฐานะผู้ดำเนินการที่มุ่งเน้นไปที่ ประสิทธิภาพและโอเพนซอร์ส.
ความคาดหวัง ข้อจำกัด และขั้นตอนต่อไป
แม้ว่าบริษัทจะอ้างว่า DeepSeek ยอมรับว่า V3.2 ยังคงตามหลังคู่แข่งในสหรัฐฯ อยู่บ้าง ในด้านต่างๆ เช่น ความรู้ทั่วไปเกี่ยวกับโลก ความเข้าใจในบริบททางวัฒนธรรมที่กว้างขวาง หรือประสิทธิภาพในการใช้โทเค็น นอกจากนี้ ผู้นำโครงการเองก็ยอมรับว่า การเปรียบเทียบตามเกณฑ์มาตรฐานสาธารณะ สิ่งเหล่านี้ไม่ได้สะท้อนถึงประสิทธิภาพในโลกแห่งความเป็นจริงในสภาพแวดล้อมการผลิตเสมอไป โดยเฉพาะในงานแบบเปิดและกับผู้ใช้ปลายทาง
อีกประเด็นหนึ่งที่ต้องพิจารณาคือ การบูรณาการเครื่องมือในโหมดการใช้เหตุผล ยังคงต้องได้รับการตรวจสอบอย่างละเอียดในกรณีการใช้งานจริงที่ซับซ้อน ตั้งแต่การดูแลสุขภาพไปจนถึงการตัดสินใจทางการเงินหรือทางกฎหมาย DSA ประหยัดต้นทุนด้านการคำนวณได้มาก แต่ก็อาจถูกบดบังได้หากคุณภาพของคำตอบไม่คงที่เมื่องานมีความคลุมเครือมากขึ้นหรือต้องการบริบทที่เฉพาะเจาะจงมาก
ด้วยการมาถึงของ DeepSeek-V3.2 และรุ่น Speciale ภูมิทัศน์ของ AI ที่ใช้เหตุผลขั้นสูงได้รับผู้เล่นรายใหม่ที่มีความทะเยอทะยานระดับโลก โดยเดิมพันกับ โมเดลเปิด เครื่องมือแบบบูรณาการ และต้นทุนที่จำกัดการพัฒนาดังกล่าวทำให้ขอบเขตของตัวเลือกที่มีอยู่ในการวิจัย ธุรกิจ และการบริหารสาธารณะกว้างขึ้น ขณะเดียวกันก็บังคับให้ต้องคิดทบทวนใหม่ว่าจะปรับวิวัฒนาการที่รวดเร็วของ AI ให้เข้ากับกรอบการกำกับดูแลที่เข้มงวดและการแข่งขันที่รุนแรงมากขึ้นระหว่างกลุ่มเทคโนโลยีต่างๆ ได้อย่างไร
