ความตึงตัวของทรัพยากรประมวลผลกำลังกลายเป็นคอขวดสำคัญของอุตสาหกรรม AI ในจีน โดยเฉพาะในบริการที่ใช้โทเค็นจำนวนมากและต้องประมวลผลต่อเนื่อง เช่น Coding tools และ Agent frameworks ความไม่สอดคล้องระหว่างอุปสงค์ที่เร่งตัวกับอุปทานชิปที่จำกัด ทำให้หลายบริษัทต้องปรับการเข้าถึงระบบแบบเป็นช่วง ๆ เพื่อควบคุมภาระงานและต้นทุน
ผลกระทบไม่ได้จำกัดอยู่แค่การใช้งานของลูกค้าเท่านั้น แต่ยังสะท้อนถึงข้อจำกัดเชิงโครงสร้างของตลาดเซมิคอนดักเตอร์ และความสามารถในการขยายศูนย์ข้อมูลของผู้เล่นในจีนด้วย
ผลกระทบต่อผู้พัฒนา AI และผู้ให้บริการคลาวด์ของจีน
MiniMax เผชิญปัญหา API ทำงานเกินพิกัดหรือถูกระงับบริการจากการขาดแคลนกำลังประมวลผล ขณะที่ Moonshot AI มี API ที่โอเวอร์โหลดหรือถูกระงับ โดยโมเดล Kimi ถูกจำกัดการเข้าถึงซ้ำแล้วซ้ำเล่า ด้าน Zhipu AI ประสบปัญหาขาดแคลนกำลังประมวลผลอย่างรุนแรงจน API เกิดการโอเวอร์โหลด
บริษัทดังกล่าวยังต้องปรับกลยุทธ์เชิงพาณิชย์เพื่อรับมือกับต้นทุนที่สูงขึ้น โดย Zhipu AI คืนเงินผู้ใช้แผน Coding เมื่อวันที่ 13 เม.ย. หลังจำกัดการขายเหลือ 20% ของระดับก่อนหน้าในเดือนม.ค. และขึ้นราคาพ็อกเกจ API ในช่วงเดือนก.พ.-มี.ค. ตามข้อมูลที่ระบุในข่าว
CEO Zhang Peng ระบุว่าเอเจนต์ AI อย่าง OpenClaw ต้องการโทเค็นต่อภารกิจมากกว่าหลายสิบถึงหลายร้อยเท่า ซึ่งช่วยอธิบายว่าทำไมบริการระดับนี้จึงกระทบกำลังการประมวลผลอย่างรวดเร็ว
แรงกดดันลามไปยังแพลตฟอร์ม AI รายใหญ่
DeepSeek ประสบเหตุบริการขัดข้องเกือบ 12 ชั่วโมงเมื่อช่วงปลายเดือนมี.ค. ขณะที่ ByteDance รายงานว่าโมเดล Doubao ถูกจำกัดการเข้าถึงบ่อยครั้ง ByteDance ยังปิดฟีเจอร์โทรศัพท์เพื่อให้ชิปทำงานต่อไปโดยไม่สะดุดในช่วงเทศกาลฤดูใบไม้ผลิ และบังคับโควตาบนบริการคลาวด์เป็นระยะเพื่อตรึงการใช้งานความถี่สูง
Alibaba ผ่านหน่วย Qwen ระงับการทำงานที่ไม่จำเป็นภายในช่วงเทศกาลเพื่อคืนกำลังประมวลผลให้โมเดล AI และ Alibaba Cloud หยุดจำหน่ายพ็อกเกจโค้ดดิ้งฐานในเดือนเม.ย. เหลือเพียงพ็อกเกจพรีเมียมที่มักขายหมด ด้าน Tencent Cloud และ Baidu ก็ได้บังคับโควตาเป็นระยะเพื่อควบคุมการใช้งานความถี่สูง
สภาพดังกล่าวสะท้อนว่าการเติบโตของบริการ AI ไม่ได้ถูกจำกัดด้วยความต้องการเพียงอย่างเดียว แต่ยังถูกจำกัดด้วยทรัพยากรเบื้องหลังที่รองรับระบบทั้งหมด
ห่วงโซ่อุปทานชิปและบทบาทของ TSMC
บริษัทจีนยังเผชิญข้อจำกัดในการเข้าถึง GPU ขั้นสูงของ Nvidia ซึ่งพึ่งพา TSMC ในการผลิตชิปขนาด 3 นาโนเมตร ปัญหาการผลิตชิปของ TSMC ที่ตามความต้องการ AI ไม่ทัน ทำให้เกิดปัญหาขาดแคลนความจุการผลิตเวเฟอร์ และกลายเป็นคอขวดสำหรับการขยายศูนย์ข้อมูล
โรงงานใหม่ต้องใช้เวลาก่อสร้างและเข้าสู่ความจุเต็มที่กว่า 3 ปี โดย TSMC มีโรงงาน 3 นาโนเมตรที่กำลังก่อสร้างในไต้หวัน แอริโซนา และญี่ปุ่น ซึ่งจะเริ่มผลิตในช่วง 2027-2028 ขณะที่ผู้ผลิตรายใหญ่อย่าง Nvidia, AMD และ Google ก็พึ่งพา TSMC สำหรับชิปขั้นสูงเช่นกัน
ด้านการลงทุน องค์กรตลาดคาดว่างบลงทุนปี 2026 จะเพิ่มขึ้น 37% ต่อปี สู่ประมาณ 56,000 ล้านดอลลาร์ เพื่อรองรับความต้องการ AI ที่ยังเพิ่มขึ้นต่อเนื่อง
สิ่งที่นักลงทุนควรติดตาม
- บริษัท AI และคลาวด์ของจีนจะยังคงจำกัดโควตาและปรับราคาบริการต่อไปหรือไม่
- อุปทานชิปและกำลังการผลิตเวเฟอร์จะฟื้นตัวเร็วเพียงใด
- ความคืบหน้าของโรงงาน 3 นาโนเมตรของ TSMC ในไต้หวัน แอริโซนา และญี่ปุ่น
- ผลกระทบต่อบริการ AI แบบ Coding tools และ Agent frameworks ที่ใช้โทเค็นสูง
- สัญญาณความต้องการจากแพลตฟอร์มรวมอย่าง OpenRouter ซึ่งรายงานว่าการบริโภคโทเค็นรายสัปดาห์ในเดือนเมษายนเพิ่มขึ้นเป็นเจ็ดถึงแปดเท่าต่อปี
บริบทตลาดและสัญญาณเชิงกลยุทธ์
Claude Code ของ Anthropic ประกาศเมื่อวันที่ 4 เม.ย. ว่าบริการแบบสมัครสมาชิกจะไม่สนับสนุนเครื่องมือของบุคคลที่สามอย่าง OpenClaw อีกต่อไป เหตุผลคือการจัดการบริบทที่ไม่มีประสิทธิภาพในเฟรมเวิร์กเอเจนต์ AI ทำให้เกิดการใช้โทเค็นปริมาณมากและมีต้นทุนสูงจนทำให้โมเดลไม่มีกำไร
ประเด็นนี้เชื่อมโยงโดยตรงกับการจำกัดทรัพยากรประมวลผลในจีน เพราะยิ่งบริการ AI ใช้โทเค็นมากเท่าไร ต้นทุนและแรงกดดันต่อโครงสร้างพื้นฐานก็ยิ่งสูงขึ้นเท่านั้น ดังนั้น การขาดแคลนขุมพลังในการประมวลผลจึงไม่ใช่เพียงปัญหาเชิงเทคนิค แต่เป็นปัจจัยที่กระทบความสามารถในการขยายธุรกิจของบริษัท AI จีนอย่างแท้จริง
ที่มา Caixin