ผู้ให้บริการ AI จีน ขึ้นราคาบริการ-จำกัดสิทธิ์ หลังกำลังประมวลผลตึงตัว

สำนักข่าวอีไฟแนนซ์ไทย- -22 เม.ย. 69 9:43: น.

ความขาดแคลนกำลังประมวลผลกำลังบีบให้ผู้พัฒนาโมเดลปัญญาประดิษฐ์ (AI) และผู้ให้บริการคลาวด์ของจีนต้องจำกัดบริการ แบ่งโควตา และปรับขึ้นราคา ขณะที่ความต้องการใช้งาน AI โดยเฉพาะงานเขียนโค้ดและเอเจนต์ AI ยังพุ่งสูงต่อเนื่อง และห่วงโซ่อุปทานชิปยังตามไม่ทัน

ความตึงตัวของทรัพยากรประมวลผลกำลังกลายเป็นคอขวดสำคัญของอุตสาหกรรม AI ในจีน โดยเฉพาะในบริการที่ใช้โทเค็นจำนวนมากและต้องประมวลผลต่อเนื่อง เช่น Coding tools และ Agent frameworks ความไม่สอดคล้องระหว่างอุปสงค์ที่เร่งตัวกับอุปทานชิปที่จำกัด ทำให้หลายบริษัทต้องปรับการเข้าถึงระบบแบบเป็นช่วง ๆ เพื่อควบคุมภาระงานและต้นทุน

ผลกระทบไม่ได้จำกัดอยู่แค่การใช้งานของลูกค้าเท่านั้น แต่ยังสะท้อนถึงข้อจำกัดเชิงโครงสร้างของตลาดเซมิคอนดักเตอร์ และความสามารถในการขยายศูนย์ข้อมูลของผู้เล่นในจีนด้วย

ผลกระทบต่อผู้พัฒนา AI และผู้ให้บริการคลาวด์ของจีน

MiniMax เผชิญปัญหา API ทำงานเกินพิกัดหรือถูกระงับบริการจากการขาดแคลนกำลังประมวลผล ขณะที่ Moonshot AI มี API ที่โอเวอร์โหลดหรือถูกระงับ โดยโมเดล Kimi ถูกจำกัดการเข้าถึงซ้ำแล้วซ้ำเล่า ด้าน Zhipu AI ประสบปัญหาขาดแคลนกำลังประมวลผลอย่างรุนแรงจน API เกิดการโอเวอร์โหลด

บริษัทดังกล่าวยังต้องปรับกลยุทธ์เชิงพาณิชย์เพื่อรับมือกับต้นทุนที่สูงขึ้น โดย Zhipu AI คืนเงินผู้ใช้แผน Coding เมื่อวันที่ 13 เม.ย. หลังจำกัดการขายเหลือ 20% ของระดับก่อนหน้าในเดือนม.ค. และขึ้นราคาพ็อกเกจ API ในช่วงเดือนก.พ.-มี.ค. ตามข้อมูลที่ระบุในข่าว

CEO Zhang Peng ระบุว่าเอเจนต์ AI อย่าง OpenClaw ต้องการโทเค็นต่อภารกิจมากกว่าหลายสิบถึงหลายร้อยเท่า ซึ่งช่วยอธิบายว่าทำไมบริการระดับนี้จึงกระทบกำลังการประมวลผลอย่างรวดเร็ว

แรงกดดันลามไปยังแพลตฟอร์ม AI รายใหญ่

DeepSeek ประสบเหตุบริการขัดข้องเกือบ 12 ชั่วโมงเมื่อช่วงปลายเดือนมี.ค. ขณะที่ ByteDance รายงานว่าโมเดล Doubao ถูกจำกัดการเข้าถึงบ่อยครั้ง ByteDance ยังปิดฟีเจอร์โทรศัพท์เพื่อให้ชิปทำงานต่อไปโดยไม่สะดุดในช่วงเทศกาลฤดูใบไม้ผลิ และบังคับโควตาบนบริการคลาวด์เป็นระยะเพื่อตรึงการใช้งานความถี่สูง

Alibaba ผ่านหน่วย Qwen ระงับการทำงานที่ไม่จำเป็นภายในช่วงเทศกาลเพื่อคืนกำลังประมวลผลให้โมเดล AI และ Alibaba Cloud หยุดจำหน่ายพ็อกเกจโค้ดดิ้งฐานในเดือนเม.ย. เหลือเพียงพ็อกเกจพรีเมียมที่มักขายหมด ด้าน Tencent Cloud และ Baidu ก็ได้บังคับโควตาเป็นระยะเพื่อควบคุมการใช้งานความถี่สูง

สภาพดังกล่าวสะท้อนว่าการเติบโตของบริการ AI ไม่ได้ถูกจำกัดด้วยความต้องการเพียงอย่างเดียว แต่ยังถูกจำกัดด้วยทรัพยากรเบื้องหลังที่รองรับระบบทั้งหมด

ห่วงโซ่อุปทานชิปและบทบาทของ TSMC

บริษัทจีนยังเผชิญข้อจำกัดในการเข้าถึง GPU ขั้นสูงของ Nvidia ซึ่งพึ่งพา TSMC ในการผลิตชิปขนาด 3 นาโนเมตร ปัญหาการผลิตชิปของ TSMC ที่ตามความต้องการ AI ไม่ทัน ทำให้เกิดปัญหาขาดแคลนความจุการผลิตเวเฟอร์ และกลายเป็นคอขวดสำหรับการขยายศูนย์ข้อมูล

โรงงานใหม่ต้องใช้เวลาก่อสร้างและเข้าสู่ความจุเต็มที่กว่า 3 ปี โดย TSMC มีโรงงาน 3 นาโนเมตรที่กำลังก่อสร้างในไต้หวัน แอริโซนา และญี่ปุ่น ซึ่งจะเริ่มผลิตในช่วง 2027-2028 ขณะที่ผู้ผลิตรายใหญ่อย่าง Nvidia, AMD และ Google ก็พึ่งพา TSMC สำหรับชิปขั้นสูงเช่นกัน

ด้านการลงทุน องค์กรตลาดคาดว่างบลงทุนปี 2026 จะเพิ่มขึ้น 37% ต่อปี สู่ประมาณ 56,000 ล้านดอลลาร์ เพื่อรองรับความต้องการ AI ที่ยังเพิ่มขึ้นต่อเนื่อง

สิ่งที่นักลงทุนควรติดตาม

บริษัท AI และคลาวด์ของจีนจะยังคงจำกัดโควตาและปรับราคาบริการต่อไปหรือไม่
อุปทานชิปและกำลังการผลิตเวเฟอร์จะฟื้นตัวเร็วเพียงใด
ความคืบหน้าของโรงงาน 3 นาโนเมตรของ TSMC ในไต้หวัน แอริโซนา และญี่ปุ่น
ผลกระทบต่อบริการ AI แบบ Coding tools และ Agent frameworks ที่ใช้โทเค็นสูง
สัญญาณความต้องการจากแพลตฟอร์มรวมอย่าง OpenRouter ซึ่งรายงานว่าการบริโภคโทเค็นรายสัปดาห์ในเดือนเมษายนเพิ่มขึ้นเป็นเจ็ดถึงแปดเท่าต่อปี

บริบทตลาดและสัญญาณเชิงกลยุทธ์

Claude Code ของ Anthropic ประกาศเมื่อวันที่ 4 เม.ย. ว่าบริการแบบสมัครสมาชิกจะไม่สนับสนุนเครื่องมือของบุคคลที่สามอย่าง OpenClaw อีกต่อไป เหตุผลคือการจัดการบริบทที่ไม่มีประสิทธิภาพในเฟรมเวิร์กเอเจนต์ AI ทำให้เกิดการใช้โทเค็นปริมาณมากและมีต้นทุนสูงจนทำให้โมเดลไม่มีกำไร

ประเด็นนี้เชื่อมโยงโดยตรงกับการจำกัดทรัพยากรประมวลผลในจีน เพราะยิ่งบริการ AI ใช้โทเค็นมากเท่าไร ต้นทุนและแรงกดดันต่อโครงสร้างพื้นฐานก็ยิ่งสูงขึ้นเท่านั้น ดังนั้น การขาดแคลนขุมพลังในการประมวลผลจึงไม่ใช่เพียงปัญหาเชิงเทคนิค แต่เป็นปัจจัยที่กระทบความสามารถในการขยายธุรกิจของบริษัท AI จีนอย่างแท้จริง

ที่มา Caixin