Giá gấp ba Nvidia nhưng vẫn “cháy hàng”: Vì sao cụm AI của Huawei khiến các công ty Trung Quốc tranh nhau mua?

Với việc CloudMatrix 384 đã được tích hợp vào các trung tâm dữ liệu hiện có, Huawei không chỉ chứng minh khả năng phát triển phần cứng AI quy mô lớn, mà còn khẳng định vai trò đầu tàu trong việc xây dựng hệ sinh thái AI độc lập của Trung Quốc.

Huawei vừa đạt một cột mốc quan trọng trong tham vọng mở rộng sức mạnh AI nội địa, khi cụm máy chủ CloudMatrix 384 (CM384) chính thức được bàn giao cho nhiều tập đoàn công nghệ lớn tại Trung Quốc. Đây là dấu hiệu cho thấy các doanh nghiệp trong nước đã sẵn sàng đặt niềm tin vào phần cứng “cây nhà lá vườn”, ngay cả khi chi phí sở hữu cao gấp ba lần giải pháp từ NVIDIA.

CM384 là một trong những hệ thống AI mạnh mẽ nhất mà Huawei từng phát triển, được xây dựng hoàn toàn dựa trên phần cứng nội bộ – cụ thể là 384 chip Ascend 910C do chính Huawei thiết kế. Cấu trúc liên kết của hệ thống sử dụng kết nối “all-to-all topology”, cho phép các chip xử lý giao tiếp trực tiếp với nhau nhằm giảm độ trễ và tối ưu hóa hiệu suất xử lý.

Theo thông tin được Financial Times tiết lộ, đã có ít nhất 10 khách hàng lớn tại Trung Quốc chốt đơn đặt hàng cụm AI này. Dù Huawei không công bố tên cụ thể, nhưng các đối tác được mô tả là “những khách hàng chủ lực, lâu năm” – cho thấy đây không phải là bước thử nghiệm thăm dò mà là sự chấp nhận thực sự từ thị trường.

Vượt mặt NVIDIA về hiệu suất, nhưng trả giá bằng năng lượng và chi phí

CloudMatrix 384 có thể đạt hiệu năng lên đến 300 PetaFLOPS ở chuẩn BF16, tức gần gấp đôi so với hệ thống GB200 NVL72 hàng đầu của NVIDIA. Lợi thế này phần lớn đến từ việc Huawei đã chọn phương án brute force – sử dụng gấp năm lần số lượng chip so với cấu hình GB200 của đối thủ Mỹ.

Tuy nhiên, đi kèm với sức mạnh đó là một hệ quả không nhỏ: cụm CM384 tiêu thụ năng lượng cao gấp 3,9 lần GB200 NVL72. Điều này khiến chỉ số hiệu suất trên mỗi watt (perf/watt) của Huawei bị đánh giá là “kém hấp dẫn” trong các tác vụ AI kéo dài hoặc quy mô lớn. Dù vậy, rõ ràng Huawei không chọn cuộc chơi tối ưu chi phí, mà là cuộc chơi khẳng định năng lực tự chủ công nghệ giữa bối cảnh căng thẳng thương mại – công nghệ ngày càng leo thang.

Một cụm CloudMatrix 384 có giá vào khoảng 8 triệu USD, gần gấp ba mức giá ước tính của hệ thống GB200 NVL72 đến từ NVIDIA. Con số này đủ để khiến bất kỳ nhà đầu tư nào cân nhắc lại – nhưng tại Trung Quốc, nó đang được xem là khoản chi đáng giá.

Lý do không nằm ở bài toán kinh tế, mà ở yếu tố chiến lược. Trong bối cảnh Trung Quốc ngày càng bị hạn chế tiếp cận công nghệ bán dẫn cao cấp từ phương Tây, việc có trong tay một hệ thống AI mạnh mẽ, độc lập về chuỗi cung ứng, và do doanh nghiệp nội địa phát triển trở thành một lựa chọn ưu tiên, thậm chí là bắt buộc.