Một công ty khởi nghiệp đến từ Hoa Kỳ, Cerebras Systems, đang tìm cách lật đổ vị thế thống trị của Nvidia trong lĩnh vực GPU dành cho trí tuệ nhân tạo (AI). Họ đã phát triển và triển khai chip AI độc quyền của mình. Chip Wafer Scale Engine, có kích thước tương đương một chiếc iPad, chính thức được công bố cùng với dịch vụ mới vào thứ Ba. Dịch vụ này cho phép khách hàng tận dụng công nghệ tiên tiến của Cerebras nhằm nâng cao hiệu quả xử lý các tác vụ AI.
Cerebras vừa công bố công nghệ tiên tiến của họ có khả năng xử lý các chương trình AI sinh tổng hợp nhanh gấp 20 lần so với GPU Nvidia, chỉ với chi phí bằng một phần năm. Đặc biệt, dịch vụ Cerebras Inference mang lại tập trung vào khả năng suy luận của AI, cho phép tạo ra dữ liệu mới, chẳng hạn như dự đoán từ tiếp theo trong một đoạn văn. Điều này mở ra nhiều cơ hội mới cho các ứng dụng AI, làm tăng sự cạnh tranh trong lĩnh vực công nghệ máy tính.
Sử dụng chip tiên tiến của mình, Cerebras đã cùng Meta hợp tác để phát triển mô hình ngôn ngữ Llama 3.1. Phiên bản 8 tỷ tham số của mô hình này có khả năng xử lý đến 1.800 token mỗi giây, trong khi phiên bản 70 tỷ tham số đạt 450 token mỗi giây. Những con số này cho thấy sức mạnh vượt trội của Cerebras so với các dịch vụ đám mây AI khác, bao gồm AWS của Amazon và Microsoft Azure. Đặc biệt, chi phí sử dụng dịch vụ của Cerebras chỉ là một phần nhỏ so với các giải pháp dựa trên GPU, mở ra cơ hội lớn cho các doanh nghiệp muốn ứng dụng AI mà không tốn quá nhiều chi phí.
Chip WSE-3, được phát triển bởi TSMC Đài Loan, đánh dấu thế hệ chip thứ ba của Cerebras. Với khả năng xử lý 4 nghìn tỷ bóng bán dẫn và 900.000 lõi AI, WSE-3 mang đến băng thông bộ nhớ ấn tượng, vượt trội hơn 7.000 lần so với H100 của Nvidia. Tuy nhiên, cần lưu ý rằng sự so sánh này có phần thiếu chính xác, bởi Nvidia vừa giới thiệu kiến trúc Blackwell mới, được kỳ vọng sẽ nâng cao hiệu suất đáng kể so với mô hình H100 trước đó.
Cerebras đang nỗ lực mở rộng khả năng tiếp cận chip WSE-3 bằng cách cung cấp silicon cho các nhà cung cấp dịch vụ đám mây. Tuy nhiên, điều này đi kèm với mức chi phí lớn, với mỗi hệ thống CS-3 có giá lên đến vài triệu đô la. So với giá khoảng 30.000 đô la cho một GPU H100 của Nvidia, hệ thống của Cerebras tỏ ra đắt đỏ hơn rất nhiều.