Tại Hội nghị Công nghệ GPU 2025, Tổng Giám đốc Nvidia Jensen Huang đã công bố dòng GPU tăng tốc AI mới, gồm Blackwell Ultra B300, Vera Rubin và Rubin Ultra. Những sản phẩm này không chỉ cải thiện hiệu suất AI mà còn nâng cao khả năng thực hiện các tác vụ suy luận và đào tạo. Sự ra mắt này tiếp tục khẳng định vị thế hàng đầu của Nvidia trong cuộc đua công nghệ toàn cầu.
Blackwell Ultra B300, dự kiến ra mắt trong nửa cuối năm 2025, hứa hẹn mang đến nhiều cải tiến vượt bậc so với người tiền nhiệm Blackwell GB200. Đáng chú ý, dung lượng bộ nhớ đã được nâng lên 288GB HBM3e, tăng 50% hiệu suất tính toán FP4 tensor dày đặc. Sự nâng cấp này không chỉ hỗ trợ các mô hình AI quy mô lớn mà còn nâng cao hiệu suất suy luận cho các nền tảng như DeepSeek R1. Trong cấu hình giá đỡ NVL72 đầy đủ, Blackwell Ultra có khả năng đạt tới 1,1 exaflop tính toán suy luận FP4, đánh dấu một bước tiến ấn tượng so với phiên bản B200 hiện tại.
Blackwell Ultra B300 không chỉ đơn thuần là một GPU. Sản phẩm này được trang bị nhiều giải pháp phần cứng đi kèm, bao gồm giá đỡ máy chủ B300 NVL16, trạm DGX GB300 và hệ thống giá đỡ GB300 NV72L. Khi kết hợp tám giá NV72L, Blackwell Ultra DGX SuperPOD ra đời, mang trong mình 288 CPU Grace và 576 GPU Blackwell Ultra. Đáng chú ý, hệ thống này sở hữu 300TB bộ nhớ HBM3e và khả năng tính toán FP4 vượt trội lên tới 11,5 exaflop. Nvidia tự hào gọi đây là "nhà máy AI" – một siêu máy tính có khả năng liên kết hoàn hảo để đáp ứng những nhu cầu tính toán khổng lồ hiện nay.
Vera Rubin, một sản phẩm được giới thiệu lần đầu tại Computex 2024, dự kiến sẽ ra mắt vào nửa cuối năm 2026. GPU này hứa hẹn mang đến những bước tiến đáng kể trong lĩnh vực đào tạo và suy luận AI. Đặc biệt, thiết bị tích hợp hai chip trên một đế, với hiệu suất suy luận FP4 đạt đến 50 petaflop cho mỗi chip và hàng chục terabyte bộ nhớ. Đi kèm với GPU là CPU Vera độc quyền do Nvidia thiết kế, sở hữu tới 88 lõi Arm tùy chỉnh và 176 luồng xử lý. Trong cấu hình giá đỡ NVL144, Vera Rubin có khả năng cung cấp tới 3,6 exaflop tính toán suy luận FP4, mở ra cơ hội cách mạng hóa khả năng xử lý trong lĩnh vực AI.
Nvidia vừa công bố về kiến trúc GPU tương lai mang tên “Feynman”, dự kiến ra mắt vào năm 2028 cùng với CPU Vera. Mặc dù thông tin hiện tại còn hạn chế, Feynman hứa hẹn sẽ nâng cao khả năng tính toán trí tuệ nhân tạo. Điều này cho thấy Nvidia vẫn tiếp tục duy trì vị thế dẫn đầu trong lĩnh vực công nghệ tiên tiến.
Trong bài phát biểu mới nhất, Jensen Huang đã vẽ nên bức tranh tương lai của các trung tâm dữ liệu, được ví như "nhà máy AI" chuyên sản xuất mã thông báo cho các mô hình trí tuệ nhân tạo. Ông nhấn mạnh sự quan trọng của "AI vật lý" trong việc cung cấp năng lượng cho robot hình người, đồng thời sử dụng công nghệ phần mềm Nvidia để đào tạo AI trong môi trường ảo trước khi đưa vào thực tế. Chiến lược này không chỉ khẳng định tham vọng vượt trội của Nvidia trong lĩnh vực công nghệ mà còn mang đến sự an tâm cho giới đầu tư, đặc biệt là sau những biến động thị trường gần đây, nhờ vào sự thành công của dòng chip Blackwell.