Theo TechSpot, siêu máy tính Eos của Nvidia, được tạo ra đặc biệt cho các công việc xử lý AI, đã được công bố với các thông số ấn tượng. Được gọi là "nhà máy AI", Eos là minh chứng cho sức mạnh của công nghệ NVIDIA khi hoạt động ở quy mô lớn.
Eos đang sở hữu 576 máy chủ Nvidia DGX H100, mỗi máy chứa 8 GPU H100 Tensor Core, tổng cộng là 4.608 GPU. Ngoài ra, siêu máy tính này còn có mạng lưới Nvidia Quantum-2 InfiniBand và phần mềm chuyên dụng. Sự kết hợp này giúp tăng hiệu suất AI FP8 lên đến 18.4 exaflop.
Với cấu trúc mạng hỗ trợ tốc độ truyền dữ liệu lên đến 400Gb/s, Eos có khả năng huấn luyện các mô hình ngôn ngữ lớn, hệ thống đề xuất và mô phỏng lượng tử, cùng nhiều tác vụ AI khác. Theo Nvidia, Eos được xây dựng dựa trên kiến thức từ các siêu máy tính Nvidia DGX trước đó như Saturn 5 và Selene. Hiện tại, các nhà phát triển của Nvidia đang sử dụng Eos cho các nghiên cứu về AI.
Eos đã thu hút sự chú ý khi được xếp hạng thứ 9 trong danh sách Top500 của những siêu máy tính nhanh nhất thế giới vào năm trước. Siêu máy tính dẫn đầu trong bảng xếp hạng Top500 là hệ thống Frontier tại Phòng thí nghiệm Quốc gia Oak Ridge ở Tennessee (Mỹ), với điểm HPL là 1.194 PFlop/s, trong khi Eos đạt 121.4 PFlop/s. Có khả năng rằng điểm số này sẽ được cải thiện trong tương lai.
Vào tháng 11 năm ngoái, Eos đã hoàn thành bài benchmark huấn luyện MLPerf dựa trên mô hình GPT-3 với 175 tỷ tham số được huấn luyện trên 1 tỷ token chỉ trong 3,9 phút - cải thiện gần 3 lần so với 10,9 phút của 6 tháng trước. Nvidia tuyên bố rằng do benchmark sử dụng một phần của bộ dữ liệu GPT-3 hoàn chỉnh, bằng cách ngoại suy, Eos giờ đây có thể huấn luyện chỉ trong 8 ngày, nhanh hơn 73 lần so với hệ thống sử dụng 512 GPU A100, vốn là tiêu chuẩn hiệu suất cao nhất khi GPT-3 ra mắt vào năm 2020.
Eos cũng được đi kèm với một bộ phần mềm tích hợp dành cho phát triển và triển khai trí tuệ nhân tạo, bao gồm quản lý hệ thống máy tính và biên dịch, lưu trữ tính toán và thư viện mạng được tăng tốc, cùng với hệ điều hành được tối ưu hóa cho các công việc liên quan đến trí tuệ nhân tạo.