Google DeepMind, một trong những công ty hàng đầu về nghiên cứu trí tuệ nhân tạo, vừa công bố phương pháp đào tạo AI mới được gọi là JEST, viết tắt của "Joint Example Selection Training". Phương pháp này hứa hẹn sẽ mang lại tốc độ đào tạo nhanh hơn gấp 13 lần và hiệu quả năng lượng cao hơn 10 lần so với các phương pháp truyền thống. Điều này đặc biệt quan trọng trong bối cảnh ngành công nghệ đang phải đối mặt với áp lực lớn về tác động môi trường của trung tâm dữ liệu AI.
Sự khác biệt chính của JEST so với các phương pháp truyền thống là thay vì tập trung vào từng điểm dữ liệu riêng lẻ, nó tập trung vào toàn bộ các batch dữ liệu. Trong quá trình này, một mô hình AI nhỏ hơn được sử dụng để phân loại chất lượng của dữ liệu từ các nguồn cao cấp, sau đó xếp hạng các batch theo chất lượng. Kết quả từ mô hình nhỏ này sau đó được dùng để đào tạo một mô hình lớn hơn.
DeepMind đã nhấn mạnh rằng để đạt hiệu quả, mô hình cần được huấn luyện bằng bộ dữ liệu chất lượng cao mà con người cung cấp. Khi chất lượng dữ liệu không đạt yêu cầu, phương pháp này sẽ không hiệu quả, theo nguyên tắc "rác vào, rác ra". Vì vậy, kỹ năng quản lý dữ liệu cao và không phù hợp với những nhà phát triển AI không chuyên nghiệp.
Việc sử dụng JEST phổ biến trong ngành công nghiệp AI có thể giúp giảm chi phí và tiêu tốn năng lượng đáng kể trong quá trình đào tạo, đồng thời duy trì hiệu quả. Tuy nhiên, việc các công ty lớn áp dụng phương pháp này hay không vẫn còn là một câu hỏi, vì chi phí đào tạo mô hình AI đang ngày càng tăng, với dự đoán một số mô hình trong tương lai sẽ tiêu tốn hàng tỷ đô la.
Phương pháp JEST có thể là một phương án để giảm chi phí và tiết kiệm năng lượng, tuy nhiên, cũng có khả năng tăng cường sử dụng năng lượng để đạt được tốc độ đào tạo nhanh hơn. Cuối cùng, vấn đề quan trọng là phải cân nhắc cách thức để in hoá giữa tiết kiệm chi phí và quy mô đầu ra để tối ưu hóa hiệu quả.