Theo TechSpot, bằng cách sử dụng tập dữ liệu lớn để huấn luyện thuật toán học máy, các nhà nghiên cứu từ Adobe và Đại học Quốc gia Úc đã tạo ra một công nghệ mới có thể tạo mô hình 3D với sự kỳ diệu. Công nghệ này được gọi là Mô hình tái tạo lớn (LRM). Các nhà nghiên cứu cho biết đây là sản phẩm đầu tiên trong ngành có khả năng dự đoán hình dạng của mô hình 3D từ một hình ảnh 2D và quá trình này chỉ mất 5 giây.
Các nhà nghiên cứu đã giải thích rằng các mô hình 3D trước đây được đào tạo trên một tập dữ liệu nhỏ và tập trung vào một danh mục hình ảnh duy nhất. Tuy nhiên, mô hình LRM của họ sử dụng một kiến trúc dựa trên bộ chuyển đổi có khả năng mở rộng với 500 triệu tham số và đã được đào tạo trên khoảng 1 triệu đối tượng 3D từ bộ dữ liệu Objaverse và MVImgNet.
Nhà nghiên cứu đã giải thích rằng việc kết hợp mô hình dung lượng cao và dữ liệu đào tạo quy mô lớn đã cung cấp cho thuật toán LRM khả năng tạo ra các bản tái tạo 3D chất lượng cao, bao gồm cả hình ảnh thực tế. Hơn nữa, LRM có thể sử dụng cả hình ảnh thông thường và hình ảnh được tạo ra bởi các dịch vụ trí tuệ nhân tạo như DALL-E và Stable Diffusion làm mô hình 2D đầu vào.
Theo tác giả chính Yicong Hong của nghiên cứu, LRM là một bước đột phá lớn trong việc tái tạo mô hình 3D từ một hình ảnh. Thuật toán AI này có thể tạo ra các mô hình học chi tiết từ video hoặc hình ảnh, thậm chí giữ nguyên các kết cấu phức tạp như vân gỗ. Bạn đọc quan tâm có thể tham khảo những sáng tạo 3D ấn tượng của LRM tại đây.
Theo các nhà nghiên cứu, LRM có tiềm năng khổng lồ để được áp dụng trong nhiều lĩnh vực công nghiệp như thiết kế, giải trí và chơi game. Gần đây, AI công ty đã nhanh chóng đưa ra một số giải pháp tiềm năng liên quan đến việc tạo nội dung 3D, và một ví dụ điển hình là dịch vụ Stable 3D của Stability AI.
LRM có thể được lan rộng đến người dùng thông thường hơn bằng cách tạo ra những mô hình 3D ấn tượng chỉ từ những bức ảnh chụp bằng điện thoại. Mặc dù gặp phải nhiều khó khăn, nhưng LRM đang mở ra một thế giới đầy cơ hội cho sáng tạo và thương mại.