Google đã công bố Lumiere, một mô hình trí tuệ nhân tạo mới nhất của họ, cho phép người dùng chuyển đổi văn bản hoặc hình ảnh thành video một cách nhanh chóng.
Trong quá trình nghiên cứu, Google đã thông báo rằng Lumiere là một sự tiến bộ trong việc tạo ra video "chân thực, đa dạng và mạch lạc" luôn là một trong những thách thức lớn khi áp dụng trí tuệ nhân tạo để tạo video.
Lumiere đã áp dụng kiến trúc "Space-Time U-Net" mới để tạo ra toàn bộ đoạn video cùng một lúc bằng cách sử dụng một quy trình AI. Trong quá trình tạo, mô hình sẽ kiểm tra tất cả các yếu tố "không gian" của video clip, bao gồm cả vị trí và chuyển động trong thời gian. Mô hình sẽ thực hiện cả hai yếu tố này đồng thời để tạo ra hiệu ứng chuyển động mượt mà nhất.
Lumiere cũng bao gồm việc biến đổi, tạo ra những biến thể video theo nhiều phong cách khác nhau và Cinemagraphs, cung cấp phương pháp tạo hình ảnh chuyển động cho một phần nhỏ, được đánh dấu trong hình ảnh gốc. Tính năng Video Inpainting có thể thay đổi từng phần của video gốc, ví dụ như thay đổi màu sắc, chất liệu hoặc hoa văn trên trang phục của một cô gái.
Theo Google, Lumiere có thể tạo ra các video có độ phân giải thấp 1024×1024 và thời lượng không vượt quá 5 giây. Mặc dù vậy, Google khẳng định rằng người dùng ưa thích sản phẩm của Lumiere hơn các mô hình Trí tuệ nhân tạo hiện có.
Nhờ được huấn luyện trên một tập dữ liệu rộng chứa 30 triệu video cùng với các mô tả văn bản, Lumiere có khả năng học hỏi các mẫu phổ biến trong video và áp dụng kiến thức đó để tạo ra các video mới với nội dung phong phú và hấp dẫn hơn so với các mô hình Trí tuệ Nhân tạo khác.
Hiện tại, Lumiere đang ở giai đoạn nghiên cứu và Google đang xem xét những nguy cơ khi phát hành toàn cầu, điều mà Deepfakes đã gây ra làn sóng phản đối.
Việc phát triển Trí tuệ nhân tạo (AI) là một quá trình phức tạp và đầy rủi ro cần được xem xét kỹ lưỡng. Bằng cách thực hiện các biện pháp kiểm soát và giám sát chặt chẽ, các nhà phát triển có thể giảm thiểu những rủi ro này và đảm bảo rằng AI được phát triển và sử dụng một cách an toàn và có trách nhiệm.