OpenAI vừa giới thiệu phiên bản mới của mô hình ngôn ngữ mang tên GPT-4o mini, được phát triển nhằm tạo điều kiện cho người dùng tiếp cận công nghệ AI một cách dễ dàng và tiết kiệm chi phí hơn. Phiên bản mới này, là một phiên bản nhỏ gọn và tối ưu hơn của GPT-4o, không chỉ cam kết nâng cao khả năng xử lý văn bản mà còn mở ra khả năng tương tác với các loại hình phương tiện khác như hình ảnh, video và âm thanh.
GPT-4o mini là một thành phần trong chiến lược của OpenAI nhằm mở rộng khả năng tiếp cận công nghệ trí tuệ nhân tạo. Nó cung cấp tính năng đa phương thức, cho phép tích hợp nhiều loại hình phương tiện như văn bản, hình ảnh, âm thanh và video vào một công cụ duy nhất. Ông Brad Lightcap, đại diện của OpenAI, đã nhấn mạnh rằng việc tương tác với thế giới cần được thực hiện qua nhiều cách khác nhau, không chỉ giới hạn ở văn bản mà còn qua hình ảnh và âm thanh.
GPT-4o mini đã chính thức được triển khai cho người dùng miễn phí và người đăng ký của ChatGPT, thay thế cho phiên bản GPT-3.5 Turbo trước đó và sẽ có mặt trên ChatGPT Enterprise trong tuần tới. Mô hình này được xem như một nhánh của GPT-4o, phiên bản nhanh nhất và mạnh mẽ nhất của OpenAI hiện tại, đã được giới thiệu vào tháng 5 với nhiều cải tiến đáng kể liên quan đến khả năng tạo ra âm thanh, video và văn bản.
Với sự hỗ trợ từ Microsoft và được các nhà đầu tư định giá trên 80 tỷ USD, OpenAI đang nỗ lực để giữ vững vị thế hàng đầu trong lĩnh vực AI tạo sinh. Thành lập vào năm 2015, công ty hiện đang phải đối mặt với những thách thức không chỉ ở khía cạnh phát triển công nghệ mà còn trong việc tạo ra lợi nhuận từ các khoản đầu tư lớn vào hạ tầng và bộ xử lý cần thiết cho việc xây dựng và đào tạo các mô hình AI của mình.