OpenAI vừa ra mắt phiên bản thử nghiệm mới nhất của mô hình trí tuệ nhân tạo, GPT-4o, với khả năng giảng dạy ngoại ngữ ấn tượng thông qua chế độ giọng nói nâng cao (AVM). Dự kiến bắt đầu thử nghiệm vào cuối tháng 7 với nhóm người dùng ChatGPT Plus, phiên bản này hứa hẹn sẽ mang lại cải tiến đáng kể trong việc hỗ trợ học ngôn ngữ.
GPT-4o không chỉ hiểu và phản hồi ngay lập tức bằng giọng nói mà còn nhận biết và bắt chước cảm xúc người dùng, cũng như điều chỉnh tốc độ nói theo yêu cầu. Tính năng này được minh họa rõ trong một video mà OpenAI công bố, khi một người dùng nói tiếng Tây Ban Nha và sử dụng GPT-4o để hỗ trợ một người bạn học tiếng Bồ Đào Nha. Các người dùng có thể yêu cầu GPT-4o giảm tốc độ nói hoặc giải thích những cụm từ khó hiểu một cách rõ ràng.
Đặc điểm nổi bật của GPT-4o là khả năng chuyển đổi trực tiếp từ một giọng điệu này sang một giọng điệu khác mà không cần thông qua bước chuyển đổi thành văn bản, giúp tương tác với người dùng một cách mượt mà và tự nhiên hơn. Ngoài ra, trí tuệ nhân tạo này cũng có khả năng nhận biết cách phát âm và giọng điệu của người dùng, từ đó đưa ra phản hồi phù hợp.
Trong buổi công bố ngày 14/5, Mira Murati, Giám đốc Công nghệ của OpenAI, đã nhấn mạnh rằng GPT-4o đã đạt được những tiến bộ đáng kể trong khả năng trò chuyện, có khả năng biểu hiện cảm xúc, thay đổi giọng điệu và bổ sung tiếng cười, tạo không khí hài hước trong giao tiếp.