OpenAI vừa thông báo về một tính năng mới cho phép chatbot AI có khả năng đọc to và phản hồi bằng giọng nói cho người dùng. Tính năng này có thể hỗ trợ người dùng có nhu cầu hỗ trợ, những người đang bận rộn hoặc đang di chuyển.
Theo The Verge, tính năng Text-to-Speech đã được tích hợp sẵn trên GPT-4 và GPT-3.5, hỗ trợ 37 ngôn ngữ và cung cấp năm giọng đọc cho người dùng lựa chọn.
Hiện tính năng này đã được phát triển trên các ứng dụng iOS, Android và trang web của ChatGPT. Để sử dụng tính năng này, người dùng chỉ cần nhấn và giữ vào câu trả lời của ChatGPT và sẽ thấy tùy chọn "Đọc thành tiếng". Trên phiên bản web, tùy chọn này sẽ xuất hiện ở phía dưới câu trả lời.
Tính năng Đọc thành tiếng được phát triển vài tháng sau khi OpenAI ra mắt tính năng cho phép người dùng ChatGPT yêu cầu thông qua giọng nói. Ví dụ, người dùng có thể yêu cầu ChatGPT kể một câu chuyện. Sự khác biệt của tính năng này so với Đọc thành tiếng là người dùng yêu cầu ChatGPT đọc câu trả lời của nó sau khi nó đưa ra câu trả lời, chứ không phải yêu cầu trả lời bằng giọng nói ngay từ đầu.
Trí tuệ nhân tạo sử dụng giọng nói có thể trở thành một công cụ hữu ích cho người khuyết tật. Ví dụ, VALL-E của Microsoft có khả năng tái tạo giọng nói chỉ sau 3 giây nghe ai đó nói. Apple cũng cho phép người dùng tạo ra "giọng nói tổng hợp" trên iPhone.
Tuy nhiên, vẫn còn những lo ngại về bảo mật, như trường hợp gần đây với việc sử dụng công nghệ trí tuệ nhân tạo để giả mạo giọng nói của Tổng thống Joe Biden trước cuộc bầu cử sơ bộ tại New Hampshire. Sau đó, Ủy ban Truyền thông Liên bang (FCC) đã hạn chế việc sử dụng giọng nói do trí tuệ nhân tạo tạo ra trong các cuộc gọi điện thoại, do lo ngại về các video deepfake và hành vi lừa đảo.