OpenAI vừa thông báo về Voice Engine, một công cụ AI tiên tiến có khả năng tạo ra bản sao giọng nói chỉ từ 15 giây thu âm giọng gốc. Công nghệ này hứa hẹn đem lại những ứng dụng mới và tiềm năng trong nhiều lĩnh vực khác nhau.
Voice Engine hoạt động dựa trên công nghệ AI tiên tiến, có khả năng học và mô phỏng giọng nói của người nói một cách chính xác. Chỉ cần một đoạn thu âm ngắn, Voice Engine có thể tạo ra giọng nói AI và đọc bất kỳ văn bản nào, cùng ngôn ngữ với người nói hoặc nhiều ngôn ngữ khác.
Theo OpenAI, họ bắt đầu phát triển Voice Engine vào cuối năm 2022 và công nghệ này đã cung cấp giọng nói cài đặt sẵn cho API chuyển văn bản thành giọng nói và tính năng đọc phản hồi của ChatGPT.
OpenAI đang hợp tác với nhiều doanh nghiệp trong lĩnh vực giáo dục, y tế và công nghệ để thử nghiệm và áp dụng Voice Engine. Một số ví dụ tiêu biểu bao gồm:
Công ty công nghệ giáo dục Age of Learning sử dụng Voice Engine để tạo nội dung thuyết minh cho các bài học trực tuyến, giúp học sinh hiểu kiến thức một cách hiệu quả hơn.
- Dimagi, một công ty sản xuất phần mềm y tế, đang áp dụng công nghệ Voice Engine để tạo ra giọng nói cho phần mềm y tế, nhằm hỗ trợ người khuyết tật trong việc sử dụng sản phẩm một cách thuận tiện hơn.
Nâng cao trải nghiệm của khách hàng: Công ty phát triển ứng dụng trí tuệ nhân tạo Livox hiện đang áp dụng công nghệ Voice Engine để tạo ra giọng nói cho chatbot, giúp cải thiện trải nghiệm của khách hàng một cách tự nhiên.
Tuy nhiên, việc áp dụng công nghệ AI để tạo giọng nói cũng mang theo một số rủi ro. OpenAI cam kết sẽ áp dụng Voice Engine một cách có trách nhiệm và tuân thủ các nguyên tắc đạo đức. Các đối tác của OpenAI phải cam kết không sử dụng Voice Engine để giả mạo cá nhân hoặc tổ chức, đồng thời cần có sự đồng ý của người nói trước khi sử dụng giọng nói của họ.
Voice Engine đánh dấu một bước tiến quan trọng trong lĩnh vực Trí tuệ nhân tạo. Công nghệ này hứa hẹn mang lại nhiều lợi ích cho cộng đồng, tuy nhiên cũng cần được áp dụng một cách cẩn thận và có trách nhiệm.