Đây là sản phẩm mới nhất của OpenAI, công ty khởi nghiệp ở thành phố San Francisco (Mỹ) đứng sau chatbot nổi tiếng ChatGPT, trình tạo hình ảnh DALL-E và mô hình chuyển văn bản thành video Sora.
Dịch vụ Voice Engine đã được phát triển từ cuối năm 2022 – cùng thời điểm ChatGPT ra mắt và sử dụng kiểu nhập văn bản cũng như mẫu âm thanh 15 giây để tạo ra "lời nói có âm thanh tự nhiên gần giống với người nói ban đầu".
Thông qua một bài đăng trên blog, OpenAI cho biết đã thử nghiệm Voice Engine trong hàng loạt các ứng dụng như hỗ trợ đọc cho trẻ em, dịch ngôn ngữ và phục hồi giọng nói cho bệnh nhân ung thư.
Một số người dùng mạng xã hội đã phản ứng bằng cách nêu bật các hành vi sử dụng sai mục đích có thể xảy ra, gồm cả hành vi gian lận tiềm ẩn bằng bắt chước giọng nói trái phép (deepfake).
OpenAI cho biết đang tạm dừng việc phát hành Voice Engine rộng rãi hơn vì có khả năng bị lạm dụng, đặc biệt là trong năm bầu cử.

"Chúng tôi nhận ra rằng việc tạo ra giọng nói giống với con người mang lại những rủi ro nghiêm trọng, đặc biệt là trong một năm bầu cử. Chúng tôi đang hợp tác với các đối tác ở Mỹ và quốc tế từ các cơ quan chính phủ, truyền thông, giải trí, giáo dục, xã hội dân sự và xa hơn nữa để đảm bảo rằng đang kết hợp phản hồi của họ trong quá trình xây dựng", OpenAI viết trong bài đăng trên blog.
Nhân bản giọng nói từ lâu đã được sử dụng trong các ngành công nghiệp và hỗ trợ các nhiệm vụ như hỗ trợ và tương tác với khách hàng, cũng như góp phần tăng hiệu quả chi phí và hoạt động.
Thị trường nhân bản giọng nói toàn cầu được dự đoán sẽ đạt gần 9,3 tỷ USD vào năm 2030, từ mức ước tính 1,45 tỷ USD vào năm 2022, tăng trưởng với tốc độ gộp hàng năm hơn 26%, dữ liệu mới nhất từ Grand View Research cho thấy.
Tuy nhiên, với sự ra đời của AI sáng tạo, các rủi ro cũng xuất hiện, bao gồm thông tin sai lệch, giả mạo và thiên vị, cùng những rủi ro khác.
Đặc biệt, OpenAI thừa nhận rằng những rủi ro này sẽ tăng cao vào năm 2024, là năm bầu cử ở Mỹ, nơi dự kiến sẽ có một trận tái đấu giữa Tổng thống đương nhiệm Joe Biden và Donald Trump, những người đã tham gia vào một cuộc chiến mang tính phân cực cao, được thúc đẩy bởi mạng xã hội trong 2020.
"Chúng tôi nhận thấy rằng việc tạo ra lời nói giống giọng nói của mọi người có những rủi ro nghiêm trọng… chúng tôi đang hợp tác với các đối tác Hoa Kỳ và quốc tế từ khắp các chính phủ, truyền thông, giải trí, giáo dục, xã hội dân sự và hơn thế nữa để đảm bảo rằng chúng tôi kết hợp được phản hồi của họ khi chúng tôi xây dựng", OpenAI cho biết.
OpenAI cho biết các đối tác Voice Engine của họ đã đồng ý với các chính sách sử dụng của họ, trong đó cấm mạo danh cá nhân hoặc tổ chức khác mà không có sự đồng ý hoặc quyền hợp pháp và yêu cầu "sự đồng ý rõ ràng và có hiểu biết" từ người nói ban đầu.
"Chúng tôi không cho phép các nhà phát triển xây dựng các cách để người dùng cá nhân tạo ra tiếng nói của riêng họ. Các đối tác cũng phải tiết lộ rõ ràng với khán giả của mình rằng giọng nói họ đang nghe là do AI tạo ra", công ty cho biết.







Cùng chuyên mục
Chấm dứt hoạt động Chi nhánh Trung tâm Tâm lý Giáo dục Ngọc Bích
Longevity Medical tổ chức sự kiện gặp gỡ PGS.TS.BS Phan Toàn Thắng: Lan tỏa giá trị y học tái tạo vì sức khỏe bền vững
Thanh tra ‘gõ cửa’ điểm mặt loạt vi phạm, PNJ nói gì?
Có nên mua dự án Narra Residences tại khu đô thị Thủ Thiêm?
Tăng sức mua cho thị trường nội địa sẽ giúp Việt Nam ứng phó thách thức thuế quan?
Urenco 11 - Tiên phong trong hoạt động xử lý môi trường