VALL-E: Công nghệ mới có thể nhại giọng con người chính xác chỉ sau 3 giây thu âm

14:22 | 01/02/2023

Theo dõi Kinh tế Xây Dựng trên
|
Theo báo cáo được công bố, VALL-E là công cụ được phát triển bởi Microsoft dựa trên cơ sở dữ liệu được cung cấp bởi Meta, công ty mẹ của Facebook, tổng hợp. Kho dữ liệu này bao gồm 60.000 giờ thoại được thực hiện bởi 7.000 người.
VALL-E: Công nghệ mới có thể nhại giọng con người chính xác chỉ sau 3 giây thu âm
Ảnh minh họa, https://kinhtexaydung.petrotimes.vn

Trong buổi trải nghiệm, phóng viên công nghệ Chris Matyszczyk đã nghe thử một số đoạn ghi âm, và đưa ra cảm nhận của mình trên trang tin ZDNet. Ông nghe một giọng nam phát biểu trong 3 giây, nghe đoạn âm thanh dài 8 giây do VALL-E sản sinh ra, rồi nhận định: khó có thể nhận ra đâu là con người phát biểu, đâu là AI phát ra âm thanh.

Chris cũng cho rằng, mặc dù cách dùng từ của VALL-E hiện vẫn chưa thực sự giống người, tuy nhiên, đây vẫn là công cụ 'đáng sợ'.

Ở một mặt khác, các chuyên gia cho rằng, đa số chúng ta đã quen với các cuộc gọi tự động với một giọng nói được ghi âm sẵn hoặc một giọng nói tự động vang lên tại đầu dây bên kia. Khi VALL-E ra đời, giọng nói tự động có thể tiếp tục được nâng cấp và đạt tới mức độ trau truốt chưa từng có khi nó có khả năng tái tạo được cả 'cảm xúc và môi trường âm thanh' chỉ với đoạn ghi âm dài 3 giây.

Nhìn nhận ở lĩnh vực đảm bảo an toàn thông tin mạng, VALL-E có thể sẽ trở thành thứ 'vũ khí' mới bị kẻ gian lợi dụng để tạo ra các giọng nói giống người thật nhằm thực hiện mục tiêu mạo danh và đi lừa người khác.

Đối mặt với vấn đề an ninh này, các nhà phát triển hệ thống VALL-E hiện vẫn chưa có biện pháp để đưa công cụ nhại giọng nói này vào sử dụng phổ biến mà không biến nó thành công cụ lừa đảo của kẻ xấu.

Do đó, mặc dù là công cụ hiện đại, tân tiến nhưng VALL-E vẫn còn vấp phải nhiều rào cản để đưa vào thương mại hóa.

https://kinhtexaydung.petrotimes.vn

Khánh An

sohuutritue.net.vn

vietinbank
ajinomoto