Công nghệ giúp bạn sao chép giọng nói của người khác chỉ trong một nốt nhạc

Thế giới sẽ như thế nào nếu như ai đó có thể bắt chước giọng nói của các vị nguyên thủ quốc gia như tổng thống Trump để phát đi các tin tức giả mạo?

Lyrebird – một công ty có trụ sở ở Montreal vừa phát hành một API cho phép bạn tổng hợp giọng nói của người khác. Điểm đặc biệt của công nghệ này là bạn chỉ cần có trong tay dữ liệu là một đoạn ghi âm khoảng 1 phút từ đối tượng mà bạn muốn bắt chước giọng nói.

Để chứng minh cho điều này, Lyrebird đã đăng tải một số đoạn âm thanh ví dụ trên website chính thức của công ty. Công nghệ mới không đòi hỏi đối tượng phải nói những từ mà bạn muốn sử dụng trong đoạn ghi âm muốn tạo ra. Ngoài ra, bạn cũng có thể thoải mái tùy biến ngữ điệu của người đó.


API của Lyrebird chỉ cần đoạn ghi âm một phút và sẽ sử dụng công nghệ đám mây để xử lí âm thanh tổng hợp.

Tháng 11 năm ngoái, Adobe cũng đã thử nghiệm một công nghệ tương tự với tên gọi là dự án VoCo. Tuy nhiên, công nghệ của Adobe yêu cầu phải có một đoạn ghi âm khoảng 20 phút và sử dụng tài nguyên hệ thống để tổng hợp giọng nói. API của Lyrebird chỉ cần đoạn ghi âm một phút và sẽ sử dụng công nghệ đám mây để xử lí âm thanh tổng hợp.

Nhiều người lo lắng các công nghệ này sẽ được sử dụng để bắt chước giọng nói của người khác và truyền đi những thông tin với mục đích xấu. Sẽ ra sao nếu ai đó sử dụng công nghệ này để truyền đi các thông tin giả mạo từ các nguyên thủ quốc gia? Hay bạn sẽ phản ứng thế nào nếu ai đó giả giọng một thành viên trong gia đình và gửi cho bạn một thông điệp khẩn cấp nào đó.

Tuy nhiên, Lyrebird nói rằng họ công khai công nghệ này và bảo đảm sẽ không có rủi ro cho việc sử dụng. Công ty hy vọng mọi người sẽ sớm biết đến công nghệ mới này và việc sao chép giọng nói của một người sẽ trở nên hợp pháp.

Nhưng, nếu với mục đích sử dụng thông thường, thì bạn cần sao chép giọng nói để dùng trong trường hợp nào?

 

Theo vnreview