Với machine learning đang học được ngày một nhiều, công nghệ sẽ sớm chạm tới mức “thực tế”.
Trước sự ngỡ ngàng của giới công nghệ, cơ quan tin tức Xinhua của Trung Quốc vừa ra mắt phát thanh viên truyền hình hoạt động bằng điện năng: nó là một hình ảnh kĩ thuật số dạng con người, đọc tin tức bằng một giọng nói được làm nhân tạo hoàn toàn.
Không rõ các kĩ sư Trung Quốc đã sử dụng công nghệ gì để tạo nên phát thanh viên này, nhưng có vẻ họ quy tụ những yếu tố tiên tiến nhất của nghiên cứu machine learning tại đất nước tỉ dân. Dường như Xinhua sử dụng hình ảnh của một phát thanh viên có thực để làm nền dựng lên mô hình kĩ thuật số, rồi sử dụng kĩ xảo máy tính để hoạt họa khẩu hình, biểu cảm khuôn mặt. Đây là một con rối điện thực thụ, thay vì hoàn toàn bằng xương bằng thịt, cơ thể của phát thanh viên ảo có thêm yếu tố 1 và 0.
Buổi làm việc đầu tiên của phát thanh viên ảo.
Kết hợp với một giọng nói được tổng hợp bằng máy tính, Xinhua có thể lập trình cho phát thanh viên ảo đọc tin tức, nhanh hơn cách thức dùng kĩ xảo máy tính truyền thống. Theo các trang tin Trung Hoa, hai phát thanh viên ảo – một nói tiếng Anh, một nói tiếng Trung – là sản phẩm của dự án kết hợp giữa Xinhua và công ty Sogou.
Các phát thanh viên đều có thể làm việc 24 giờ không nghỉ, trên bất kì nền tảng truyền thông nào. Bằng công nghệ mới, chi phí sản xuất giảm xuống và độ hiệu quả sẽ tăng lên.
Công nghệ vẫn còn có giới hạn. Ta có thể thấy trong video, phát thanh viên ảo chưa thể hiện được nhiều cảm xúc, giọng nói rõ ràng là được tạo ra bằng công nghệ. Nhưng với machine learning đang học được ngày một nhiều, công nghệ sẽ sớm chạm tới mức “thực tế”.