Nếu bạn là người yêu thích Apple Books, thì có một tính năng mới có thể khiến bạn thích thú hoặc kinh hoàng: Apple đã công bố khởi động một dự án tường thuật kỹ thuật số mới để tạo sách nói bằng AI. Do thị trường sách nói đang bùng nổ về mức độ phổ biến nhưng chỉ một phần nhỏ sách thực sự được chuyển đổi thành âm thanh, nên công nghệ mới của Apple cung cấp một cách để loại bỏ “chi phí và độ phức tạp” liên quan đến việc tạo bản ghi âm giọng nói của con người.
Các kết quả công khai đầu tiên của dự án đã có trên Apple Book Store. Nếu bạn mở ứng dụng Sách và tìm kiếm “Tường thuật AI”, bạn sẽ tìm thấy hàng tá tựa sách tiểu thuyết và lãng mạn được gắn nhãn là “Tường thuật bởi Apple Books”. Nhấn vào nhãn đó và bạn sẽ được thông báo liệu cuốn sách sẽ được đọc cho bạn bởi “Madison”, giọng nữ cao kỹ thuật số được sử dụng cho các thể loại này hay “Jackson”, giọng nam trung tương đương. Cả hai đều được cho là dựa trên một người kể chuyện thực sự, nhưng âm thanh đã được tạo bằng AI.
Trên trang web của Apple, bạn cũng có thể nghe các mẫu từ “Helena” và “Mitchell”, những giọng nói kỹ thuật số cho thể loại phi hư cấu và tự phát triển, nhưng chúng chưa được sử dụng cho bất kỳ sách nói công khai nào.
Apple đảm bảo với chúng tôi rằng giọng nói là kết quả của “công nghệ tổng hợp giọng nói tiên tiến với công việc quan trọng của các nhóm nhà ngôn ngữ học, chuyên gia kiểm soát chất lượng và kỹ sư âm thanh”, nhưng rõ ràng chất lượng hấp dẫn nhất của Madison và Jackson là hiệu quả của chúng. Việc ghi lại lời tường thuật của con người mất vài tuần, có khả năng tiêu tốn hàng nghìn đô la và cần có sự hiện diện của một nghệ sĩ lồng tiếng hoặc người nổi tiếng có kinh nghiệm (hoặc, ngày càng nhiều, tác giả), đó là lý do tại sao rất nhiều cuốn sách vẫn chỉ có văn bản. Cách tiếp cận AI làm tăng đáng kể hiệu quả chi phí của quy trình.
Nhưng nó có thực sự hiệu quả? Tôi đã nghe vài trang đầu tiên của Shelter From The Storm của Kristen Ethridge, và bị ấn tượng bởi âm thanh vô nhân đạo của nó. “Madison” không hoàn toàn nghe như một người và không thể điều chỉnh cách nói của cô ấy một cách thuyết phục với nội dung của văn bản. Cũng không có chất lượng cảm xúc vô hình của con người giúp người nghe tiếp tục tham gia. Tôi liên tục trôi đi, lọc âm thanh dưới dạng tiếng ồn xung quanh.
Công nghệ này chắc chắn đang được cải thiện và có thể thay thế diễn viên lồng tiếng con người trong vòng vài năm, nhưng vẫn chưa có. Rõ ràng là việc tự động hóa quy trình tường thuật sẽ tiết kiệm được rất nhiều tiền trong thời gian dài sản xuất nhanh những cuốn sách có lượng độc giả thấp, nhưng cũng rõ ràng là tại sao Apple lại thận trọng trong việc triển khai điều này cho những tựa sách nổi tiếng hơn và về việc làm nổi bật di chuyển nói chung. Theo những gì chúng tôi biết, chưa có một thông cáo báo chí tiêu chuẩn nào cho dự án và Apple dường như đang hướng sự công khai của nó tới các tác giả và nhà xuất bản hơn là các trang web truyền thông hoặc công chúng nói chung.
Và những tác giả đó có thể không quan tâm đến ý tưởng này. Như Guardian lưu ý, đó là một chiến lược phải đối mặt với những lời chỉ trích từ nhiều bên liên quan ngoài độc giả. Mỗi nhà sản xuất sách nói và một tác nhân văn học được tờ báo liên hệ đều nói về giá trị do tường thuật chất lượng cao mang lại và bày tỏ mức độ hoài nghi về dự án, nhưng các tổ chức chính trị hoặc pháp lý có thể có những nghi ngờ nghiêm trọng hơn. Với dịch vụ mới này, Apple dường như đang chuyển sang sáng tạo thay vì chỉ bán sách nói, điều này sẽ mở ra một mặt trận mới cho các cáo buộc về hành vi phản cạnh tranh.