Công nghệ giả lập giọng nói bằng AI (trí thông minh nhân tạo) không còn là điều xa lạ với người Việt. Song, dùng AI để biến giọng nói thành giọng hát thì chưa phổ biến. Gần đây, cư dân mạng xôn xao trước hình ảnh của một ca sĩ ảo tên Ann, phát hành MV đầu tay Làm sao nói thương anh.
Theo đơn vị sáng lập, Ann là sự kết hợp giữa thuật toán AI và các âm thanh thật. Nhờ đó, nữ ca sĩ có chất giọng và âm sắc riêng biệt. Nhưng thực tế cho thấy, kết quả không quá xuất sắc để khiến khán giả phải trầm trồ.
Màu sắc của Thùy Chi
Ngay từ câu đầu tiên, người nghe dễ dàng nhận ra âm sắc của Ann khá giống với Thùy Chi. Chất giọng mỏng, nhẹ và có một chút bay bổng. Song, độ giống chỉ khoảng 80% vì trong giọng Ann còn có độ chói, gợi nhớ các ca sĩ teen pop một thời như Bảo Thy, Khổng Tú Quỳnh hay Trương Quỳnh Anh. Hơn nữa, đây là giọng nữ trung (mezzo-soprano) chứ không phải nữ cao (soprano).
Ê-kíp cho biết giọng của Ann được giả lập thành một nữ ca sĩ 18 tuổi. Nhưng khi nghe cô hát, cảm giác như đang nghe một thí sinh trong chương trình Ca sĩ mặt nạ, cố gắng làm giọng khác đi để không ai nhận ra.
Ann là ca sĩ ảo đầu tiên tại Việt Nam vừa phát hành MV.
Cách AI xử lý ca khúc cũng đơn giản. Đôi chỗ, ca sĩ thiếu sự luyến láy nhất định để tăng sự đa dạng cho bài. Quả thực, nếu chỉ nghe giọng hát, khó có thể nhận ra đây là sản phẩm của công nghệ. Nhưng chất giọng chưa thực sự cảm xúc, chỉ dừng ở mức ca sĩ mạng, phụ thuộc nhiều vào kỹ thuật phòng thu để lọc đi những tạp âm, che đi khuyết điểm.
Sáng tác ca khúc là Kim Ngân - một cây viết không quá nổi tiếng trong làng nhạc. Bài hát được phối theo phong cách pop ballad với piano và guitar chủ đạo. Hướng đi này không mới nhưng phù hợp với thị hiếu khán giả. Nội dung ca khúc cũng dễ nghe, dễ cảm. Ca từ đặt góc nhìn của một cô gái đem lòng yêu chàng trai nhưng không dám thổ lộ.
"Tình yêu cứ thế lớn cùng những ước ao / mà sao vẫn chẳng dám thành câu / rằng em sẽ mãi ở phía sau / chỉ vì em chẳng nói ra được đâu", ca sĩ hát.
Biểu cảm còn hạn chế
Bên cạnh giọng hát, tạo hình của Ann cũng là điểm gây tranh cãi. Trong MV, ca sĩ xuất hiện với mái tóc búp bê cắt ngắn. Gương mặt tròn trĩnh, mắt to, mũi cao, đúng chuẩn khao khát của nhiều cô gái. Tuy nhiên, cô có dáng người hơi nhỏ và chiều cao không quá lý tưởng. Nét Việt cũng khá ít mà trông còn giống búp bê Hàn Quốc hay Trung Quốc.
Ngoại hình xinh xắn, dịu dàng của giọng ca ảo Ann.
Minh họa nội dung bài hát, phần lớn các cảnh quay trong MV tái hiện cảnh quay nhân vật đang chờ đợi tình yêu. Cô đứng ngắm hoàng hôn, ngồi cô độc trong phòng, ngâm mình trong bồn tắm. Ở giây phút nào, nhân vật cũng không thể ngừng nhớ về người yêu.
Thực tế, các cảnh quay trong MV đơn giản, hoàn toàn có thể thực hiện bằng người thật vật thật. Nhưng đồ họa vi tính vẫn ở mức chấp nhận được, ít nhiều tạo ra cảm giác lãng mạn. Cũng có phân đoạn sẽ khó thực hiện nếu là người đóng. Đơn cử như cảnh ca sĩ ngâm mình dưới đại dương và chơi đàn. Hay cảnh cô chạy trên mặt nước.
Bối cảnh không nhiều nhưng luân phiên thay đổi từ cánh đồng bồ công anh, chiều tà trên biển đến bầu trời đầy sao. Nhờ đó, MV không tạo cảm giác lặp lại gây nhàm chán.
Đáng tiếc, biểu cảm ca sĩ lại là điểm trừ. Trái ngược với bối cảnh đẹp, Ann chưa thể hiện được nhiều sắc thái trên gương mặt để tăng cảm xúc người nghe. Ca sĩ ảo trông còn vô hồn, khô cứng ở phần lớn cảnh quay. Chuyển động miệng hay mắt cũng chưa thực sự mượt mà, khiến nhân vật đôi khi bị đơ.
Tham vọng với AI
Thực tế, ca sĩ ảo không phải là mô hình mới lạ ở nhiều nước trên thế giới, đặc biệt là châu Á. Một số cái tên nổi bật như Hatsune Miku (Nhật Bản), Lạc Thiên Y (Trung Quốc), Adam (Hàn Quốc)… Đa số các giọng hát AI đều gây được sự chú ý với thị trường ở thời gian đầu, nhưng sau đó nhanh chóng chìm vào quên lãng.
Ê-kíp thực hiện Ann tại Việt Nam lại khá tự tin. Họ cho rằng ca sĩ ảo có nhiều lợi thế như: Trẻ mãi không già, không scandal, không dính vào bê bối đời tư hay lùm xùm với công ty quản lý. Ê-kíp tin rằng ban đầu Ann còn an toàn với pop ballad, nhưng sau này có thể định hình lại thành màu giọng rock-baby, thậm chí tham gia các hoạt động trình diễn, phim ảnh, thời trang và thương mại.
Ann chưa có nhiều nổi bật so với các ca sĩ ảo nước ngoài.
Dẫu vậy, họ lại quên mất một điều quan trọng với ca sĩ đó chính là khán giả và yếu tố thị trường. Ở Việt Nam hiện không thiếu các giọng ca trẻ, nhất là những người theo đuổi pop ballad lại càng nhiều. Do đó, sự xuất hiện của Ann sẽ khó tạo được ấn tượng mạnh nếu chỉ dừng lại ở mức độ như hiện tại.
Sau khi phát hành, Làm sao nói thương anh và Ann nhận được ý kiến trái ngược từ phía khán giả. Trên mạng xã hội, một số ý kiến thích thú với sự xuất hiện của ca sĩ ảo, hoàn toàn ủng hộ sự cố gắng của ê-kíp. Bên cạnh đó, nhiều ý kiến đánh giá thấp sản phẩm, cho rằng đồ họa chỉ dừng lại ở mức game Final Fantasy cuối thập niên 1990.
Giọng hát của Ann cũng chưa hay, thiếu cảm xúc nên khó thể chinh phục người nghe. Hiện MV chưa vượt quá con số 200 nghìn lượt xem. Đây là một con số kém ấn tượng, thậm chí nhiều khán giả vẫn chưa biết đến sự tồn tại của ca sĩ ảo.
Nhìn chung, Ann vẫn chưa phải là một giọng ca đặc sắc đáng nhớ. Hơn nữa, tạo ra một giọng hát ảo là điều chưa thực sự cần thiết với một thị trường sôi động như Việt Nam hiện tại. Để thực sự tạo tiếng vang, ê-kíp cần đầu tư sản phẩm nhiều hơn nữa, cả về phần âm thanh lẫn hình ảnh.