Từ một công nghệ mới mẻ, trí tuệ nhân tạo (AI) ngày càng trở nên quen thuộc. Tại Việt Nam, công nghệ AI đã phát triển mạnh và được ứng dụng trong nhiều lĩnh vực như đô thị thông minh, y tế, bảo hiểm, nông nghiệp thông minh, công nghệ môi trường...
Cùng với sự phát triển của thị trường AI trong nước, nhiều doanh nghiệp nước ngoài đã xây dựng các trung tâm nghiên cứu, phát triển AI tại Việt Nam, thu hút nhiều chuyên gia hàng đầu thế giới đến làm việc.
Sự xuất hiện của các công ty, các chuyên gia công nghệ đến từ khắp nơi trên thế giới sẽ là nền tảng quan trọng thúc đẩy nghiên cứu, ứng dụng AI tại Việt Nam, góp phần nâng cao năng suất lao động, thúc đẩy năng lực cạnh tranh và giải các bài toán lớn của xã hội.
VietNamNet đã có cuộc trao đổi và trò chuyện với ông Lee Hyun-sung – TGĐ Xinapse Việt Nam. Đây là công ty top đầu tại Hàn Quốc về phát triển, ứng dụng trí tuệ nhân tạo nhằm cải thiện khả năng giao tiếp. Vị chuyên gia đã chia sẻ nhiều góc nhìn về thị trường AI Việt Nam, đồng thời hé lộ về những dịch vụ chưa từng xuất hiện sẽ có mặt tại Việt Nam nhờ công nghệ tái tạo giọng nói ảo.
Chào ông Lee Hyun-sung. Với nhiều người Việt, Xinapse vẫn là cái tên còn khá xa lạ. Trước hết, ông có thể giới thiệu về Xinapse được không?
Xinapse là công ty khởi nghiệp chuyên về các giải pháp tạo sinh dựa trên AI (Generative AI-based) được thành lập vào năm 2017 tại Hàn Quốc. Thông qua AI tạo sinh, Xinapse phát triển công nghệ riêng giúp tạo ra văn bản, hình ảnh và video gốc dựa trên các thông tin cơ bản của một người.
Xinapse đã đăng ký 22 bằng sáng chế về việc sử dụng giọng nói do AI tạo ra trên nhiều phương tiện, bao gồm sách nói, quảng cáo, vũ trụ ảo metaverse và các lĩnh vực liên quan. Chúng tôi là công ty đầu tiên thực hiện thương mại hóa dịch vụ giọng nói ảo, giọng nói tổng hợp AI ra thị trường.
Sản phẩm chủ đạo của Xinapse là các máy tổng hợp hội thoại để tạo chatbot, máy tổng hợp giọng nói để tạo giọng nói ảo, ghi nhãn dữ liệu, nền tảng di động, sách nói, các dịch vụ sản xuất và phân phối video giọng nói ảo.
Vì sao Xinapse quyết định mở văn phòng tại Việt Nam và tuyển dụng các chuyên gia AI người Việt?
Xinapse ra mắt Việt Nam vào ngày 29/11 và có kế hoạch mở rộng thị trường tại đây thông qua việc thành lập liên doanh. Chúng tôi đang tìm cách kết hợp những công cụ AI khác nhau để tạo ra các trường hợp sử dụng tại Việt Nam. Công ty đặt mục tiêu phát triển và mở rộng dữ liệu giọng nói tiếng Việt của các vùng miền, đồng thời mang lại nhiều cơ hội việc làm.
Việt Nam được biết đến là trung tâm về gia công phần mềm CNTT. Do đó, chúng tôi có kế hoạch đầu tư hình thành một đội ngũ nhân lực trẻ tại Việt Nam; tuyển dụng những tài năng trẻ để triển khai hoạt động kinh doanh, ghi/dán nhãn dữ liệu.
Chúng tôi cũng có thể hợp tác với các công ty phát triển công nghệ chuyển văn bản thành giọng nói của Việt Nam để tạo ra một thị trường AI rộng lớn hơn bằng cách ứng dụng công nghệ của nhau.
Máy nói của Xinapse mới hỗ trợ tiếng Hàn và tiếng Anh, nguyên nhân đặc biệt gì khiến Tiếng Việt được lựa chọn là ngôn ngữ thứ 3, thưa ông?
Xinapse có kế hoạch thu thập và gắn nhãn dữ liệu giọng nói tiếng Việt để đưa vào máy nói AI. Bằng cách này, người dùng tại Việt Nam có thể tạo ra giọng nói ảo tiếng Việt chất lượng cao, không phụ thuộc vào khả năng nói tiếng Việt của họ.
Chúng tôi chọn tiếng Việt là ngôn ngữ thứ ba cho máy nói vì nhận thấy mức độ tăng trưởng ấn tượng của thị trường giáo dục tư thục tại Việt Nam. Chúng tôi có thể tạo ra sách nói với giọng đọc của cha mẹ cho các em nhỏ bằng tiếng Việt, tiếng Hàn hoặc tiếng Anh ngay cả khi họ không biết ngoại ngữ.
Không chỉ phục vụ thị trường Việt Nam, sản phẩm này còn có thể cung cấp cho những ai có nhu cầu học tiếng Việt tại Hàn Quốc và các nước nói tiếng Anh.
So với tiếng Anh và tiếng Hàn, việc dạy cho AI biết tiếng Việt có khó không? Xin ông cho biết chi phí cho việc dạy tiếng Việt ra sao và tốn bao nhiêu để đào tạo AI biết tiếng Việt?
Để giúp AI học tiếng Việt, thu thập, xây dựng dữ liệu giọng nói là công việc quan trọng và phải làm đầu tiên. Những công ty phát triển AI như chúng tôi phải bỏ ra số tiền đầu tư ban đầu rất lớn để xây dựng phòng thu âm, thiết bị ghi âm, chi phí nhân lực cho các nhà cung cấp dữ liệu giọng nói, đầu tư máy chủ, nhân công xử lý dữ liệu…
Ở Việt Nam, việc biến văn bản thành giọng nói không phải là điều mới mẻ. Google và một số startup nội đang làm khá tốt điều đó. Vậy ông làm sao để "lấy trứng chọi đá"?
Google và các công ty khác có thể được biết đến rộng rãi trong việc triển khai công nghệ chuyển văn bản thành giọng nói. Điểm khác biệt là họ tập trung vào các giải pháp và mô hình phổ biến, trong khi chúng tôi vừa cung cấp dịch vụ phổ biến, vừa cá nhân hóa chúng theo yêu cầu của người dùng.
Xinapse đang phát triển công nghệ có thể tạo ra đoạn hội thoại từ người đã khuất hoặc người ảo nhờ vào công nghệ giọng nói ảo AI. Nếu bạn có video hoặc file ghi âm của người đã khuất, chúng tôi có thể trích xuất giọng nói, tổng hợp lại và cho AI học. Sau đó, tạo ra một giọng nói ảo có thể tái tạo giọng nói của người đã khuất.
Từ công nghệ này, có thể phát triển các dịch vụ gửi tin nhắn thoại của người đã khuất cho người thân trong gia đình hàng năm hay gửi tin nhắn chúc mừng đám cưới cho con cái họ.
Bên cạnh đó, việc sản xuất các nội dung như hát, đọc, phát biểu chúc mừng với giọng của những người nổi tiếng đã qua đời cũng có nhiều tiềm năng phát triển.
Xin cảm ơn ông!