Ngày 18/1, Samsung công bố dòng điện thoại Galaxy S24 với các tính năng AI tạo sinh (GenAI), trong đó có khả năng dịch thuật trực tiếp bằng trí tuệ nhân tạo, tại sự kiện Unpacked 2024 ở San Jose (Mỹ). Cách đó nửa vòng Trái Đất, ở Hà Nội, Trần Tuấn Minh, Trưởng nhóm nghiên cứu ngôn ngữ AI tại Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam (SRV), cùng cộng sự cũng hồi hộp theo dõi sự kiện, mong chờ cột mốc được công bố.
"Mọi người như vỡ òa khi danh sách 13 ngôn ngữ đầu tiên được hỗ trợ trong tính năng dịch bằng GenAI trên Galaxy S24 được công bố, trong đó có tiếng Việt", Tuấn Minh kể. "Điều này giúp người dùng Việt tương tác với công nghệ mới nhất bằng chính tiếng mẹ đẻ, tương tự các ngôn ngữ phổ biến hàng đầu trên thế giới".
Cuộc chạy đua
Nhóm của Trần Tuấn Minh bắt đầu nhận dự án phát triển tiếng Việt cho Galaxy AI từ tháng 10/2023, trong khi Galaxy S24 được công bố tháng 1, tức nhóm chỉ có bốn tháng để hoàn thành. Trong khi đó, thông thường cần ít nhất từ 6 tháng đến một năm để phát triển AI ngôn ngữ lớn
Đội ngũ dự án gồm 30 kỹ sư phát triển trực tiếp và 45 người kiểm thử, đều là người Việt. Họ liên tục bay qua lại giữa Việt Nam và các trung tâm R&D của Hàn Quốc, Ấn Độ để trao đổi, xây dựng bộ dữ liệu kèm văn bản tương ứng để "dạy" AI nói, hiểu tiếng Việt.
Trên Galaxy AI, tiếng Việt được phát triển dựa trên ba trụ cột chính: nhận diện giọng nói để chuyển sang văn bản, dịch sang ngôn ngữ khác, và chuyển từ văn bản thành giọng nói. Ví dụ, với tính năng dịch trực tiếp Live Translate khi gọi điện thoại, người gọi sẽ nói tiếng mẹ đẻ, sau đó Live Translate dịch sang ngôn ngữ của người nghe và nói lại bằng ngôn ngữ đó. Galaxy AI đảm bảo cho quá trình dịch gần như diễn ra lập tức, giúp cuộc hội thoại không có độ trễ.
Thách thức lớn nhất là dữ liệu "dạy" AI bằng tiếng Việt rất hạn chế so với tiếng Anh hay những ngôn ngữ phổ biến khác. Chất lượng đầu vào cũng không cao do trí tuệ nhân tạo là lĩnh vực mới ở Việt Nam. Việc ít dữ liệu thô và chất lượng thấp ảnh hưởng trực tiếp đến độ chính xác của đầu ra AI. Do đó, trước khi bắt đầu, cả nhóm đã ngồi lại phân tích dữ liệu hiện có, xác định đâu là "vùng lõm" để cải thiện.
"Giải quyết xong phần đầu vào cho mô-đun dịch, chúng tôi tiếp tục phát hiện một thách thức khác là tính phương ngữ, đặc trưng mỗi vùng miền rất khác nhau", Tuấn Minh nói.
Phát sinh tiếp theo là tiếng Việt trong đời sống đang có rất nhiều thay đổi so với kho dữ liệu đang có. Ví dụ, những từ lóng của Gen Z, từ mới của người sử dụng Internet hay tên phim, người nổi tiếng, sự kiện quốc tế... Do đó, đội ngũ R&D phải liên tục cập nhật cho AI.
Cùng lúc, các kỹ sư kiểm thử phải ra môi trường thực tế như trong quán cà phê, trên xe buýt, phố đi bộ... để đánh giá khả năng hoạt động ngoài đời của AI trong nhiều điều kiện khác nhau.
Một sản phẩm mới đi từ phòng nghiên cứu đến người dùng cuối luôn trải qua công đoạn quan trọng là kiểm thử. "SRV là trung tâm lớn nhất ngoài Hàn Quốc chịu trách nhiệm kiểm thử thiết bị mạng, nhưng chúng tôi phải đối mặt thử thách lớn là kỹ sư kiểm thử khi đó không biết nhiều về AI", Tuấn Minh nhớ lại. "Sau khi được kỹ sư Hàn Quốc bàn giao công nghệ và kinh nghiệm, mọi người vừa học vừa làm, chạy đua với thời gian".
Ông Choi Joo Ho, Tổng giám đốc Tổ hợp Samsung Việt Nam nhận định những tính năng mới trên Galaxy AI có sự đóng góp rất lớn của kỹ sư Việt, từ nỗ lực đưa tiếng Việt trở thành một trong những ngôn ngữ đầu tiên đến việc nghiên cứu, bàn giao công nghệ mới cho kỹ sư trong khu vực.
Nguồn VNExpress