Trong khuôn khổ Ngày hội Trí tuệ nhân tạo 2026 (AI Day 2026) diễn ra tại hội trường chính Đại học Bách khoa Hà Nội hôm 5/4, Trung tâm Đổi mới sáng tạo Quốc gia (NIC), tập đoàn Meta và tổ chức AI for Vietnam đã chính thức khởi xướng dự án ViGen. Dự án này nhằm phát triển bộ dữ liệu và khung đánh giá quy mô lớn, giúp đo lường mức độ hiểu tiếng Việt của các mô hình AI theo ngữ cảnh thực tế, từ đó đưa bản sắc Việt vào trí tuệ nhân tạo và làm cho AI thực sự hữu ích với người Việt.

ViGen là gì: Nền tảng đánh giá năng lực AI tiếng Việt toàn diện

Dự án ViGen ra đời với mục tiêu trở thành "thước đo" chuẩn mực cho khả năng hiểu và xử lý tiếng Việt của các mô hình trí tuệ nhân tạo. Trong bối cảnh AI ngày càng phát triển, câu hỏi "AI đã thực sự hiểu tiếng Việt hay chưa?" trở nên cấp thiết. Mặc dù các mô hình AI có thể đưa ra câu trả lời hợp lý cho một câu tục ngữ, nhưng chúng lại bộc lộ nhiều hạn chế khi đối mặt với các yêu cầu phức tạp hơn như soạn hợp đồng theo luật dân sự Việt Nam, xử lý phương ngữ Huế, hay hiểu ý nghĩa sâu sắc của lời chúc Tết.

ViGen không phải là một mô hình AI, mà là một hệ sinh thái toàn diện được thiết kế để đánh giá và xếp hạng năng lực AI tiếng Việt. Nền tảng này được kỳ vọng sẽ thúc đẩy hoạt động nghiên cứu và phát triển, đảm bảo rằng các công cụ AI không chỉ đơn thuần dịch thuật mà còn thực sự nắm bắt được chiều sâu và bản sắc của ngôn ngữ, văn hóa Việt Nam.

ViGen là dự án tiên phong của NIC, Meta và AI for Vietnam, tạo ra bộ dữ liệu và khung đánh giá chuẩn mực để đo lường khả năng hiểu tiếng Việt của AI, giải quyết thách thức về ngữ cảnh và văn hóa.

Thách thức của tiếng Việt đối với các mô hình AI hiện tại

Tiếng Việt là một ngôn ngữ giàu sắc thái và phức tạp, đặt ra nhiều thách thức đáng kể cho các mô hình AI. Sự khác biệt về thanh điệu là một ví dụ điển hình; cùng một âm tiết nhưng khác dấu có thể mang ý nghĩa hoàn toàn khác nhau. Điều này đòi hỏi AI phải có khả năng phân tích ngữ cảnh cực kỳ tinh vi để tránh hiểu lầm.

Bên cạnh đó, hệ thống đại từ xưng hô trong tiếng Việt cũng vô cùng linh hoạt, thay đổi tùy thuộc vào tuổi tác, vai vế và ngữ cảnh giao tiếp. Một cuộc trò chuyện có thể chuyển đổi đại từ xưng hô liên tục, điều mà các mô hình AI thường gặp khó khăn trong việc nắm bắt. Các phương ngữ đa dạng từ Hà Giang đến mũi Cà Mau, mỗi vùng miền mang một nét đặc trưng riêng, cũng là một rào cản lớn.

Đặc biệt, chiều sâu văn hóa Việt Nam, bao gồm phong tục tập quán, ẩn dụ, lịch sử và cách người Việt bày tỏ cảm xúc, là những yếu tố mà các mô hình AI khó có thể đạt tới nếu chỉ học bằng cách dịch từ các ngôn ngữ khác (như tiếng Anh). Việc thiếu đi sự hiểu biết sâu sắc về văn hóa khiến AI khó lòng tạo ra những phản hồi tự nhiên, chính xác và phù hợp với người Việt.

Cách ViGen xây dựng "thước đo" chuẩn mực cho AI

Để giải quyết những thách thức trên, dự án ViGen vận hành theo hai hướng chính, tạo nên một hệ thống đánh giá toàn diện và minh bạch:

  1. Xây dựng bộ dữ liệu tiếng Việt mã nguồn mở: ViGen tập trung thu thập và tuyển chọn dữ liệu tiếng Việt quy mô lớn, được thiết kế riêng để huấn luyện và đánh giá các mô hình ngôn ngữ lớn. Bộ dữ liệu này chú trọng vào sự đa dạng về ngôn ngữ, tính đúng đắn về văn hóa và tuân thủ các chuẩn mực đạo đức. Đây là nền tảng cốt lõi để AI có thể học hỏi và hiểu tiếng Việt một cách sâu sắc hơn, vượt ra ngoài khả năng dịch thuật đơn thuần.

  2. Phát triển các khung đánh giá chuyên biệt: Dự án đã phát triển 6 bộ khung đánh giá với hơn 40.000 mẫu kiểm thử, được thiết kế để đo lường độ thành thạo tiếng Việt của mô hình AI trên nhiều khía cạnh khác nhau. Các khung đánh giá này bao gồm:

    • Kiến thức tổng quát (Vi-MMLU): Đánh giá hiểu biết chung về các lĩnh vực.
    • Khả năng lập trình (Vi-HumanEval): Kiểm tra khả năng viết và hiểu mã lệnh.
    • Tình huống hội thoại (SEA-HELM-VN): Đo lường sự phù hợp trong giao tiếp đối thoại.
    • Giao tiếp hỏi đáp (Vi-MT-Bench): Đánh giá khả năng trả lời câu hỏi một cách chính xác và tự nhiên.
    • Năng lực sư phạm (DeepEduBench): Kiểm tra khả năng hỗ trợ và tương tác trong giáo dục.
    • Suy luận thường thức (Vi-HellaSwag): Đánh giá khả năng suy luận dựa trên kiến thức thông thường.

    Những khung đánh giá này đảm bảo rằng các mô hình AI được kiểm tra trên một phổ rộng các kỹ năng, từ kiến thức hàn lâm đến khả năng giao tiếp thực tế, phản ánh đúng năng lực của chúng trong môi trường tiếng Việt.

ViGen Arena: Sức mạnh cộng đồng trong đánh giá AI thực tế

Ngoài việc xây dựng dữ liệu và khung đánh giá, dự án ViGen còn vận hành một hệ thống xếp hạng mở mang tên ViGen Arena. Nền tảng này cho phép cộng đồng người dùng Việt Nam, bao gồm cả những người đang sinh sống trong và ngoài nước, thuộc đủ ngành nghề, độ tuổi và xuất thân, trực tiếp đánh giá các mô hình AI trong các trường hợp sử dụng thực tế. Với sức mạnh cộng hưởng từ cộng đồng, ViGen Arena được định vị là "thước đo" toàn diện và sống động, phản ánh sự phong phú và đa dạng của tiếng Việt trong thực tiễn.

Phương pháp tiếp cận này thể hiện đúng tinh thần mà ông Võ Xuân Hoài, Phó Giám đốc NIC, đã nhấn mạnh:

"Cần xây dựng hệ sinh thái AI mở, vận hành trên nền tảng liên kết đa chủ thể - nơi Nhà nước kiến tạo chính sách, doanh nghiệp tiên phong ứng dụng, các cơ sở nghiên cứu, giáo dục cung cấp tri thức và cộng đồng công nghệ thúc đẩy đổi mới sáng tạo."

Sự tham gia của cộng đồng không chỉ giúp thu thập phản hồi đa dạng mà còn tạo ra một cơ chế kiểm định độc lập, khách quan, giúp các nhà phát triển AI nhận diện và khắc phục những điểm yếu của mô hình một cách hiệu quả hơn.

Tầm quan trọng của ViGen đối với hệ sinh thái AI Việt Nam

ViGen mang lại ý nghĩa to lớn cho sự phát triển của trí tuệ nhân tạo tại Việt Nam. Kết quả đánh giá từ ViGen được công khai trên nền tảng của AI for Vietnam, cho phép bất kỳ ai cũng có thể xem các mô hình từ OpenAI, Google, Meta, Anthropic và các công ty khác hoạt động như thế nào qua các bài kiểm tra được thiết kế riêng cho tiếng Việt, thay vì chỉ dựa vào các bản dịch từ tiếng Anh.

Sự minh bạch này tạo ra trách nhiệm giải trình cho các nhà phát triển mô hình, khuyến khích họ đầu tư nhiều hơn vào việc cải thiện khả năng hiểu tiếng Việt của AI. Đồng thời, nó cung cấp cho doanh nghiệp, nhà giáo dục và nhà hoạch định chính sách Việt Nam những thông tin đáng tin cậy để lựa chọn công cụ AI nào thực sự phù hợp với nhu cầu và ngữ cảnh văn hóa của Việt Nam. Điều này giúp tối ưu hóa việc ứng dụng AI, đảm bảo rằng công nghệ này thực sự phục vụ và nâng cao chất lượng cuộc sống cho người Việt.

"Việt Nam đang dẫn đầu tỷ lệ ứng dụng AI ấn tượng, ghi nhận 93% doanh nghiệp vừa và nhỏ đã tích hợp AI vào hoạt động vận hành. Tuy nhiên, số liệu này chưa phản ánh hết bức tranh thực tế về mức độ hiệu quả và phù hợp của AI với bản sắc Việt."
Bà Thảo GriffithsGiám đốc Chính sách công Meta phụ trách thị trường Việt Nam, Lào, Campuchia và Myanmar
93%Doanh nghiệp vừa và nhỏ tại Việt Nam đã tích hợp AI vào hoạt động vận hành.

Bà Thảo Griffiths cũng chỉ ra những tác động thực sự của AI trong thực tế, từ việc một giáo viên ở Hà Nội soạn giáo án với sự hỗ trợ của AI, chủ doanh nghiệp nhỏ tại TP HCM tiếp cận khách hàng mới, đến một lập trình viên phát triển sản phẩm dựa trên bộ dữ liệu tiếng Việt quy mô lớn qua dự án ViGen. Những ví dụ này minh chứng cho tiềm năng to lớn của AI khi được phát triển và đánh giá đúng cách.

Mô hình hợp tác đa chủ thể: Nền tảng vững chắc của ViGen

Thành công của ViGen không chỉ nằm ở công nghệ mà còn ở mô hình hợp tác độc đáo và mạnh mẽ. Trung tâm Đổi mới sáng tạo Quốc gia (NIC), thuộc Bộ Kế hoạch và Đầu tư, đóng vai trò điều phối sáng kiến, đảm bảo dự án phù hợp với chiến lược AI quốc gia. Tập đoàn Meta đóng góp kinh nghiệm kỹ thuật về dữ liệu quy mô lớn và phương pháp mã nguồn mở, mang lại nền tảng vững chắc cho việc phát triển.

Ngoài ra, các đối