Mô hình AI tiếng Việt 120 tỷ tham số, hiệu suất thuộc nhóm dẫn đầu cùng quy mô

Thông qua các bài kiểm tra, mô hình ngôn ngữ lớn VT-Super-120B-A12B do Viettel AI nghiên cứu ghi nhận hiệu suất nằm trong nhóm dẫn đầu về độ chính xác so với các mô hình có cùng quy mô....

Ảnh minh hoạ: Viettel AI.
Ảnh minh hoạ: Viettel AI.

VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super với quy mô 120 tỷ tham số, do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện và tối ưu cho tiếng Việt.

Khả năng xử lý ngữ cảnh dài của kiến trúc NVIDIA Nemotron cho phép mô hình duy trì mạch thông tin xuyên suốt giữa nhiều tài liệu, quy trình và hội thoại phức tạp trong cùng một tác vụ.

Đáng chú ý, VT-Super-120B-A12B tăng cường năng lực xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng quên kiến thức cũ (catastrophic forgetting) thường gặp trong quá trình huấn luyện và tinh chỉnh mô hình AI. 

Đây là năng lực đặc biệt quan trọng với các bài toán vận hành đặc thù tại Việt Nam, nơi nhiều quy định và quy trình có thể thay đổi tùy theo loại hồ sơ, đối tượng liên quan hoặc bối cảnh thực thi cụ thể. 

Việc sở hữu một mô hình lõi có khả năng ghi nhớ và thích ứng linh hoạt với dữ liệu thực tế tạo tiền đề để Viettel AI tinh chỉnh LLM đạt độ chính xác cao, giải quyết triệt để việc tối ưu hóa ứng dụng AI cho từng tổ chức, doanh nghiệp Việt Nam.

Bên cạnh việc kế thừa năng lực từ kiến trúc NVIDIA Nemotron 3 Super, Viettel AI cũng xây dựng quy trình huấn luyện LLM dựa trên các nguồn dữ liệu mang tính bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và hệ thống văn bản chuyên ngành tại Việt Nam.

Quá trình này bao gồm nhiều giai đoạn huấn luyện; trong đó, giai đoạn tiếp tục tiền huấn luyện (continued pre-training) mở rộng năng lực ngôn ngữ và tri thức tiếng Việt trên kho dữ liệu quy mô lớn. Tiếp theo, mô hình được tinh chỉnh có giám sát (supervised fine-tuning) nhằm cải thiện khả năng suy luận, sau đó được học tăng cường (reinforcement learning) để nâng cao độ chính xác trong phản hồi và khả năng xử lý nghiệp vụ.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định: “AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ có lợi thế tạo ra những hệ thống phục vụ đúng nhu cầu phát triển của mình. Với Viettel, làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền có khả năng đồng hành thực sự cùng các tổ chức, doanh nghiệp Việt Nam”.

Trong khi đó, Shilpa Kolhatkar, Giám đốc AI Nations của NVIDIA cho rằng: “Thông qua việc thúc đẩy phát triển AI chủ quyền và AI chuyên biệt theo từng lĩnh vực, Viettel đang góp phần phổ cập khả năng tiếp cận trí tuệ nhân tạo trên quy mô toàn xã hội, đồng thời chuyển hóa ngôn ngữ và dữ liệu bản địa thành những giá trị ứng dụng thực tiễn cho cơ quan chính phủ và doanh nghiệp”. 

Trên nền tảng mô hình này, Viettel AI đang phát triển nền tảng AI Agent dành cho người Việt với khả năng tự thực hiện chuỗi tác vụ trong cùng một không gian làm việc. 

Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên, được kỳ vọng sẽ sở hữu khả năng hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đề xuất giải pháp xử lý theo bài toán cụ thể của người dùng, với chất lượng được nâng cao đáng kể so với các phiên bản trước đây. 

Từ hành chính công, chăm sóc khách hàng đến vận hành doanh nghiệp và phân tích dữ liệu, VT-Super-120B-A12B được định hướng trở thành công nghệ lõi cho các hệ thống AI hiểu và phục vụ đúng nhu cầu thực tế của tổ chức, doanh nghiệp Việt Nam.

Bí thư Thành ủy Hải Phòng: Thành phố đủ điều kiện thí điểm mô hình phát triển mới

Chuyển đổi sang mô hình tăng trưởng mới, lấy phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số làm động lực chính là quan điểm nhất quán hiện nay của Đảng và Nhà nước ta. Với đặc trưng là trung tâm cảng biển, công nghiệp... Hải Phòng có đầy đủ các điều kiện để trở thành địa phương đi đầu trong thí điểm các mô hình phát triển mới.

AI thách thức đế chế gia công dịch vụ của Ấn Độ và Philippines

Hàng triệu lao động tại hai trung tâm cung cấp dịch vụ thuê ngoài lớn nhất thế giới đang bước vào cuộc chạy đua thích ứng với AI. Trong khi nhiều công việc đã bắt đầu bị tự động hóa thay thế, các chuyên gia cho rằng tác động thực sự của AI đối với ngành gia công dịch vụ toàn cầu có thể chỉ mới bắt đầu…

Bức tranh kinh tế của Việt Nam trong tháng 5 và 5 tháng đầu năm 2026 ghi nhận nhiều chỉ số tăng trưởng tích cực. Điển hình như chỉ số sản xuất công nghiệp (IIP) tháng 5 tăng 8,8% so với cùng kỳ; tổng mức bán lẻ hàng hóa và doanh thu dịch vụ tiêu dùng tăng 11,8%....

Bí thư Thành ủy Hải Phòng: Thành phố đủ điều kiện thí điểm mô hình phát triển mới

Chuyển đổi sang mô hình tăng trưởng mới, lấy phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số làm động lực chính là quan điểm nhất quán hiện nay của Đảng và Nhà nước ta. Với đặc trưng là trung tâm cảng biển, công nghiệp... Hải Phòng có đầy đủ các điều kiện để trở thành địa phương đi đầu trong thí điểm các mô hình phát triển mới.

Bí thư Thành ủy Hải Phòng: Thành phố đủ điều kiện thí điểm mô hình phát triển mới

Chuyển đổi sang mô hình tăng trưởng mới, lấy phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số làm động lực chính là quan điểm nhất quán hiện nay của Đảng và Nhà nước ta. Với đặc trưng là trung tâm cảng biển, công nghiệp... Hải Phòng có đầy đủ các điều kiện để trở thành địa phương đi đầu trong thí điểm các mô hình phát triển mới.

Đảng Cộng sản Việt Nam - Đại hội XIV

Đảng Cộng sản Việt Nam - Đại hội XIV

Với phương châm Đoàn kết - Dân chủ - Kỷ cương - Đột phá - Phát triển, Đại hội đại biểu toàn quốc lần thứ XIV của Đảng xác định tư duy, tầm nhìn, những quyết sách chiến lược để chúng ta vững bước tiến...

VnEconomy Interactive

VnEconomy Interactive

Interactive là một sản phẩm báo chí mới của VnEconomy vừa được ra mắt bạn đọc từ đầu tháng 3/2023 đã gây ấn tượng mạnh với độc giả bởi sự mới lạ, độc đáo. Đây cũng là sản phẩm độc quyền chỉ có trên...