Dữ liệu xấu có thể “đầu độc” những mô hình AI mạnh nhất

H Hạ Chi

14:55, 16/10/2025

Chọn cỡ chữ

Nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” một mô hình, bất kể quy mô lớn ra sao...

Theo một nghiên cứu mới của Anthropic phối hợp cùng Viện An ninh AI Vương quốc Anh và Viện Alan Turing, chỉ cần 250 tài liệu xấu, một con số cực nhỏ so với hàng tỷ văn bản dùng để huấn luyện mô hình, cũng đủ khiến mô hình phản ứng sai lệch hoặc gây hại, khi gặp phải một từ khóa hoặc mẫu lệnh nhất định.

Khái niệm “ngộ độc dữ liệu” thực ra không mới. Các chuyên gia học máy đã cảnh báo nguy cơ này từ nhiều năm trước, nhất là với những mô hình nhỏ hoặc trong môi trường nghiên cứu.

Nhưng nghiên cứu mới đã cho thấy điều bất ngờ là kích thước mô hình hóa ra không tạo ra sự khác biệt. Các mô hình lớn nhất hiện nay, dù được huấn luyện bằng lượng dữ liệu khổng lồ, vẫn dễ bị ảnh hưởng như các mô hình nhỏ, nếu bị chèn cùng một lượng dữ liệu xấu.

Kết quả này đi ngược lại giả định phổ biến rằng quy mô càng lớn thì mô hình càng “miễn nhiễm” với kiểu tấn công này.

Trước đây, người ta tin rằng kẻ tấn công phải làm hỏng một tỷ lệ đáng kể nguồn dữ liệu huấn luyện – tương đương hàng triệu tài liệu với các mô hình lớn. Nhưng nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” mô hình, bất kể quy mô ra sao.

Phát hiện này gióng lên hồi chuông cảnh báo rằng các cuộc tấn công đầu độc dữ liệu có thể dễ thực hiện hơn nhiều và phổ biến hơn so với những gì người trong ngành từng nghĩ.

Theo ông Vasilios Mavroudis – đồng tác giả nghiên cứu và là nhà khoa học cấp cao tại Viện Alan Turing, điều đáng lo là những kẻ xấu có thể lợi dụng phát hiện này theo nhiều cách khác nhau.

“Một ví dụ là mô hình có thể được cài đặt để khi phát hiện một chuỗi từ nhất định, nó sẽ bỏ qua toàn bộ các cơ chế bảo vệ và bắt đầu hỗ trợ người dùng thực hiện các hành vi độc hại,” Mavroudis nói.

Một rủi ro khác mà ông đề cập là khả năng mô hình có hành vi phân biệt đối xử – tức là từ chối trả lời hoặc giảm tính hữu ích với một số nhóm người chỉ vì phát hiện ra họ dùng những từ khóa hay cách diễn đạt không đạt chuẩn.

Theo ông Mavroudis, “rất dễ để nhận ra một mô hình hoàn toàn không phản hồi, nhưng nếu mô hình chỉ hoạt động kém đi một chút, thì gần như không thể phát hiện bằng cách thông thường.”

Nhóm nghiên cứu cảnh báo kiểu đầu độc dữ liệu này có thể lan rộng và kêu gọi ngành AI cần có biện pháp phòng vệ mạnh mẽ hơn, đồng thời đầu tư nghiêm túc vào nghiên cứu cách phát hiện và ngăn chặn hiện tượng này.

Ông Mavroudis đề xuất các công ty nên quản lý dữ liệu đầu vào bằng cách: Xác minh kỹ nguồn dữ liệu; Lọc và kiểm tra chặt chẽ hơn trước khi huấn luyện; Kiểm tra hành vi mô hình sau khi đào tạo để phát hiện bất thường.

“Chúng tôi có bằng chứng sơ bộ cho thấy nếu tiếp tục huấn luyện bằng dữ liệu sạch và được chọn lọc kỹ, mô hình có thể tự loại bỏ dần các yếu tố độc hại đã bị chèn vào trước đó”, ông nói.

Đây là một lời nhắc quan trọng cho ngành AI, vốn đang quá chú trọng vào quy mô. Mô hình “to hơn” không có nghĩa là “an toàn hơn”. Đôi khi, chỉ cần vài tệp dữ liệu xấu cũng đủ khiến cả hệ thống lệch hướng.

Đọc bài theo từ khoá

Chủ đề

Phát triển kinh tế dữ liệu

“Chúng ta chưa thể biến dữ liệu thành dòng chảy giá trị kinh tế”

Đảm bảo 3 giá trị cốt lõi trong thị trường giao dịch dữ liệu

Đông Nam Bộ đối mặt áp lực hạ tầng năng lượng cho làn sóng trung tâm dữ liệu và AI

Xem thêm

Mới nhất trên VnEconomy

Tài chính 14:23, 06/06/2026

Giá vàng hạ nhiệt nhưng khoảng cách giá mua, bán cao bất thường

Đọc ngay

Chứng khoán 14:19, 06/06/2026

VinaCapital: Định giá chứng khoán Việt Nam đang thấp như thời khủng hoảng, triển vọng tăng trưởng rất tốt

Đọc ngay

Chứng khoán 14:18, 06/06/2026

VnDirect: Có thể giải ngân tại vùng 1.830 điểm, tập trung cổ phiếu nền tảng cơ bản tích cực

Đọc ngay

Doanh nghiệp niêm yết 14:18, 06/06/2026

Đang trong thời gian tái cơ cấu, GVR không bị hủy tư cách công ty đại chúng

Đọc ngay

Đọc tiếp

Bí thư Thành ủy Hải Phòng: Thành phố đủ điều kiện thí điểm mô hình phát triển mới

Chuyển đổi sang mô hình tăng trưởng mới, lấy phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số làm động lực chính là quan điểm nhất quán hiện nay của Đảng và Nhà nước ta. Với đặc trưng là trung tâm cảng biển, công nghiệp... Hải Phòng có đầy đủ các điều kiện để trở thành địa phương đi đầu trong thí điểm các mô hình phát triển mới.

"Việt Nam sẽ xây dựng thành công quốc gia số hùng cường, thịnh vượng và bền vững"

Mục tiêu của chuyển đổi số không phải là làm những việc cũ trên môi trường số mà là làm tốt hơn những việc cần làm: nhanh hơn, đơn giản hơn, minh bạch hơn và hiệu quả hơn...

AI thách thức đế chế gia công dịch vụ của Ấn Độ và Philippines

Hàng triệu lao động tại hai trung tâm cung cấp dịch vụ thuê ngoài lớn nhất thế giới đang bước vào cuộc chạy đua thích ứng với AI. Trong khi nhiều công việc đã bắt đầu bị tự động hóa thay thế, các chuyên gia cho rằng tác động thực sự của AI đối với ngành gia công dịch vụ toàn cầu có thể chỉ mới bắt đầu…

Mục tiêu có 60 doanh nghiệt Việt doanh thu 20 triệu USD/năm từ thị trường nước ngoài

Phấn đấu đến năm 2030 có 60 doanh nghiệp công nghệ số Việt Nam có doanh thu từ thị trường nước ngoài đạt 20 triệu USD/năm, có 5 doanh nghiệp công nghệ số có doanh thu từ thị trường nước ngoài đạt tối thiểu 1 tỷ USD/năm...

Nhà đầu tư tài sản số vẫn được giữ ví cá nhân nhưng phải giao dịch qua sàn cấp phép

Sau 6 tháng từ khi tổ chức chức cung cấp dịch vụ tài sản mã hóa (sàn giao dịch, gọi là các VASP), nhà đầu tư có tài sản số không chuyển tài sản về sàn trong nước cũng không bị phạt, tuy nhiên khi giao dịch sẽ phải thực hiện qua các VASP được cấp phép và vẫn được giữ nguyên ví của mình…

Xem thêm

Sản phẩm - Thị trường Tài sản số Dịch vụ số Start-up Quản trị số

Đừng bỏ lỡ

Kinh tế số

Greenfeed: Chăn nuôi bền vững nhờ dữ liệu và công nghệ

Đọc ngay

Kinh tế số

Greenfeed: Chăn nuôi bền vững nhờ dữ liệu và công nghệ

Đọc ngay

Kinh tế số

Bybit muốn hợp tác với các tổ chức tài sản mã hoá Việt Nam

Đọc ngay

Kinh tế số

Mô hình AI tiếng Việt 120 tỷ tham số, hiệu suất thuộc nhóm dẫn đầu cùng quy mô

Đọc ngay

Kinh tế số

Tìm lời giải bài toán phân mảnh dữ liệu các sàn giao dịch công nghệ

Đọc ngay

Kinh tế số

Hàng loạt CEO AI kêu gọi luật chống lại vũ khí sinh học

Đọc ngay

[Interactive]: Toàn cảnh kinh tế Việt Nam tháng 5/2026

Bức tranh kinh tế của Việt Nam trong tháng 5 và 5 tháng đầu năm 2026 ghi nhận nhiều chỉ số tăng trưởng tích cực. Điển hình như chỉ số sản xuất công nghiệp (IIP) tháng 5 tăng 8,8% so với cùng kỳ; tổng mức bán lẻ hàng hóa và doanh thu dịch vụ tiêu dùng tăng 11,8%....