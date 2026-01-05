Các cá nhân và tổ chức đang phải vật lộn với những hệ quả từ văn bản do AI viết. Giáo viên muốn biết liệu bài làm của học sinh có phản ánh đúng sự hiểu biết của các em hay không; người tiêu dùng muốn biết một mẩu quảng cáo là do con người hay máy móc viết. Việc đặt ra các quy định để quản lý nội dung do AI tạo ra tương đối dễ dàng, nhưng việc thực thi chúng lại phụ thuộc vào một điều khó khăn hơn nhiều: khả năng phát hiện chính xác liệu văn bản đó có phải do trí tuệ nhân tạo tạo ra hay không.

Một số nghiên cứu đã tìm hiểu liệu con người có thể phát hiện ra văn bản do AI tạo ra hay không. Ví dụ, những người sử dụng thành thạo các công cụ viết bằng AI được chứng minh là có khả năng phát hiện văn bản AI khá chính xác. Một hội đồng đánh giá là con người thậm chí có thể vượt qua các công cụ tự động trong một môi trường kiểm soát. Tuy nhiên, chuyên môn này không phổ biến và sự đánh giá của cá nhân có thể thiếu nhất quán. Do đó, các tổ chức cần sự nhất quán ở quy mô lớn thường tìm đến các công cụ phát hiện văn bản AI tự động.

Vấn đề của việc phát hiện văn bản AI

Quy trình cơ bản đằng sau việc phát hiện văn bản AI rất dễ mô tả: Bắt đầu với một đoạn văn bản cần xác định nguồn gốc, sau đó áp dụng công cụ phát hiện (thường chính là một hệ thống AI khác). Hệ thống này phân tích văn bản và đưa ra một số điểm, thường dưới dạng xác suất, cho biết khả năng văn bản đó do AI tạo ra.

Ảnh minh hoạ

Tuy nhiên, sự mô tả đơn giản này lại che giấu một mạng lưới phức tạp của các giả định: Bạn có biết công cụ AI nào có khả năng đã được sử dụng không? Bạn có quyền truy cập vào các công cụ đó để kiểm tra cơ chế bên trong của chúng không? Bạn có bao nhiêu dữ liệu văn bản? Câu trả lời cho những câu hỏi này sẽ quyết định khả năng thành công của công cụ phát hiện.

Có một chi tiết đặc biệt quan trọng: Liệu hệ thống AI tạo ra văn bản có chủ ý nhúng các dấu hiệu để giúp việc phát hiện sau này dễ dàng hơn không? Những dấu hiệu này được gọi là "hình mờ" (watermarks). Văn bản có hình mờ trông giống như văn bản bình thường, nhưng các dấu hiệu được nhúng một cách tinh vi mà mắt thường không thấy được. Người có "chìa khóa" phù hợp có thể kiểm tra và xác minh nguồn gốc của văn bản. Tuy nhiên, cách tiếp cận này phụ thuộc vào sự hợp tác của các nhà cung cấp AI và không phải lúc nào cũng khả dụng.

Cách các công cụ phát hiện văn bản AI hoạt động

Một cách tiếp cận hiển nhiên là dùng chính AI để phát hiện văn bản do AI viết. Ý tưởng rất đơn giản: Thu thập một lượng lớn dữ liệu gồm các ví dụ được dán nhãn là "do người viết" hoặc "do AI tạo ra", sau đó huấn luyện một mô hình để phân biệt giữa hai loại này. Phương pháp này coi việc phát hiện văn bản AI như một bài toán phân loại tiêu chuẩn, tương tự như bộ lọc thư rác.

Nếu bạn có quyền truy cập vào chính các công cụ AI mà bạn đang lo ngại, một chiến lược khác sẽ khả thi hơn. Thay vì huấn luyện một bộ phát hiện riêng biệt, phương pháp này tìm kiếm các tín hiệu thống kê trong văn bản dựa trên cách các mô hình AI cụ thể tạo ra ngôn ngữ. Ví dụ, nếu một mô hình gán xác suất cao bất thường cho một chuỗi từ chính xác, đó có thể là dấu hiệu cho thấy văn bản thực sự được tạo ra bởi mô hình đó.

Cuối cùng, trong trường hợp văn bản được tạo ra bởi một hệ thống có nhúng hình mờ, vấn đề sẽ chuyển từ "phát hiện" sang "xác minh". Sử dụng chìa khóa bí mật từ nhà cung cấp AI, công cụ xác minh có thể đánh giá xem văn bản có khớp với hệ thống đã được đánh dấu hay không.

Ảnh minh hoạ

Hạn chế của các công cụ phát hiện

Mỗi nhóm công cụ đều có những hạn chế riêng. Các bộ phát hiện dựa trên học máy (learning-based) rất nhạy cảm với việc văn bản mới giống dữ liệu huấn luyện đến mức nào. Độ chính xác của chúng sẽ giảm mạnh khi văn bản khác biệt đáng kể so với dữ liệu cũ, vốn nhanh chóng trở nên lạc hậu khi các mô hình AI mới ra đời. Việc liên tục cập nhật dữ liệu và huấn luyện lại là rất tốn kém.

Các bài kiểm tra thống kê cũng đối mặt với những rào cản khác. Nhiều phương pháp dựa trên giả định về cách các mô hình AI cụ thể hoạt động. Khi các mô hình là độc quyền, thường xuyên cập nhật hoặc không được tiết lộ, những giả định này sẽ bị phá vỡ. Kết quả là, những phương pháp hoạt động tốt trong phòng thí nghiệm có thể trở nên không đáng tin cậy trong thế giới thực.

Nhìn rộng hơn, việc phát hiện văn bản AI là một phần của cuộc chạy đua vũ trang đang leo thang. Để hữu ích, các công cụ phát hiện phải được công khai, nhưng chính sự minh bạch đó lại giúp kẻ gian tìm cách lách luật. Khi các trình tạo văn bản AI ngày càng hoàn thiện và kỹ thuật lẩn tránh tinh vi hơn, các bộ phát hiện khó lòng giữ được lợi thế lâu dài.

Thực tế khắc nghiệt

Vấn đề phát hiện văn bản AI dễ đặt ra nhưng lại rất khó giải quyết một cách đáng tin cậy. Các tổ chức có quy định về việc sử dụng văn bản AI không thể chỉ dựa vào các công cụ phát hiện để thực thi. Khi xã hội dần thích nghi với AI tạo năng, chúng ta có thể sẽ tinh chỉnh các chuẩn mực về việc sử dụng văn bản AI và cải thiện kỹ thuật phát hiện. Nhưng cuối cùng, chúng ta sẽ phải học cách sống chung với sự thật rằng những công cụ như vậy sẽ không bao giờ đạt đến mức hoàn hảo.

Nguồn: Live Science