Các công cụ kiểm tra văn bản được tạo bởi trí tuệ nhân tạo (AI checker) nổi tiếng là kém hiệu quả. Chúng thường xuyên đánh dấu nhầm các bài viết do con người tạo ra, dựa trên các yếu tố như ngữ pháp, lựa chọn từ ngữ và phong cách, dẫn đến nhiều vấn đề nghiêm trọng cho sinh viên, người làm nội dung và bất kỳ ai phụ thuộc vào văn bản.
Vậy, nếu bài viết của bạn liên tục bị các công cụ phát hiện AI gắn cờ, đây là lý do tại sao – và cách bạn có thể khắc phục tình trạng này.
Ngữ Pháp Quá Hoàn Hảo Có Thể Là Dấu Hiệu “Đáng Nghi”
Một trong những cách các công cụ phát hiện AI gắn cờ nội dung được tạo bởi AI là dựa vào mức độ hoàn hảo của ngữ pháp, cũng như việc bài viết chủ yếu sử dụng các cấu trúc câu tiêu chuẩn hoặc phổ biến. Về lý thuyết, AI không mắc lỗi ngữ pháp, trong khi ngay cả những người viết giỏi nhất cũng có thể mắc lỗi nhỏ khi viết. Tương tự, nếu bài viết của bạn ít có sự phá cách về phong cách và trở nên chuẩn mực về ngữ pháp, thiếu đi một phong cách viết cá nhân, điều này có thể kích hoạt các công cụ phát hiện AI.
Để minh họa, dưới đây là một đoạn văn do ChatGPT viết dựa trên bài viết này, sau đó được dán vào GPTZero. Nó bị gắn cờ với khả năng rất cao là do AI tạo ra, lên tới 100%.
GPTZero nhận diện đoạn văn là 100% AI tạo ra
Nếu tôi thêm vào một vài lỗi ngữ pháp nhỏ bằng cách xóa một số dấu phẩy và thêm một lỗi chính tả, cùng với một vài thay đổi nhỏ về phong cách, điểm số của GPTZero giảm đáng kể xuống còn 81%.
GPTZero đánh giá đoạn văn là 81% AI tạo ra sau khi chỉnh sửa nhỏ
Bạn Sử Dụng Các Từ Ngữ Phổ Biến Mà AI Thường Dùng
Khi đọc một văn bản, nhiều người trong chúng ta đã phát triển một cảm giác trực quan về việc liệu nó có phải do AI viết hay không, chẳng hạn như các đoạn văn dài dòng, mơ hồ và những từ mà AI thường xuyên sử dụng, ví dụ như “đào sâu” (delve), “nổi bật” (highlight), “nhấn mạnh” (underscore), “đặt ra” (pose), “thế giới của” (the world of), “nỗ lực” (strive), cùng vô số từ và cụm từ khác. Điều này được thể hiện rõ qua sự gia tăng đáng kể của từ “delve” được sử dụng trong các bài nghiên cứu học thuật vào năm 2023, trùng hợp với thời điểm ChatGPT ra mắt.
Sử dụng cùng một văn bản như ví dụ trước, nếu tôi thực hiện một vài thay đổi nhỏ đối với các phân đoạn bị “cờ đỏ AI” lớn nhất, điểm số GPTZero giảm xuống còn 49% – một điểm số được coi là “do con người tạo ra”, mặc dù vẫn chưa thoát khỏi sự kiểm tra nghiêm ngặt trong môi trường học thuật. Rõ ràng, các công cụ kiểm tra AI có thể dễ dàng bị đánh lừa chỉ với một vài chỉnh sửa nhỏ, đây là một trong nhiều ví dụ làm nổi bật sự kém hiệu quả của chúng.
GPTZero nhận diện đoạn văn là do con người tạo ra với điểm số 49%
Trong thời gian dài làm gia sư viết lách, tôi nhận thấy các học sinh nói tiếng Anh như ngôn ngữ thứ hai (ESL) thường xuyên phàn nàn về việc nhận được kết quả “false positive” (gắn cờ sai) từ các công cụ kiểm tra AI. Khi tạo ra các mô hình ngôn ngữ lớn, các công ty AI thường thuê ngoài việc chú thích dữ liệu cho các quốc gia nơi tiếng Anh là ngôn ngữ thứ hai phổ biến. Do đó, một số từ ngữ mà chúng ta liên tưởng đến văn bản AI, chẳng hạn như “đào sâu” (delve), có thể là kết quả của việc chú thích dữ liệu được thực hiện bởi những người nói tiếng Anh như ngôn ngữ thứ hai, những người thường sử dụng những từ này trong vốn từ vựng của họ.
Điều này càng phức tạp hơn khi nhiều người thành thạo tiếng Anh như ngôn ngữ thứ hai thường nắm vững các quy tắc ngữ pháp tốt hơn so với người bản xứ, những người thường tiếp cận theo cách trực quan hơn. Do đó, những người nói tiếng Anh như ngôn ngữ thứ hai có thể đối mặt với nguy cơ bị “gắn cờ sai” gấp đôi bởi các công cụ phát hiện nội dung AI do ngữ pháp chuẩn xác và lựa chọn từ vựng của họ.
Phụ Thuộc Vào Trợ Lý Viết AI Cũng Có Thể Gây Ra Vấn Đề
Cả hai vấn đề trên đều có thể xảy ra ngay cả khi bạn không sử dụng công cụ AI tạo sinh. Nếu bạn nghiêm túc cố gắng tạo ra một bài viết gốc và sử dụng các công cụ hỗ trợ viết như Grammarly, bài viết của bạn có nhiều khả năng bị gắn cờ là do AI viết. Đây chắc chắn là một vùng “xám” trong môi trường học thuật, vì các công cụ này về mặt kỹ thuật là trợ lý AI tạo sinh, và sinh viên thường sử dụng chúng để thay thế việc học hỏi hơn là như một công cụ bổ trợ hữu ích.
Theo kinh nghiệm của tôi trong việc giảng dạy, tôi nhận thấy những người quá phụ thuộc vào Grammarly để sửa bài viết của mình là những người lo sợ nhất về các công cụ kiểm tra AI khi nộp bài. Khi một tỷ lệ đáng kể văn bản của ai đó được viết lại theo gợi ý của trợ lý AI, một phần lớn bài viết của bạn, trên thực tế, là do AI tạo ra. Do đó, khi sử dụng các công cụ như Grammarly, hãy cẩn thận nếu bạn quá phụ thuộc vào chúng, và hãy xem các gợi ý của Grammarly như những cơ hội học hỏi thay vì chấp nhận chúng một cách vô thức.
Sao Chép Nguyên Văn Kết Quả Từ ChatGPT Là “True Positive”
Cuối cùng và rõ ràng nhất, nếu bạn thực sự sử dụng ChatGPT và không chỉnh sửa gì đáng kể đầu ra của nó, các công cụ kiểm tra AI gần như chắc chắn sẽ gắn cờ bạn; đây không phải là một “false positive” (gắn cờ sai). Tuy nhiên, ngay cả khi bạn thực sự cố gắng viết một bài hoàn toàn nguyên bản, không có sự hỗ trợ, ngữ pháp hoàn hảo và một số lựa chọn từ vựng, cách diễn đạt nhất định vẫn có thể khiến bạn bị gắn cờ sai.
Chia sẻ ý kiến của bạn: Bạn đã bao giờ gặp phải tình huống bài viết của mình bị các công cụ phát hiện AI gắn cờ sai chưa? Hãy chia sẻ kinh nghiệm và những mẹo bạn dùng để khắc phục vấn đề này trong phần bình luận bên dưới nhé!