AI cho người không code, bài E: 'em phịa' (hallucination) và cách phát hiện

Tháng 6 năm 2023, một luật sư ở New York tên là Steven Schwartz nộp bản tranh tụng lên tòa án liên bang, trích dẫn sáu vụ án tiền lệ để bảo vệ thân chủ. Vấn đề là cả sáu vụ án đó không tồn tại trên đời. Schwartz nhờ ChatGPT tra cứu, ChatGPT tự bịa tên vụ, tên thẩm phán, số hồ sơ, trích dẫn nguyên văn. Tất cả nhìn rất pháp lý, rất sai. Schwartz bị phạt 5.000 USD và bị nhắc đến trong hàng ngàn bài báo.

Đến năm 2026, chuyện vẫn lặp lại. Tháng 4 năm 2026, một hãng luật lớn ở Mỹ gửi thư xin lỗi chánh án vì một đơn khẩn cấp có khoảng 28 trích dẫn sai do AI bịa. Cơ sở dữ liệu theo dõi các vụ “AI phịa ra luật” hiện đã ghi nhận hơn 1.300 vụ trên toàn thế giới.

Tôi kể chuyện này vì hai lý do. Một, “em phịa” không phải lỗi nhỏ vô hại. Hai, người có học, có chuyên môn, có thu nhập cao cũng dính bẫy. Bạn không cần sợ AI, nhưng phải bỏ thói quen đọc câu trả lời mượt rồi tin luôn. Bài này chỉ nhằm tạo một cái phanh nhỏ trong đầu: khi AI nói chắc quá, dừng lại vài giây và hỏi “nguồn đâu?”.

Hallucination là gì, nói theo ngôn ngữ thường ngày

Trong giới AI, người ta gọi hiện tượng này là hallucination (ảo giác). Dịch sát nghĩa thì hơi nặng, vì AI không “ảo giác” theo kiểu con người. Cách dễ hiểu hơn: AI phịa. Nó nói chắc nịch về một điều không có thật, với giọng văn tự tin như đang đọc từ Wikipedia ra.

Bạn hỏi AI “ai là tổng thống Pháp năm 1832”, nó trả lời một cái tên rất Pháp, rất giống thật, có thể đúng có thể sai. Bạn hỏi “viết cho tôi tiểu sử nhà văn Nguyễn Văn A sinh năm 1923 ở Bến Tre”, AI sẽ viết ra một tiểu sử mượt mà, dù không có ai như vậy. Nó không cố lừa bạn. Nó chỉ đang làm đúng việc nó được dạy.

Điểm quan trọng cần nhớ: AI phịa không phải lúc nào cũng dễ thấy. Nếu nó bịa ra một cái rõ ràng vô lý kiểu “tổng thống Pháp năm 1832 là Napoléon thứ 87”, bạn sẽ nghi ngờ ngay. Nhưng phần lớn trường hợp, AI phịa ra thứ gần đúng, đủ giống thật để bạn không nghi. Đó mới là nguy hiểm.

Vì sao AI phịa? Câu chuyện về máy đoán chữ tiếp theo

Bạn nhớ lại bài B trong series: AI ngôn ngữ thực ra là một cỗ máy đoán chữ. Cho nó một chuỗi chữ đầu vào, nó đoán chữ tiếp theo có xác suất cao nhất, rồi đoán tiếp, và cứ thế.

Vấn đề: AI không có khái niệm “tôi không biết”. Khi huấn luyện, nó được thưởng vì đoán đúng chữ tiếp theo, không phải vì biết khi nào nên im lặng. Nói cách khác, AI được dạy đoán càng tự tin càng tốt, kể cả khi không có dữ liệu.

Hình dung một học sinh trong kỳ thi trắc nghiệm. Đáp án sai bị trừ điểm, đáp án bỏ trống không bị gì. Học sinh khôn sẽ bỏ trống khi không biết. Nhưng AI được dạy rằng bỏ trống cũng bị 0 điểm, nên thà đoán đại còn hơn. Hậu quả: khi không biết, nó vẫn bịa câu trả lời nghe rất thuyết phục.

Lý do thứ hai: AI học mẫu hình của câu chữ, không phải bản thân sự thật. Khi bạn hỏi về một nhà văn không tồn tại, AI vẫn biết “tiểu sử nhà văn thường có dạng nào”: sinh năm, quê quán, tác phẩm tiêu biểu. Nó ráp các mẫu này lại thành một tiểu sử “có vẻ đúng” về một người chưa từng tồn tại. Đây là khác biệt cốt lõi giữa AI và Google: Google trả lại link có nguồn gốc cụ thể, AI tạo ra văn bản không có nguồn, và luôn nghe rất chắc chắn dù không có gì để bám vào.

Bốn dạng phịa thường gặp nhất

Sau khi đọc hàng trăm câu chuyện và tự mình va phải nhiều lần, tôi thấy AI phịa thường rơi vào bốn dạng. Bạn nhận diện được dạng nào thì sẽ cảnh giác đúng chỗ.

Dạng 1: bịa số liệu

Đây là dạng phổ biến nhất trong công việc. Bạn hỏi “thị trường máy lọc nước Việt Nam năm 2025 trị giá bao nhiêu”, AI trả lời tỉnh bơ “khoảng 850 triệu USD, tăng trưởng 12% so với năm trước”. Số trông rất hợp lý. Có thể đúng, có thể sai 200%, không ai biết.

Tôi từng nhận một bản nháp pitch deck từ một bạn marketing trẻ. Trong đó có câu “thị trường Việt Nam tăng trưởng 23.7% CAGR đến 2028, theo nguồn Statista”. Tôi tra Statista, không có báo cáo nào nói như vậy. AI đã bịa ra cả con số lẫn nguồn.

Dạng 2: bịa luật, bịa quy định, bịa điều khoản

Loại nguy hiểm nhất nếu bạn dùng AI cho việc pháp lý hoặc hành chính. Câu chuyện Steven Schwartz đầu bài là một ví dụ. Phiên bản nhẹ hơn: bạn hỏi “luật lao động Việt Nam quy định thời gian thử việc tối đa bao nhiêu”, AI có thể tự bịa ra “theo Nghị định 145/2020/NĐ-CP điều 25 khoản 3” mà điều khoản đó không nói gì về câu hỏi của bạn. Nghe rất chuyên nghiệp, sai bản chất.

Dạng 3: bịa link, bịa URL

Bạn nhờ AI “cho tôi link bài báo về vụ X”. AI sẵn sàng đưa cho bạn một link đẹp đẽ, đúng định dạng, đúng domain. Bạn click vào, 404. Hoặc tệ hơn, link dẫn đến một bài hoàn toàn khác. AI không có khái niệm “URL này có tồn tại không”, nó chỉ ghép vài mảnh thành URL “trông giống thật”.

Đặc biệt nguy hiểm với học thuật: AI bịa link đến bài báo nghiên cứu, kèm DOI, kèm tên tác giả. Tất cả đều giả. Sinh viên đã nộp bài có tài liệu tham khảo do AI bịa, bị phát hiện, bị đánh trượt môn.

Dạng 4: bịa danh nhân, bịa sự kiện

Bạn hỏi “ông Nguyễn Văn X, giám đốc công ty Y, có bằng cấp gì”. Nếu AI không có thông tin về người này, thay vì nói “tôi không biết”, nó có thể bịa một tiểu sử hợp lý: “ông X tốt nghiệp đại học Bách Khoa năm 1995, có MBA Harvard năm 2003”. Toàn bộ có thể là dối.

Dạng này đáng sợ ở chỗ nó có thể gây hại danh dự người thật. Nếu bạn vô tư copy thông tin AI tạo ra về một người và đăng lên mạng, rủi ro pháp lý không nhỏ.

Cách tôi kiểm tra khi nghi AI đang phịa

Bây giờ đến phần thực tế nhất. Làm sao phát hiện AI đang phịa khi bạn không phải chuyên gia chủ đề đó? Tôi dùng năm động tác dưới đây gần như mỗi ngày, nhất là trước khi copy bất kỳ con số nào vào email hoặc slide.

Cách 1: cross-check với Google

Đơn giản nhất, hiệu quả nhất. Bất kỳ con số, tên người, tên vụ án, tên sách, hay link nào AI cho bạn, copy nguyên văn vào Google. Nếu Google trả về kết quả khớp, có thể tin. Nếu không thấy gì, hoặc thấy nhưng nội dung khác hẳn, AI đang phịa. Mẹo: dùng ngoặc kép quanh đoạn AI nói, ví dụ "McKinsey 2024" "ABC" "17%".

Cách 2: hỏi nguồn

Cứ hỏi thẳng AI: “Cho tôi nguồn cụ thể của thông tin trên, kèm link nếu có”. Nếu nó nói “tôi không có nguồn cụ thể, đây là kiến thức tổng hợp”, bạn nên nghi ngờ. Nếu nó đưa link hoặc tên tài liệu, bạn phải tự kiểm chứng. Tự bịa nguồn là dạng phổ biến nhất của hallucination.

Cách 3: kiểm tra link bằng cách click thật sự

Nếu AI đưa link, click vào. Đừng giả định link đúng vì nó đúng format. AI có thể đưa https://www.who.int/publications/abc-2024.pdf, link nhìn rất WHO, nhưng vào ra 404. Nâng cao: kiểm tra nội dung link có khớp với cái AI nói không, AI có thể đưa link thật nhưng nội dung khác hẳn tóm tắt.

Cách 4: hỏi cùng câu hỏi cho hai AI khác nhau

Nếu bạn không chắc, mở ChatGPT và Claude (hoặc Gemini) trong hai tab, hỏi cùng câu hỏi. Nếu cả hai trả lời giống nhau ở điểm chính, độ tin cậy tăng. Nếu khác nhau, ít nhất một bên đang phịa. Không phải tuyệt đối (cả hai cùng phịa cùng kiểu vẫn xảy ra), nhưng là cách rẻ và nhanh để bắt lỗi rõ.

Cách 5: dùng AI có chức năng tìm kiếm web

Năm 2026, các AI hàng đầu đều có chế độ search: ChatGPT có “Search” mode, Claude có web search trong chế độ Pro, Gemini có Google search tích hợp, Perplexity là cả một sản phẩm dựa trên search. Khi bật search, AI truy vấn web trước khi trả lời và đính kèm nguồn, rủi ro phịa giảm rõ rệt (không về 0). Với câu hỏi cần số liệu hoặc dữ liệu mới, luôn bật search.

Viết prompt sao cho AI ít phải đoán

Phát hiện là chuyện sau khi đã có câu trả lời. Tốt hơn là ngay từ đầu đừng đẩy AI vào thế phải đoán. Năm mẹo dưới đây không làm AI hết phịa, nhưng giảm hẳn số lần nó phải bịa để lấp chỗ trống.

Mẹo 1: cho context cụ thể trong prompt

Càng cụ thể, AI càng ít chỗ để bịa. Thay vì “kể về công ty X”, bạn nói “tôi đã dán mô tả công ty X bên dưới, dựa vào đó kể lại bằng giọng pitch deck” rồi dán mô tả thật vào. AI lúc này có dữ liệu thực, không cần đoán. Đây cũng là nguyên tắc 2 của bài D về prompt: cung cấp context trước khi hỏi.

Mẹo 2: yêu cầu trích dẫn nguồn rõ ràng

Thêm vào cuối prompt: “Với mỗi sự kiện, số liệu, hay trích dẫn, hãy ghi rõ nguồn (tên tài liệu, link, hoặc nói rõ nếu là kiến thức chung không có nguồn cụ thể)”. AI sẽ tự giảm bịa, vì biết phải gắn nguồn cho mỗi câu nói. Quan trọng: bạn vẫn phải kiểm tra nguồn. Yêu cầu trích dẫn không loại bỏ phịa, chỉ làm dễ phát hiện hơn.

Mẹo 3: dùng chế độ search hoặc đính kèm tài liệu (RAG)

Cách hiệu quả nhất để giảm phịa: ép AI dựa trên tài liệu cụ thể. Hai cách phổ biến. Một, bật chế độ search trong ChatGPT, Claude, Gemini, Perplexity, AI sẽ truy vấn web và bám vào kết quả thật. Hai, upload tài liệu trực tiếp lên chat (PDF, Word, Excel) và bảo “chỉ dùng nội dung trong file này để trả lời”. Dân kỹ thuật gọi là RAG (retrieval-augmented generation), bạn chỉ cần nhớ “đính kèm tài liệu, AI bám sát tài liệu, ít phịa hơn”.

Mẹo 4: prompt “nếu không biết, hãy nói không biết”

Câu thần chú đơn giản nhưng hiệu quả: thêm “Nếu bạn không chắc, hãy nói rõ là không chắc, đừng đoán”. Nghe có vẻ ngây thơ nhưng có hiệu quả thật với model hiện đại, vì chúng đã được fine-tune để tôn trọng yêu cầu này. Bạn có thể nói thêm: “Tôi thà nhận câu trả lời ngắn nói rõ giới hạn còn hơn nhận câu trả lời dài có chỗ bịa”.

Mẹo 5: chia nhỏ câu hỏi

Khi hỏi một câu lớn nhiều khía cạnh (“phân tích thị trường máy lọc nước Việt Nam, có số liệu, top 5 hãng, dự báo 5 năm tới”), AI dễ phịa ở chỗ không biết vì câu trả lời tổng thể phải đầy đủ. Chia nhỏ: trước hỏi “ngành máy lọc nước Việt Nam có những đặc điểm gì”, rồi “top 5 hãng nào đang dẫn đầu, theo nguồn nào”. Mỗi câu hỏi nhỏ giúp AI có cơ hội nói “phần này tôi không biết chắc” thay vì gồng hết để trả lời cả gói.

Khi nào bạn cần đặc biệt cảnh giác

Năm tình huống AI phịa cao bất thường, bạn nên cẩn thận hơn mặc định: tin tức mới sau ngày training cutoff, thông tin về một người hoặc công ty hoặc địa phương ít nổi tiếng, con số chính xác (doanh thu, dân số, tỷ lệ), luật và điều khoản hợp đồng, và liều lượng thuốc. Với bốn cái đầu, bật chế độ search hoặc đính kèm tài liệu. Với cái cuối, đi bác sĩ.

Đặc biệt nhấn mạnh chỗ pháp lý: bạn có thể dùng AI để hỏi câu hỏi đúng cho luật sư, không dùng nó thay luật sư.

Phịa giảm theo thời gian, nhưng chưa biến mất

Một câu hỏi tôi hay nghe: “AI ngày càng giỏi, bao giờ hết phịa?” Câu trả lời thật lòng: không bao giờ hoàn toàn hết, nhưng đã đỡ hơn rất nhiều. Năm 2023, AI phịa hàng giờ. Năm 2025-2026, chế độ search và RAG đã thành mặc định, tỷ lệ phịa giảm mạnh trong tác vụ có search. Nhưng trong câu hỏi mở, AI vẫn phịa, vì bản chất nó là máy đoán chữ.

Đừng chờ ngày AI ngừng phịa. Thay vào đó, học cách dùng AI như một trợ lý giỏi nhưng cẩu thả: tận dụng tốc độ và phạm vi, nhưng luôn kiểm chứng trước khi đưa ra quyết định.

Luôn kiểm

Nếu một câu trả lời sẽ đi vào email gửi sếp, báo cáo gửi khách, quyết định tiền bạc, sức khoẻ, pháp lý, đừng copy ngay. Cross-check, hỏi nguồn, click link thật, hoặc ép AI trích lại từ tài liệu gốc.

Bài F nói về phòng đối thoại (context window), lý do AI có thể “quên” giữa một cuộc trò chuyện dài dù vài phút trước vẫn trả lời rất mượt.