AI cho người không code, bài G: ghi nhớ, AI có thực sự nhớ bạn không

Bạn ngồi chat với ChatGPT cả tuần. Bạn nói tên mình là Lan, bạn làm marketing ở Sài Gòn, bạn viết bằng giọng văn thân thiện, không thích từ Hán Việt. Hôm sau bạn mở chat mới, gõ “viết bài giới thiệu sản phẩm hộ”. ChatGPT trả lời như chưa từng quen bạn, gọi bạn là “bạn”, viết bằng giọng văn báo cáo cứng đơ, dùng đầy “tối ưu hoá”, “kiến tạo”, “đồng hành”.

Bạn cau mày: tuần trước tao đã nói rồi mà, sao quên nhanh vậy?

Vấn đề không phải AI ngu. Vấn đề là trong nhiều năm, AI thực sự không nhớ gì giữa các cuộc chat. Mỗi lần bạn mở tab mới, AI khởi động từ con số không. Nhưng từ 2024 trở đi, ba con AI lớn nhất (ChatGPT, Claude, Gemini) đã thêm tính năng “nhớ thật” theo cách khác nhau. Bài này gỡ rối ba khái niệm dễ lẫn (context window, memory bền, projects), hướng dẫn bật và quản lý từng cái, kèm năm tình huống thực tế bạn có thể áp dụng từ tuần này.

Ba khái niệm dễ lẫn

Trước khi đi sâu, cần phân biệt ba thứ. Chúng đều liên quan tới “AI nhớ”, nhưng cơ chế khác nhau hoàn toàn.

Context window là “phòng đối thoại” tôi đã nói ở bài F. Nó là bộ nhớ ngắn hạn, sống trong một cuộc chat duy nhất. Mở chat mới là phòng đó dọn sạch. Khoảng 128K, 200K hay 1M token tuỳ model, đủ chứa lịch sử cuộc chat hiện tại.

Memory bền là thứ AI ghi vào “sổ tay” riêng và đọc lại ở MỌI cuộc chat sau đó. Bạn nói “tôi tên Lan”, AI lưu vào sổ, tuần sau mở chat mới AI vẫn biết bạn tên Lan. Đây là điểm khác biệt cốt lõi với context window.

Projects là “thư mục có ngữ cảnh riêng”. Bạn tạo một project tên “Marketing công ty A”, upload tài liệu sản phẩm, viết hướng dẫn (system instructions) kiểu “luôn dùng tone thân thiện, tránh từ Hán Việt”. Mọi cuộc chat bên trong project đó đều dùng chung ngữ cảnh đó. Nhưng ra ngoài project, AI không còn biết gì.

Bảng so sánh ngắn cho dễ nhớ:

Loại	Phạm vi	Bạn kiểm soát được?
Context window	Trong 1 cuộc chat	Không trực tiếp (chỉ qua nội dung gõ vào)
Memory bền	Xuyên mọi cuộc chat	Có, xem và xoá từng entry
Projects	Trong 1 project (nhiều chat)	Có, edit instructions và files

Ba thứ này hoạt động song song. Một cuộc chat bên trong project sẽ có cả context window (lịch sử chat hiện tại), memory bền (sổ tay user-level), và project-level instructions cộng files. AI tổng hợp tất cả trước khi trả lời bạn.

ChatGPT Memory

OpenAI ra mắt Memory cho ChatGPT từ 2024 và mở rộng dần. Tới 2026, có hai phần riêng:

Saved memories là danh sách rõ ràng các “fact” ChatGPT chọn ghi nhớ. Bạn xem được, sửa được, xoá từng cái được.

Reference chat history là khả năng đọc ngầm các cuộc chat cũ. Không có danh sách hiển thị, ChatGPT tự rút mẫu từ lịch sử. Bật tắt riêng được.

Cách bật và quản lý:

Vào Settings, mục Personalization.
Bật toggle Memory.
Click Manage memories để xem danh sách saved memories. Mỗi entry có icon thùng rác để xoá.
Bật toggle Reference chat history riêng nếu muốn ChatGPT đọc ngầm các chat cũ.

Trên mobile: menu ba gạch, tên bạn ở dưới, Personalization, Manage Memory.

Trong chat, bạn có thể bảo trực tiếp:

Hãy nhớ rằng tôi tên Lan, làm marketing, viết tone thân thiện, tránh từ Hán Việt.

ChatGPT sẽ phản hồi “Memory updated” hoặc tương tự. Mở chat mới, gõ “Mày nhớ gì về tao”, nó sẽ liệt kê. Muốn quên gì đó, gõ “Quên giúp tao chuyện tao thích bún bò”, ChatGPT xoá entry tương ứng.

Khi không muốn ghi nhớ một cuộc chat cụ thể (đang search việc nhạy cảm, hỏi y tế, hỏi tài chính), dùng Temporary Chat (chat tạm thời) ở menu trên cùng. Cuộc chat đó không đọc memory, không lưu memory mới, không nằm trong history.

Lúc nào nên dùng: bạn dùng ChatGPT hàng ngày, có nhiều thông tin lặp lại (tên, vai trò, sở thích, style writing). Lưu vào memory để khỏi nhắc đi nhắc lại.

Claude Projects

Anthropic không có “memory bền” theo style của OpenAI. Thay vào đó, họ thiết kế Projects như giải pháp chính cho việc lưu ngữ cảnh dài hạn. Tới 2026, Projects có ở mọi plan (kể cả free, giới hạn 5 project).

Mỗi project có hai phần chính:

Project instructions là đoạn text bạn viết, áp dụng cho mọi cuộc chat trong project. Đây là chỗ bạn ghi style guide, tone giọng, vai trò bạn muốn AI đóng, các rule cố định. Claude đọc nó trước mỗi response.

Knowledge base là kho file bạn upload (PDF, DOCX, CSV, TXT, code, HTML). Tới 30MB mỗi file, không giới hạn số file. Claude tự truy xuất phần liên quan khi bạn hỏi, dùng kỹ thuật RAG (Retrieval Augmented Generation) ở plan trả phí khi tổng nội dung vượt context window.

Cách tạo và dùng:

Vào claude.ai, sidebar trái có Projects.
Click Create Project, đặt tên (ví dụ “Marketing công ty A”).
Mở project, click Set custom instructions, viết hướng dẫn.
Click Add content để upload file hoặc paste text vào knowledge base.
Mọi chat mới bên trong project sẽ tự áp dụng instructions và đọc được knowledge base.

Ví dụ instructions cho project marketing:

Vai trò: trợ lý content cho công ty A, ngành thực phẩm sạch.
Style: thân thiện, gọi khách là "anh chị", tránh từ Hán Việt.
Format: mỗi bài có hook 2 câu đầu, kết bằng CTA cụ thể.
Audience: phụ nữ 25-40 tuổi, mẹ trẻ ở thành phố lớn.
Cấm: tuyên bố sản phẩm chữa bệnh, dùng từ "tốt nhất".

Mọi chat trong project này, Claude tự nhớ vai trò, style, audience. Bạn không cần nhắc lại.

Khác biệt với ChatGPT Memory: Claude Projects yêu cầu bạn chủ động tạo project. Nó không tự ghi nhớ mơ hồ về bạn. Đổi lại, ngữ cảnh chính xác hơn vì bạn kiểm soát toàn bộ.

Plan Team hoặc Enterprise có thể share project cho cả team, dùng chung knowledge base. Phù hợp khi team marketing 5 người muốn dùng cùng style guide.

Gemini Saved Info

Google đi cách thứ ba với Gemini, gọi là Saved Info. Tới 2026, Saved Info là long-term memory của Gemini, lưu các fact và instruction cố định.

Cách dùng đơn giản nhất: trong chat, gõ câu có chữ “nhớ”:

Nhớ rằng tôi tên Lan, làm marketing ở công ty A, viết tone thân thiện.

Gemini lưu vào Saved Info. Lần sau bạn hỏi gì cần đến thông tin đó, Gemini sẽ hiện label “Using your saved info” trong response để bạn biết nó đã đọc.

Quản lý:

Vào gemini.google.com, click avatar góc phải, Settings.
Mở Saved Info (hoặc trong Personalization).
Xem danh sách, sửa hoặc xoá từng entry.

Loại thông tin nên lưu:

Tên, nghề nghiệp, ngôn ngữ (vài fact cốt lõi)
Sở thích viết (tone, format, từ tránh dùng)
Bối cảnh công việc lặp lại (ngành, sản phẩm chính)
Hạn chế chế độ ăn (nếu hỏi công thức nấu ăn)

Không nên lưu: chuyện cá nhân nhạy cảm, thông tin tài chính, password, thông tin của người khác mà họ không biết.

Khác biệt với hai bên kia: Gemini cũng tích hợp Connected Apps (Gmail, Drive, Calendar). Khi bật, Gemini đọc được nội dung từ các app của bạn để cá nhân hoá thêm. Phần này nằm ngoài Saved Info nhưng cùng hệ thống personalization, bạn nên hiểu khi setup lần đầu.

Năm tình huống thực tế

Lý thuyết đủ rồi. Đây là năm cách bạn có thể áp dụng ngay tuần này.

1. Style writing cá nhân

Vấn đề: mỗi lần nhờ AI viết, bạn phải copy paste guide style. Mất thời gian, dễ quên.

Cách làm: lưu style guide vào memory hoặc project instructions. Ví dụ trong Claude Projects, tạo project “Cá nhân”, instructions:

Tôi là Lan, dân marketing 32 tuổi.
Văn viết: ngắn, câu chủ động, dùng "tao tôi mày bạn" tuỳ context.
Tránh: từ Hán Việt, sáo ngữ "vì vậy", "đặc biệt", "tuyệt vời".
Định dạng email: subject ngắn dưới 50 ký tự, body 3 đoạn ngắn.

Mọi chat trong project sẽ tự áp dụng. Hợp khi bạn chuyên viết content, email, social.

2. Family details

Vấn đề: bạn hỏi AI gợi ý món ăn cuối tuần. Mỗi lần phải nhắc “nhà tôi có con 3 tuổi, vợ bị dị ứng hải sản”.

Cách làm: lưu vào ChatGPT Memory hoặc Gemini Saved Info:

Nhớ rằng nhà tôi có 4 người: tôi, vợ (dị ứng hải sản), con 3 tuổi, con 7 tuổi. Cả hai con không ăn cay.

Tuần sau gõ “gợi ý 5 món tối nay”, AI tự loại hải sản và đồ cay.

3. Work context

Vấn đề: bạn là dev backend Node.js dùng MongoDB. Mỗi lần hỏi AI sửa code, phải nói lại context.

Cách làm: tạo Claude Project tên “Work” với instructions:

Tôi là backend dev, stack: Node.js 22, Fastify, MongoDB 7, Redis.
Trả lời code: dùng TypeScript, async await, không callback.
Mọi solution phải xét tới performance ở 10K req/s.
Khi tôi paste code, sửa in place, không viết lại từ đầu.

Upload thêm vào knowledge base: schema MongoDB chính, danh sách API endpoint hiện có, coding convention team. Mọi câu hỏi code sau đó AI trả lời sát với codebase thật.

4. Project-specific kiến thức

Vấn đề: bạn đang chạy chiến dịch marketing cho khách hàng X. Có brief 20 trang, persona, brand guideline. Mỗi lần hỏi AI viết content cho X phải paste lại từ đầu.

Cách làm: tạo Claude Project “Client X”, upload brief PDF, brand guideline, ví dụ content cũ. Instructions ghi rõ vai trò, audience, CTA pattern. Mọi chat bên trong project trả lời đúng tone X muốn, đúng audience, không lệch sang client khác.

Đây là use case mạnh nhất của Projects. Một agency có 10 client, tạo 10 project, mỗi project chuyên một khách. Không lẫn lộn.

5. Recurring task

Vấn đề: mỗi tuần bạn tổng hợp báo cáo doanh thu, format giống nhau, chỉ thay số. Hỏi AI lần nào cũng phải gửi template.

Cách làm: Claude Project “Báo cáo tuần”, instructions ghi cấu trúc:

Khi tôi paste số doanh thu thô, hãy tự format theo template:
1. Tổng quan tuần (3 câu)
2. Top 3 sản phẩm theo doanh thu
3. So sánh với tuần trước (% tăng giảm)
4. Insight và đề xuất (2-3 gạch đầu dòng)
Tone: trang trọng, gửi cho sếp.

Mỗi tuần chỉ cần paste số, AI ra báo cáo hoàn chỉnh. Tiết kiệm 30 phút mỗi lần.

Privacy: AI có “rò” memory ra ngoài không

Đây là câu hỏi hợp lý và bạn nên đặt ra trước khi lưu thông tin cá nhân.

Memory không rò trực tiếp sang user khác. Memory ChatGPT của bạn là của tài khoản bạn, không sang account khác. Claude Projects gắn với tài khoản hoặc team (nếu share trong workspace).

Nhưng có ba rủi ro thực tế:

Bị social engineering qua chính AI. Nếu ai đó dùng tài khoản của bạn (laptop chưa lock), họ có thể gõ “Mày nhớ gì về tao” và đọc hết. Lock máy, dùng password manager.
Data có thể dùng để train model (tuỳ plan và setting). Plan free nhiều khi mặc định cho phép. Vào Settings, Data Controls, tắt “Improve the model for everyone” nếu cần. ChatGPT, Claude, Gemini đều có toggle này.
Leak qua response. Cực hiếm nhưng có ghi nhận: AI vô tình rò một phần memory user A khi trả lời user B do bug. Cách phòng: đừng lưu thông tin cực nhạy cảm vào memory (CMND, mật khẩu, mã ngân hàng, thông tin sức khoẻ chi tiết).

Nguyên tắc đơn giản: lưu cái bạn sẵn sàng in lên danh thiếp được. Không lưu cái bạn không muốn người lạ đọc.

Nếu công ty bạn yêu cầu privacy nghiêm ngặt, dùng plan Enterprise (ChatGPT Enterprise, Claude for Work, Gemini Enterprise) có cam kết không train trên data của bạn. Free plan thì cẩn trọng hơn.

Khi nào dùng cái nào

Tóm lại trong một câu:

ChatGPT Memory: bạn dùng AI hàng ngày, muốn nó nhớ phong cách và vài fact về bạn, không muốn setup nhiều. Tự nhiên nhất, ít thao tác.
Claude Projects: bạn có nhiều ngữ cảnh khác nhau (nhiều client, nhiều dự án, nhiều vai trò). Mỗi project cô lập, kiểm soát chặt.
Gemini Saved Info: bạn dùng hệ sinh thái Google (Gmail, Drive, Calendar), muốn AI vừa nhớ fact vừa đọc được app khác qua Connected Apps.

Lý tưởng nhất là dùng cả ba khi phù hợp. ChatGPT Memory cho fact cá nhân chung. Claude Projects cho work context theo client. Gemini cho việc gắn với Google Workspace.

Bước tiếp

Bài này khép lại phần “AI nhớ bạn thế nào” trong series. Bài H tiếp theo sẽ giải thích token và gói trả phí: token là gì giải thích đơn giản, vì sao tiếng Việt tốn token gấp đôi tiếng Anh, gói free đủ dùng cho ai, ai nên trả tiền Pro Plus hay Pro Max. Câu chuyện tiền bạc, không kỹ thuật, nhưng quan trọng nếu bạn định gắn bó với AI lâu dài.

Trước đó, hãy thử lưu một fact vào Memory ChatGPT hoặc Saved Info Gemini ngay hôm nay. Tạo một Claude Project cho công việc bạn làm nhiều nhất. Cảm nhận sự khác biệt giữa “AI mỗi lần khởi động từ con số không” với “AI đã quen bạn từ lần thứ hai”.