DeepSeek V4 Flash trong opencode: 18 ngày, 431 session, $22

Tôi dùng opencode song song với Claude Code khoảng một tháng nay. opencode là một terminal AI coding tool tương tự Claude Code nhưng hỗ trợ nhiều model hơn, kể cả DeepSeek. Tôi thêm DeepSeek V4 Flash vào workflow sau khi thấy giá API của nó rất rẻ và muốn biết trong thực tế nó tiêu như thế nào.

18 ngày sau, tôi có dữ liệu: 431 session, tổng $22.41. Bài này là ghi chép về những gì thật sự xảy ra, không phải bảng giá lý thuyết.

Bối cảnh: tôi dùng DeepSeek V4 ở đâu

opencode lưu dữ liệu session vào SQLite. Mỗi session có model, cost, token input/output, cache read, và directory. Tôi chạy query trên database đó để lấy số liệu dưới đây.

Tất cả đều là DeepSeek V4 Pro, không phải V4 Flash theo nghĩa API endpoint. opencode mapping DeepSeek V4 Pro sang deepseek-v4-pro nhưng cấu hình “variant” khác nhau: default, high, max, và none. Đây là cách opencode phân biệt effort level của model, tương tự low/medium/high/max trong các framework khác.

Giá API hiện tại của DeepSeek V4 Flash (tháng 06/2026):

Input thường: $0.14 / 1M token
Output: $0.28 / 1M token
Cache hit: $0.0028 / 1M token (50 lần rẻ hơn input thường)

Haiku 4.5 để so sánh:

Input thường: $1.00 / 1M token
Output: $5.00 / 1M token
Cache read: $0.10 / 1M token

Số liệu thật: 431 session trong 18 ngày

Tổng quan

Variant	Sessions	Tổng cost	Cost trung bình/session
high	269	$10.00	$0.037
max	45	$9.11	$0.203
default	98	$2.31	$0.024
none	15	$0.98	$0.066
Tổng	431	$22.41	$0.052

Tổng token: 14.2M input + 1.6M output + 274M cache read.

Cache read chiếm phần bất ngờ: 274 triệu token, so với 14 triệu token input thường. Tỉ lệ cache hit rất cao trong các session lặp lại trên cùng project. Nhờ đó $22.41 mới có thể cover 431 session.

Phân bổ session theo chi phí

Khoảng cost	Sessions	Tỉ lệ
$0	45	10%
$0.001 đến $0.01	134	31%
$0.01 đến $0.1	222	52%
$0.1 đến $1.0	24	6%
$1.0 trở lên	6	1%

52% session nằm trong khoảng $0.01 đến $0.10. Đây là dải cost của một session coding bình thường: hỏi vài câu, sửa một file, debug một lỗi. Chỉ 6 session vượt $1.00, và chúng là những session rất nặng như refactor lớn hoặc nghiên cứu sâu.

Project nào tốn nhiều nhất

Project	Variant	Sessions	Cost
`~/.claude`	high	18	$4.93
`~/.claude/skills`	max	7	$4.78
`~/WORK/AI/ai-agent-solution`	high	112	$1.50
`~/WORK/HENIA/blog-heniart`	max	1	$1.01
`~/.claude`	max	9	$0.99

~/.claude tốn nhiều nhất vì đây là nơi tôi build và refactor skills Claude Code, thường là các session dài với context lớn. ai-agent-solution có 112 session nhưng chỉ $1.50, nghĩa là đây là những session ngắn, lặp đi lặp lại, cache hit tốt.

Session đắt nhất

Session đắt nhất là $3.51 cho “Đánh giá chuyển skill từ Bun sang Go và tradeoff” với 190K token. Session đó dài hơn bình thường nhiều vì tôi để model đọc và phân tích cả một codebase lớn trước khi đưa ra khuyến nghị.

6 session trên $1.00, tất cả đều là công việc nặng tải: port codebase Go, refactor skill lớn, nghiên cứu plugin. Đây không phải overhead bình thường của workflow hàng ngày.

So với Claude Haiku 4.5 trên cùng token volume

Lấy con số thật: 14.2M input + 1.6M output + 274M cache read.

Nếu dùng Haiku 4.5 thay cho cùng khối lượng đó:

Input: 14.2M × $1.00/1M = $14.20
Output: 1.6M × $5.00/1M = $8.00
Cache read: 274M × $0.10/1M = $27.40
Tổng ước tính: $49.60

So với $22.41 tôi thực trả với DeepSeek. Haiku 4.5 đắt hơn khoảng 2.2 lần trên cùng khối lượng token.

Điều thú vị là cache read chiếm phần lớn lợi thế của DeepSeek. Cache read của DeepSeek chỉ $0.0028/1M, còn Haiku 4.5 là $0.10/1M, tức đắt hơn 35 lần. Với workload nhiều cache hit như tôi đang làm (lặp lại context cùng project), đây là chỗ tiết kiệm lớn nhất.

Thực tế về chất lượng: từng loại tác vụ

Tôi không chạy benchmark có kiểm soát. Nhưng sau 431 session tôi có cảm nhận rõ về loại tác vụ nào DeepSeek làm tốt và loại nào thấy giới hạn.

Tác vụ DeepSeek V4 làm tốt

Tìm kiếm và phân tích code. Đây là phần tôi dùng nhiều nhất. Hỏi “hàm này làm gì”, “tìm chỗ nào gọi X”, “giải thích flow này” thì DeepSeek trả lời nhanh và đủ chính xác. Cost trung bình session loại này nằm trong $0.01 đến $0.05.

Sửa lỗi nhỏ theo yêu cầu rõ ràng. Nếu tôi nói “đổi hàm này để nhận thêm parameter X”, DeepSeek thực hiện đúng. Không cần reasoning phức tạp, chỉ cần hiểu đúng yêu cầu và sửa chính xác.

Viết boilerplate và code lặp. Tạo struct, config template, migration file, test case mẫu. DeepSeek sinh code nhanh, thường là đúng ngay lần đầu cho tác vụ kiểu này.

Refactor có hướng dẫn cụ thể. Khi tôi đã biết muốn làm gì và chỉ cần thực thi, DeepSeek làm tốt. Đây là phần của 112 session trên ai-agent-solution với cost trung bình thấp.

Tác vụ thấy giới hạn

Quyết định kiến trúc mở. Khi câu hỏi là “cách tốt nhất để thiết kế X là gì” mà không có constraint rõ ràng, DeepSeek hay trả lời theo hướng an toàn nhưng không mang nhiều insight. Với tác vụ này tôi vẫn dùng Sonnet 4.6 hoặc Opus 4.8 trong Claude Code.

Debug phức tạp nhiều bước. Session “Đánh giá chuyển skill từ Bun sang Go” tốn $3.51 và cần nhiều lần hỏi lại. Phần phân tích tradeoff sâu đòi hỏi model mạnh hơn. Tôi chạy session đó trên variant max vì lý do đó.

Tác vụ cần nhớ context dài giữa nhiều session. opencode không giống Claude Code ở cách quản lý memory. Mỗi session khá độc lập. Với dự án lớn cần context xuyên suốt nhiều ngày, Claude Code với CLAUDE.md và memory tốt hơn.

Variant nào nên dùng khi nào

Dữ liệu 431 session cho thấy pattern rõ:

default: cost trung bình $0.024/session. Dùng cho tác vụ đơn giản, câu hỏi nhanh, xem file, giải thích đoạn code. Đây là lựa chọn đầu tiên cho hầu hết việc hàng ngày.

high: cost trung bình $0.037/session, chiếm 62% số session của tôi. Dây là variant tôi để mặc định. Chất lượng tốt hơn default rõ rệt mà cost không tăng nhiều. Hợp cho coding task bình thường, review, refactor vừa phải.

none: cost trung bình $0.066/session. Tôi không chủ động chọn cái này, opencode dùng nó trong một số trường hợp nhất định. Cost cao hơn default nhưng không theo pattern rõ ràng.

max: cost trung bình $0.203/session, gấp 8 lần default. Chỉ dùng khi thật sự cần: phân tích sâu, quyết định tradeoff phức tạp, session dài cần độ chính xác cao. 45 session trong 18 ngày, hầu hết là công việc nặng.

Khi nào tôi chọn DeepSeek, khi nào chọn Haiku 4.5

Sau 18 ngày, đây là cách tôi phân chia:

Dùng DeepSeek V4 Flash khi:

Công việc lặp lại trên cùng project mà cache hit cao. Tôi thấy điều này rõ nhất ở ai-agent-solution với 112 session chỉ $1.50, tức $0.013/session vì cache hit chiếm phần lớn.

Volume cao, nhiều session nhỏ, cần giữ cost thấp. Đây là tác vụ search, explain, quick fix.

Context rất dài trong một request. DeepSeek V4 có context 1M token. Haiku 4.5 giới hạn 200K. Khi tôi cần nhét nguyên một repo nhỏ vào, đây là điểm khác biệt thực sự.

Không cần hệ sinh thái Claude Code chặt chẽ. opencode dùng DeepSeek API trực tiếp, không cần thêm layer nào.

Dùng Claude Haiku 4.5 (hoặc Sonnet/Opus trong Claude Code) khi:

Dữ liệu nhạy cảm. DeepSeek lưu trữ và xử lý dữ liệu tại Trung Quốc theo privacy policy của họ. Với source code nội bộ của client hoặc dự án có ràng buộc compliance, tôi không đưa vào DeepSeek.

Đang làm việc trong hệ sinh thái Claude Code: skills, CLAUDE.md, subagents, hooks. Haiku 4.5 trong Claude Code có lợi thế về tool use, memory, và workflow integration mà opencode chưa match được.

Task cần reasoning sâu mà tôi muốn dùng model Anthropic. Haiku 4.5 không phải flagship nhưng ở trong hệ sinh thái tốt hơn cho loại tác vụ này.

Cost thật so với ước tính

Một điều tôi thấy: dự đoán cost dựa trên giá input/output đơn thuần thường sai xa thực tế, vì bỏ qua cache.

Nếu tôi chỉ nhìn 14.2M input × $0.14/1M = $1.99 và 1.6M output × $0.28/1M = $0.45, tổng ước tính chỉ là $2.44. Nhưng tôi thực trả $22.41, gấp 9 lần.

Lý do: deepseek-v4-pro trong các variant high và max có giá khác với giá Flash cơ bản. opencode pricing cho high và max variant cao hơn giá API thẳng của DeepSeek. Tôi không tự gọi DeepSeek API, tôi đang đi qua opencode, và opencode có markup hoặc routing riêng.

Điều này quan trọng: nếu bạn dùng DeepSeek qua một tool như opencode, giá thực tế khác với giá bạn thấy trên trang DeepSeek. Luôn kiểm tra billing từ tool bạn đang dùng, không phải từ trang giá của model provider.

Tóm lại

18 ngày, $22.41, 431 session. Cost trung bình $0.052/session. 52% session nằm trong $0.01 đến $0.10. 6 session vượt $1.00, tất cả đều là tác vụ nặng có lý do.

Cache hit là yếu tố làm giá thật rẻ hơn nhiều so với giá niêm yết. 274 triệu token cache read với chỉ $0.0028/1M là chỗ DeepSeek thắng rất lớn so với Haiku 4.5 cho workflow lặp lại.

Chất lượng đủ dùng cho 80% tác vụ coding hàng ngày. Phần còn lại, đặc biệt là quyết định kiến trúc, debug phức tạp, và tác vụ cần hệ sinh thái Claude, tôi vẫn dùng Claude Code với Sonnet hoặc Opus.

Nếu bạn đang tìm model để chạy nhiều session nhỏ, lặp lại, cần cost thấp, và không có ràng buộc về data privacy với DeepSeek thì V4 Flash đáng thử nghiêm túc. Nếu bạn đang chọn model để nhúng vào product có dữ liệu người dùng hoặc code nội bộ client, đó là câu hỏi khác và giá không phải yếu tố duy nhất.