Tôi bắt đầu bài này từ một câu hỏi rất đời thường: có nên bỏ 50 đô mua MiniMax Max để test vài project coding, thêm video, voice, music không?
Nếu chỉ nhìn trang plan thì câu trả lời có vẻ dễ. Plus 20 đô, Max 50 đô, Ultra 120 đô. Max nằm giữa, nhìn giống lựa chọn hợp lý nhất. Nhưng MiniMax không chỉ có một cách tính tiền. Nó có ba hệ song song, và nếu nhầm hệ thì bạn sẽ mua sai rất nhanh.
Mọi con số dưới đây là snapshot ngày 09/06/2026. MiniMax đổi giá nhanh, nên trước khi bấm mua bạn vẫn phải tự verify lại trên dashboard.
Đừng nhầm ba cái ví tiền của MiniMax
MiniMax hiện có Token Plan, pay-as-you-go và Audio Subscription. Ba cái này trông giống cùng một sản phẩm, nhưng dùng cho ba nhịp rất khác nhau.
Token Plan là gói tháng hướng tới coding agent. Plus 20 đô một tháng cho khoảng 1.7 tỷ token, Max 50 đô cho khoảng 5.1 tỷ token, Ultra 120 đô cho khoảng 12.5 tỷ token. Quota này dùng chung cho text, image, voice và music. Video là giới hạn theo ngày: Plus không có video, Max có 3 video mỗi ngày, Ultra có 5 video mỗi ngày. Agent đồng thời cũng tăng theo gói: Plus khoảng 3 đến 4, Max 4 đến 5, Ultra 6 đến 7. FAQ có mùi fair-use và không hẳn dành cho production, nên tôi đọc nó như gói làm việc và thử nghiệm.
Pay-as-you-go thì khác. Bạn nạp balance rồi bị trừ theo đơn giá. M3 standard dưới hoặc bằng 512K context hiện là $0.60 cho 1 triệu input token, $2.40 cho 1 triệu output token, cache read $0.12. Tier 512K đến 1M gấp đôi: $1.20 input, $4.80 output, cache read $0.24. Mức nạp preset thấp nhất là 25 đô, nhưng bạn nên kiểm tra ô nạp tùy chọn nếu muốn bỏ ít hơn. Lưu ý quan trọng: promo M3 50% còn $0.30 và $1.20 đã hết hạn khoảng 08/06/2026, nên đừng lập ngân sách theo giá promo.
Audio Subscription lại là đường riêng cho TTS. Starter khoảng 5 đô một tháng, được 100,000 credits, value khoảng gấp đôi PAYG. Nếu việc chính là voice, đây mới là chỗ nên nhìn trước.
Vì sao tôi không nhìn mỗi con số 5.1B
Max ghi khoảng 5.1 tỷ token mỗi tháng. Nghe rất to. Nhưng với coding agent, con số to hay nhỏ phụ thuộc vào cache.
MiniMax M3 có prompt caching tự động, không cần truyền param, áp dụng cho call từ 512 token trở lên. Cache read là $0.12 cho 1 triệu token, rẻ gấp 5 lần input thường. Cache write miễn phí, khác Anthropic vì Anthropic tính tiền cache write.
Vấn đề là docs không nói rõ Token Plan subscription đếm cache read vào hồ 5.1B như thế nào. Nó trừ theo token thô, hay quy đổi theo giá rẻ kiểu một phần năm? Đây là biến quyết định Max đủ một tháng hay bay trong vài ngày.
Tôi lấy usage coding agent của chính mình trong khoảng một tháng để định cỡ. Tổng throughput khoảng 28 tỷ token mỗi tháng, nhưng 95% là cache read. Token mới thực sự chỉ khoảng 1.3 tỷ. Trung bình mỗi ngày khoảng 0.9 tỷ token throughput. Nếu Token Plan đếm cache read theo full token, gói Max 5.1B có thể cạn sau khoảng 6 ngày khi cày agentic 1M-context cả ngày. Nếu cache read được quy đổi rẻ hơn, câu chuyện dễ thở hơn nhiều, nhưng tôi chưa thấy docs xác nhận.
Tôi không lấy 28 tỷ ra để dọa ai. Phần lớn trong đó là context đọc lại. Nhưng tôi cũng không dám nhìn 5.1B rồi tự tin “dư sức”.
Plus 20 đô: mua khi bạn chỉ cần đưa M3 vào nhịp hằng ngày
Plus hợp với người muốn thử MiniMax M3 trong workflow thật nhưng không cần video. Bạn có khoảng 1.7 tỷ token mỗi tháng, 3 đến 4 agent đồng thời, và vẫn có image, voice, music dùng chung trong hồ token. Tôi nghĩ Plus ổn nếu bạn làm project vừa, dùng agent đều đặn chứ không thả nhiều agent cày cả ngày.
Nhưng Plus không có video. Nếu bạn đã biết mình muốn test Hailuo video, Plus loại ngay từ đầu. Video là cap riêng theo ngày, không phải token pool.
Max 50 đô: lựa chọn tôi nghiêng về cho đa số
Nếu hỏi tôi chọn gói nào để test nghiêm túc MiniMax trong tháng 6/2026, tôi chọn Max.
Lý do không phải vì Max có tỷ lệ đô trên token đẹp nhất, mà vì nó là tier rẻ nhất có video. 50 đô cho khoảng 5.1 tỷ token, 4 đến 5 agent đồng thời, có image, voice, music, và 3 video mỗi ngày. Với người muốn thử nhiều project, vừa coding vừa nghịch media, Max là gói ít bị cụt tay nhất.
Tôi thích Max cho kiểu dùng “một tháng kiểm chứng”: cắm vào Claude Code, Cursor hoặc OpenCode qua Token Plan, thử web_search qua MCP, chạy M3 với function calling hoặc JSON mode, rồi đem một hai workflow thật ra đo. M3 còn có BrowseComp 83.5, cao hơn Opus 4.7 ở mức 79.3 trong ghi chú research của tôi.
Điểm tôi sẽ không làm: dùng Max như production budget. FAQ fair-use, cache policy của subscription chưa rõ, và giá MiniMax đổi nhanh. Trong 6 ngày từ 03/06 đến 09/06, credits mua một lần đã giảm giá trị rõ rệt: gói 5 đô từ 6,000 xuống 5,000 credits, 25 đô từ 32,000 xuống 25,000, 100 đô từ 140,000 xuống 100,000. Tôi không muốn khóa kiến trúc sản phẩm vào một giả định billing chưa test.
Ultra 120 đô: chỉ đáng khi bạn thật sự cày nặng
Ultra cho khoảng 12.5 tỷ token mỗi tháng, 6 đến 7 agent đồng thời, codebase XL hoặc multi-project, và 5 video mỗi ngày. Đây không phải gói “mua cho chắc”. Nó hợp khi bạn làm việc cả ngày với nhiều agent, nhiều repo lớn, context dài, và thật sự bị Max bó lại.
Nếu bạn chưa từng đo usage của mình, nhảy thẳng Ultra là hơi sớm. Tôi sẽ mua Max trước, đọc billing, rồi mới quyết có cần 120 đô hay không.
Khi nào đừng mua Token Plan
Có hai trường hợp tôi sẽ né Token Plan.
Trường hợp đầu tiên là nhu cầu chính là voice hoặc TTS. Starter của Audio Subscription khoảng 5 đô một tháng cho 100,000 credits, rẻ hơn nhiều so với việc lấy quota Token Plan đi đọc voice. Token Plan dùng chung hồ cho text, image, voice, music. Nếu project của bạn là voice-first, hãy mua gói voice hoặc so thêm nhà khác, đừng bắt gói coding gánh chuyện đó.
Trường hợp thứ hai là production ổn định. Với production, tôi thích PAYG hơn vì đơn giá rõ, balance rõ, cache read có giá rõ. M3 standard là $0.60 input, $2.40 output, cache read $0.12. Dài hơn 512K thì gấp đôi. Tiền nạp vào là balance chứ không phải phí mất luôn. Chạy production mà dựa vào fair-use subscription thì tôi thấy không đáng.
Cách de-risk trước khi bỏ 50 đô
Nếu chưa chắc, cách rẻ nhất không phải là mua Plus. Cách rẻ nhất là mua 5 đô credits PAYG, chạy một project thật, rồi đọc billing.
Tôi muốn thấy fresh token và cache-hit. Nếu project cache tốt, Max có thể rất ổn. Nếu mỗi request đều mới, output dài, hoặc context cứ vượt tier, cảm giác “5.1B dư” sẽ biến mất rất nhanh.
Với tôi, câu trả lời ngắn là thế này: Plus nếu chỉ muốn đưa M3 vào workflow hằng ngày và không cần video. Max nếu muốn test nghiêm túc nhiều project, có cả video, voice, music. Ultra nếu bạn đã biết mình dùng nặng cả ngày, nhiều agent, nhiều codebase lớn, và Max không đủ. Còn nếu việc chính là voice, đừng mua Token Plan vì chữ “MiniMax” trên cùng một dashboard. Hãy mua đúng cái ví tiền của workload đó.