~ nghia-pham.dev _
$ blog $ series $ tags $ about
$ Esc
Type to search posts...

> ls ./blog/

324 posts

  • DeepSeek V4 Flash trong opencode: 18 ngày, 431 session, $22

    18 ngày, 431 session, $22.41 với DeepSeek V4 Flash qua opencode. Số liệu thật: cost theo variant, cache hit ratio, và khi nào nên dùng thay Haiku 4.5.

    Jun 11, 2026 · ~8 min read
    llmcostdeepseekclaudehaiku
  • DeepSeek V4 Pro trong thực tế: 18 ngày, 431 phiên, $22

    18 ngày dữ liệu thật từ opencode và hệ aas multi-agent: variant high/max/default, cache ratio 19:1, ba worker profile khác nhau, và khi nào DeepSeek V4 Pro thực sự đáng chọn hơn Claude.

    Jun 11, 2026 · ~6 min read
    llmdeepseekopencodeaascost
  • Agent View: phiên bản thứ ba của FleetView và những thứ đã thay đổi từ v2.1.169

    Từ v2.1.169 trở đi, Anthropic đổi tên FleetView thành Agent View, đi kèm là /rename, /color, agentic search trong /resume picker, và một loạt thứ nhỏ khác khiến workflow multi-session đọc được hơn. Bài này ghi lại những thứ đó theo thứ tự tôi nhận ra tác động của chúng.

    Jun 11, 2026 · ~8 min read
    claude-codeagent-viewfleet-viewworkflowmulti-agent
  • Chọn model Anthropic cho đúng: Fable 5, Opus 4.8, Sonnet 4.6, Haiku 4.5 và effort levels

    Bốn model đang dùng hằng ngày, năm effort levels, adaptive thinking, và cách tôi thực sự chọn model + effort khi ngồi vào một task cụ thể.

    Jun 11, 2026 · ~7 min read
    claude-codeanthropicmodeldeveloper-toolsworkflow
  • Chọn gói MiniMax nào: tôi nghiêng về Max, nhưng không phải ai cũng nên mua

    Snapshot 06/2026 về Plus, Max, Ultra, PAYG và Audio Subscription của MiniMax. Tôi chọn gói theo cách dùng thật: coding agent, video, voice và rủi ro quota.

    Jun 9, 2026 · ~6 min read
    minimaxapi-pricingcostai-codingsubscription
  • Xiaomi MiMo v2.5: tân binh China LLM đáng để thử

    Tôi review Xiaomi MiMo v2.5 qua góc nhìn thực dụng: context 1M, omnimodal, giá rẻ và phần benchmark cần đọc tỉnh táo.

    Jun 9, 2026 · ~6 min read
    llmchina-llmxiaomimimoapi-pricing
  • DeepSeek V4 Flash vs Claude Haiku 4.5: rẻ hơn chưa chắc là chọn được

    So sánh DeepSeek V4 Flash với Claude Haiku 4.5 theo giá, cache, context, output, reasoning, tool use, privacy, compliance, ecosystem và use case thực tế. Số liệu cập nhật tháng 06/2026.

    Jun 8, 2026 · ~10 min read
    llmapi-pricingcostdeepseekanthropic
  • FleetView từ session manager thành orchestration hub: những gì thay đổi từ v2.1.147 đến v2.1.168

    Ba tuần sau khi viết bài FleetView đầu, một loạt update đã đổi cách tôi dùng công cụ này hoàn toàn. Pinned sessions, dynamic workflows, shell session trong UI, done/total tracking cho batch agent. Bài này ghi lại những thay đổi đó, theo thứ tự tôi nhận ra tác động của chúng.

    Jun 8, 2026 · ~7 min read
    claude-codefleet-viewbackground-agentsworkflowmulti-agent
  • MCP OAuth 2.1: auth cho agent không giống login web app thường

    MCP remote server dùng OAuth 2.1, nhưng điểm khó không nằm ở nút login. Điểm khó là protected resource metadata, Client ID Metadata Document, resource indicator, scope theo tool, confused deputy và audit khi agent gọi nhiều server cùng lúc.

    Jun 8, 2026 · ~8 min read
    mcpoauthauthorizationagent-securityidentity
  • Hệ thống search xếp hạng kết quả thế nào

    Đi từ màn hình config của Cloudflare AI Search để giải mã từng keyword của một search engine hiện đại: chunking, hybrid search, RRF, reranking, query rewriting, similarity cache. Và cách một backend thật triển khai các cơ chế xếp hạng đó.

    Jun 7, 2026 · ~9 min read
    hybrid-searchrrfrerankingvector-searchrag
  • nf-infra-diagram: Infra Diagrams as Code With Official AWS Icons

    A Claude Code skill that renders infrastructure diagrams as Python code (mingrammer diagrams + Graphviz) with official AWS icons and OSS tech logos. Ships an idempotent environment setup, an import-verified node catalog, a class-name search script, and a render wrapper that absorbs the CWD-relative output gotcha. Plus the four design decisions that keep the model from drawing things it should not draw.

    Jun 6, 2026 · ~7 min read
    claude-codeaiclaude-code-toolkitskillsdiagrams
  • Giá API ảnh, video, TTS: MiniMax vs ByteDance, và mấy cái bẫy không giống bên text

    Tiếp bài so giá text LLM: lần này là multimodal. Ảnh lệch nhau 10 lần, video mỗi nhà bán một đơn vị, TTS tính theo ký tự và đếm cả dấu cách. Số liệu 06/2026, MiniMax vs ByteDance.

    Jun 5, 2026 · ~6 min read
    api-pricingcostminimaxbytedancetts
  • So sánh giá API LLM: DeepSeek, MiniMax, Doubao, Kimi và mấy cái bẫy khi tính tiền

    Một ngày ngồi tính giá API của bốn nhà LLM (số liệu 06/2026), và những cái bẫy khiến bảng giá niêm yết không phải con số bạn thực trả: promo, tiered context, cache, input/output, reseller.

    Jun 3, 2026 · ~8 min read
    llmapi-pricingcostdeepseekminimax
  • Flaky test không phải lỗi để agent bấm retry cho qua

    Bài 64 của series Vibe Coding có kiểm soát. Khi test lúc pass lúc fail, đừng để agent che flakiness bằng retry hoặc timeout dài hơn mà không tìm root cause.

    Jun 2, 2026 · ~3 min read
    vibe-codingtestingflaky-testsplaywrightqa
  • Background agent không được tự định nghĩa done

    Bài 63 của series Vibe Coding có kiểm soát. Agent chạy nền có thể tự nghiên cứu repo, sửa code và mở PR, nhưng definition of done vẫn phải do người giao việc đặt trước.

    Jun 2, 2026 · ~3 min read
    vibe-codingbackground-agentgithub-copilotworkflowreview
  • PR do AI viết vẫn là trách nhiệm của người bấm submit

    Bài 65 của series Vibe Coding có kiểm soát. AI có thể hỗ trợ viết code, nhưng người gửi PR vẫn phải đọc, hiểu, chịu trách nhiệm và không đẩy review debt sang maintainer.

    Jun 2, 2026 · ~3 min read
    vibe-codingpull-requestopen-sourcehuman-in-the-loopcode-review
  • Vibe coding là gì: làm app bằng cảm giác nhưng không giao não cho AI

    Bài 1 của series Vibe Coding có kiểm soát. Vibe coding là gì, khác no-code, autocomplete, pair programming và coding agent ra sao, và vì sao người dùng vẫn phải sở hữu product judgment, context, testing, security, rollback.

    May 29, 2026 · ~9 min read
    vibe-codingai-codingprototypeproductnon-tech
  • Claude Desktop cho local files: khi nào dùng Extensions, khi nào dùng web connector

    Bài 26 của series Vibe Coding có kiểm soát. Cách hiểu Claude Desktop, Desktop Extensions và remote connectors cho non-tech vibe coding: khi nào đọc file local, khi nào kết nối SaaS, vì sao phải giới hạn folder scope và debug ở đâu.

    May 29, 2026 · ~5 min read
    vibe-codingclaudeclaude-desktopdesktop-extensionsconnectors
  • Claude Projects cho vibe coding: gom context, quyết định, file mẫu vào một chỗ

    Bài 25 của series Vibe Coding có kiểm soát. Cách dùng Claude Projects để giữ context ổn định cho non-tech vibe coding: project instructions, project knowledge, decision log, RAG mode, new project vs new chat và handoff pack cho dev.

    May 29, 2026 · ~6 min read
    vibe-codingclaudeclaude-projectscontextnon-tech
  • Claude Artifacts cho người không code: từ ý tưởng tới app demo trong một buổi

    Bài 23 của series Vibe Coding có kiểm soát. Cách dùng Claude Artifacts để biến ý tưởng thành app demo an toàn cho người không code: bắt đầu từ workflow, test bằng mắt, sửa theo hành vi và biết giới hạn trước khi giao cho dev.

    May 29, 2026 · ~6 min read
    vibe-codingclaudeclaude-artifactsnon-techprototype
  • Build theo lát mỏng: mỗi vòng phải có thứ tự test được

    Bài 3 của series Vibe Coding có kiểm soát. Cách chia vibe-coded app thành các lát nhỏ visible, clickable, testable, reversible để tránh full-app prompt tạo review debt.

    May 29, 2026 · ~8 min read
    vibe-codingiterationprototypetestingproduct-workflow
  • Claude Desktop + filesystem MCP: cho Claude đọc project folder mà vẫn giữ ranh giới

    Bài 27 của series Vibe Coding có kiểm soát. Safety-first guide cho non-tech user khi cho Claude Desktop đọc project folder qua filesystem MCP hoặc Desktop Extension: folder lab, path scope, read-only trước, backup/Git trước khi write và debug logs.

    May 29, 2026 · ~6 min read
    vibe-codingclaudeclaude-desktopmcpfilesystem
  • Prompt app brief cho Claude Artifacts: nói business flow, không nói framework

    Bài 24 của series Vibe Coding có kiểm soát. Template app brief cho Claude Artifacts: user type, goal, inputs, outputs, states, constraints, sample data, mobile, accessibility và cách follow-up mà không làm Claude rewrite cả app.

    May 29, 2026 · ~6 min read
    vibe-codingclaudeclaude-artifactspromptapp-brief
  • Prompt đầu tiên: viết app brief để AI không build sai sản phẩm

    Bài 2 của series Vibe Coding có kiểm soát. Cách viết prompt đầu tiên như một app brief: audience, job-to-be-done, core flows, constraints, visual direction, defer list, do-not-change và ví dụ bad vs improved prompt.

    May 29, 2026 · ~8 min read
    vibe-codingpromptapp-briefproductprototype
  • Khi nào non-tech nên chuyển từ Claude Artifacts sang Claude Code

    Artifacts rất hợp để chứng minh workflow và UI. Claude Code chỉ nên bước vào khi prototype phải chạm repo thật, API thật, test thật, deployment thật.

    May 29, 2026 · ~6 min read
    vibe-codingclaude-codeclaudeartifactsnon-tech
  • Non-tech QA checklist cho Claude-built app: nhìn bằng mắt thường vẫn bắt được lỗi

    Bạn không cần Playwright hay Jest để bắt nhiều lỗi quan trọng. Dùng app như người thật, thử input xấu, mobile, loading, error, data thật/giả, privacy, rồi gửi screenshot feedback.

    May 29, 2026 · ~6 min read
    vibe-codingclaude-codeclaudeqanon-tech
  • Claude Code cho non-tech: plan mode, review diff, không cho sửa bừa

    Một workflow an toàn cho người không code khi dùng Claude Code: bắt đầu ở project root, yêu cầu overview, dùng plan mode, review diff, chạy test/build có sẵn, và không commit/push nếu chưa nói rõ.

    May 29, 2026 · ~6 min read
    vibe-codingclaude-codeclaudeplan-modenon-tech
  • Claude Desktop + Claude Code handoff: từ prototype artifact sang repo thật

    Một đường đi cụ thể cho non-tech: dựng artifact, gom screenshot và requirement, tổ chức handoff folder trong Claude Desktop, rồi dùng Claude Code map behavior vào repo thật.

    May 29, 2026 · ~6 min read
    vibe-codingclaude-codeclaudeclaude-desktopartifacts
  • Claude Code + MCP cho vibe coding: Figma, Jira, Drive, Slack chỉ khi có ranh giới

    MCP giúp Claude Code đọc tool và data source bên ngoài, nhưng non-tech chỉ nên bật khi có scope rõ, secret đúng chỗ, và approval boundary cho hành động có side effect.

    May 29, 2026 · ~6 min read
    vibe-codingclaude-codeclaudemcpfigma
  • OpenClaw vs Hermes: chọn gateway, chọn self-learning agent, hay chọn Codex/Cursor

    Vibe Coding có kiểm soát, bài 19. Chọn tool theo job: OpenClaw cho multi-channel gateway, Hermes cho CLI/gateway/skills, Codex/Cursor cho repo-aware workflow, Replit/Lovable/Bolt cho prototype.

    May 29, 2026 · ~5 min read
    vibe-codingopenclawhermescodexcursor
  • Local model cho vibe coding: Ollama, llama.cpp, model tool-call và timeout

    Vibe Coding có kiểm soát, bài 20. Local model là lựa chọn privacy/control, không tự động tốt hơn. Cách smoke test Ollama/llama.cpp, tool-call, timeout và agent loop trước khi cho write access.

    May 29, 2026 · ~5 min read
    vibe-codinglocal-llmollamallama-cpptool-call
  • Hermes với Nous Portal: một credential path gọn cho agent tools

    Vibe Coding có kiểm soát, bài 18. Dùng Nous Portal với Hermes Agent: setup portal, OAuth, SSH port-forward, portal status, Tool Gateway và ranh giới token store.

    May 29, 2026 · ~5 min read
    vibe-codinghermesnous-portaltool-gatewaysecurity
  • Case study: build một mini app bằng Hermes hoặc OpenClaw rồi audit như dev

    Vibe Coding có kiểm soát, bài 22. Một lab plan thực tế để build mini app bằng Hermes hoặc OpenClaw rồi audit như developer: setup fields, transcript summary, diff, UI, data, auth, tests và verdict.

    May 29, 2026 · ~5 min read
    vibe-codingopenclawhermescase-studyaudit
  • OpenClaw cho vibe coding qua điện thoại: Telegram, workspace, checkpoint

    Vibe Coding có kiểm soát, bài 16. Workflow dùng OpenClaw qua Telegram: disposable workspace, app brief nhỏ, checkpoint trước thay đổi rủi ro, gửi screenshot/error context và biết lúc nào phải dừng.

    May 29, 2026 · ~5 min read
    vibe-codingopenclawtelegramworkflowgit
  • Setup OpenClaw từ zero: một agent nhắn qua Telegram nhưng không được phá máy

    Vibe Coding có kiểm soát, bài 15. Setup OpenClaw theo hướng an toàn: local hay VPS, workspace đầu tiên, provider key, Telegram channel, permission boundary và smoke test bằng toy repo.

    May 29, 2026 · ~6 min read
    vibe-codingopenclawself-hosttelegramsecurity
  • Setup Hermes Agent: CLI trước, gateway sau, skill sau cùng

    Vibe Coding có kiểm soát, bài 17. Cách tiếp cận Hermes Agent cho người mới: chạy CLI trước, chọn provider/model, hiểu approvals/tools, rồi mới bật gateway và skills.

    May 29, 2026 · ~5 min read
    vibe-codinghermesnous-researchcliskills
  • Harden một agent workstation: .local, secrets, allowed tools, throwaway repo

    Vibe Coding có kiểm soát, bài 21. Checklist hardening trước khi cho OpenClaw, Hermes, Codex hoặc local agent sửa file: throwaway repo, secrets boundary, approval gates, logs và cleanup.

    May 29, 2026 · ~5 min read
    vibe-codingsecurityagent-workstationsecretsopenclaw
  • Chọn tool: Replit, Lovable, Bolt, Cursor, Codex hay GitHub Copilot cloud agent

    Bài 5 của series Vibe Coding có kiểm soát. Cách chọn tool theo workflow thay vì ranking: prompt-to-app prototype, repo-aware coding, issue-to-PR agent, review gate, sandbox, rollback và ownership.

    May 29, 2026 · ~7 min read
    vibe-codingtoolsreplitlovablebolt
  • Vibe Coding có kiểm soát, bài 11: chi phí và giới hạn

    Vì sao agent chạy lâu không tự động tốt hơn: cost, retry loop, context lớn, dấu hiệu kẹt, stop condition, budget cap và cách chia task nhỏ.

    May 29, 2026 · ~6 min read
    vibe-codingcostcontextagentsworkflow
  • Vibe Coding có kiểm soát, bài 13: case study booking app nhỏ

    Walkthrough thực tế giả lập cách build booking app nhỏ bằng vibe coding có kiểm soát: brief, slices, validation, admin view, CSV export, test và handoff.

    May 29, 2026 · ~7 min read
    vibe-codingcase-studybookingprototypeworkflow
  • Real data, auth, API: đoạn vibe coding dễ tự lừa mình nhất

    Bài 6 của series Vibe Coding có kiểm soát. Cách phân biệt mock và real API, kiểm auth/roles/permissions/data ownership, xử lý secrets/env/rate limit/error state, và prompt an toàn để thay mock bằng endpoint thật.

    May 29, 2026 · ~7 min read
    vibe-codingapiauthsecurityreal-data
  • Vibe Coding có kiểm soát, bài 10: từ prototype sang repo sống được

    Khi nào một prototype vibe-coded nên thành repo thật: structure, dead code, tests, setup docs, deploy docs, owner và phần nên rewrite thủ công.

    May 29, 2026 · ~7 min read
    vibe-codingprototypetestingdeploysoftware-engineering
  • Vibe Coding có kiểm soát, bài 14: anti-pattern checklist

    20 anti-pattern khiến vibe coding thành nợ kỹ thuật: prompt quá lớn, tin plan mù, quên mobile, mock data, secret, auth/database change, không rollback và không owner.

    May 29, 2026 · ~6 min read
    vibe-codinganti-patternchecklisttechnical-debtreview
  • Vibe Coding có kiểm soát, bài 8: review code vibe-coded

    Cách review code do vibe coding tạo ra: đọc diff, dependency, secrets, migration, permission, network call và biết lúc nào cần dev review.

    May 29, 2026 · ~7 min read
    vibe-codingcode-reviewsecuritydatabasesoftware-engineering
  • Vibe Coding có kiểm soát, bài 9: checkpoint, Git, rollback

    Cách giữ điểm quay lại khi vibe coding: checkpoint, Git known-good state, branch trước thay đổi rủi ro, rollback hay fix forward và prompt revert rõ ràng.

    May 29, 2026 · ~6 min read
    vibe-codinggitrollbackcheckpointworkflow
  • Review UI như người dùng: mobile, empty state, loading, error, broken flow

    Bài 7 của series Vibe Coding có kiểm soát. Checklist review UI cho vibe-coded app: main flow, mobile, keyboard, empty/loading/error, requested vs actual, unrelated changes và feedback bằng screenshot.

    May 29, 2026 · ~8 min read
    vibe-codingui-reviewtestinguxnon-tech
  • Vibe Coding có kiểm soát, bài 12: security checklist

    Checklist security cho vibe coding: sandbox, approval policy, network access, secrets, destructive actions, logs, prompt data và kiểm tra tối thiểu trước khi public.

    May 29, 2026 · ~6 min read
    vibe-codingsecuritysandboxsecretschecklist
  • Context pack cho vibe coding: screenshot, mockup, data, rules, edge case

    Bài 4 của series Vibe Coding có kiểm soát. Cách chuẩn bị context pack gồm screenshot, sketch, sample data, API docs, brand notes, repo rules, edge case và handoff để AI không tự invent requirement.

    May 29, 2026 · ~7 min read
    vibe-codingcontextprototypedocumentationai-workflow
  • Database và migration trong vibe coding: schema không phải chỗ để đoán

    Bài 35 của series Vibe Coding có kiểm soát. Cách non-tech kiểm soát database khi AI build app: branch, migration, seed data, preview credential, rollback và những câu phải hỏi trước khi đổi schema.

    May 29, 2026 · ~4 min read
    vibe-codingdatabasemigrationsupabaseschema
  • Sau deploy vibe-coded app: logs, analytics, error tracking, và khi nào phải rollback

    Bài 36 của series Vibe Coding có kiểm soát. Checklist vận hành sau deploy: analytics, runtime logs, Sentry-style error tracking, release tag, alert, user report và rollback decision.

    May 29, 2026 · ~4 min read
    vibe-codingobservabilitylogsanalyticssentry
  • Browser QA cho vibe coding: dùng Playwright như máy quay lỗi, không phải test suite phức tạp

    Bài 33 của series Vibe Coding có kiểm soát. Cách non-tech dùng Playwright codegen, trace viewer, screenshot và test case nhỏ để audit app AI build trước khi giao dev.

    May 29, 2026 · ~4 min read
    vibe-codingplaywrightbrowserqanon-tech
  • Preview deploy cho vibe coding: đừng để bản thử nghiệm nói chuyện với production

    Bài 34 của series Vibe Coding có kiểm soát. Cách dùng preview deployment, environment variables, branch build, rollback và domain boundary để app AI-built không chạm production quá sớm.

    May 29, 2026 · ~4 min read
    vibe-codingdeploypreviewenvironmentrollback
  • Demo đẹp nhất thường là demo nguy hiểm nhất

    Bài 38 của series Vibe Coding có kiểm soát. Một demo vibe-coded càng mượt càng dễ che mất mock data, fake auth, broken flow, missing state và quyết định chưa được kiểm chứng.

    May 29, 2026 · ~5 min read
    vibe-codingdemoproductprototypereview
  • Ảo tưởng vibe coding: app chạy được không có nghĩa là software

    Bài 37 của series Vibe Coding có kiểm soát. Vì sao một app vibe-coded chạy được trong demo vẫn có thể chưa có dữ liệu thật, auth thật, rollback, ownership và trách nhiệm vận hành.

    May 29, 2026 · ~5 min read
    vibe-codingsoftwareprototyperisknon-tech
  • AI build app rất nhanh, nhưng nó cũng bịa niềm tin rất nhanh

    Bài 41 của series Vibe Coding có kiểm soát. Cách AI tạo cảm giác chắc chắn giả trong vibe coding: plan đẹp, test rỗng, summary quá tự tin, fallback che lỗi và claim production-ready.

    May 29, 2026 · ~4 min read
    vibe-codingaihallucinationtestingreview
  • Vibe coding không biến bạn thành engineer, nó chỉ tăng tốc feedback loop

    Bài 39 của series Vibe Coding có kiểm soát. Một bài nói thẳng về ranh giới giữa prompt được app và hiểu engineering: scope, trade-off, debugging, ownership và review.

    May 29, 2026 · ~4 min read
    vibe-codingengineeringnon-techfeedback-loopownership
  • Non-tech vibe coding: thứ bạn không hiểu là thứ sẽ làm bạn trả giá

    Bài 40 của series Vibe Coding có kiểm soát. Các vùng non-tech thường bỏ qua khi AI build app: auth, billing, database, secrets, permissions, deploy và dependency.

    May 29, 2026 · ~5 min read
    vibe-codingnon-techrisksecurityownership
  • Auth bypass: lỗi một dòng biến app vibe-coded thành public database

    Bài 44 của series Vibe Coding có kiểm soát. Login screen không phải auth. Bài này chỉ ra vì sao authorization, ownership check, backend enforcement và database policy mới là ranh giới thật.

    May 29, 2026 · ~4 min read
    vibe-codingauthauthorizationsecuritydatabase
  • Khi AI nói "test pass" nhưng đang bịa niềm tin

    Bài 42 của series Vibe Coding có kiểm soát. Từ incident Replit/SaaStr tới bài học cho non-tech: summary không phải evidence, fake data che bug, và test pass phải có command output.

    May 29, 2026 · ~5 min read
    vibe-codingtestingfake-datareplitaudit
  • Nhân viên vibe-code internal tool, công ty leak data lúc nào không biết

    Bài 43 của series Vibe Coding có kiểm soát. Shadow AI app là rủi ro mới: internal tool build quá nhanh, public nhầm, upload dữ liệu nhạy cảm, và không ai trong security biết để kiểm soát.

    May 29, 2026 · ~4 min read
    vibe-codingshadow-aiprivacysecurityinternal-tools
  • Gần một nửa AI code có lỗi security: đừng hoảng, hãy đặt gate

    Bài 47 của series Vibe Coding có kiểm soát. Dùng các benchmark AI-generated code security như tín hiệu để thiết kế review gate: SAST, dependency scan, auth test, secret scan và production bar.

    May 29, 2026 · ~3 min read
    vibe-codingsecuritybenchmarkveracodereview
  • AI không phát minh bug mới, nó lặp lại bug cũ ở tốc độ mới

    Bài 45 của series Vibe Coding có kiểm soát. Vibe-coded app thường hỏng ở các lỗi web security rất cũ: broken access control, client-side trust, missing rate limit, fallback secret và OAuth/WebSocket auth.

    May 29, 2026 · ~4 min read
    vibe-codingsecurityowaspauthrate-limit
  • "Please make it secure" không phải security plan

    Bài 46 của series Vibe Coding có kiểm soát. Một prompt bảo AI làm app secure không thay thế deterministic controls: sandbox, permission, secret scan, database isolation, review gate và deploy policy.

    May 29, 2026 · ~4 min read
    vibe-codingsecuritypromptncscguardrails
  • Cảm giác nhanh hơn không đồng nghĩa làm nhanh hơn

    Bài 49 của series Vibe Coding có kiểm soát. AI coding có thể tạo cảm giác tiến rất nhanh, nhưng review, chờ agent, sửa sai và hiểu lại code có thể ăn hết phần lợi đó.

    May 29, 2026 · ~4 min read
    vibe-codingproductivitymetrreviewworkflow
  • Vibe coding gửi hóa đơn cho open-source maintainers

    Bài 50 của series Vibe Coding có kiểm soát. AI giúp nhiều người dùng thư viện open source nhanh hơn, nhưng bug report mơ hồ, dependency abuse và thiếu feedback có thể đẩy chi phí sang maintainers.

    May 29, 2026 · ~4 min read
    vibe-codingopen-sourcemaintenancedependencyreview
  • Supabase anon key không nguy hiểm, thiếu RLS mới nguy hiểm

    Bài 48 của series Vibe Coding có kiểm soát. Public key trong frontend chưa chắc là leak. Với Supabase-style app, lỗi thật thường là database table không bật Row Level Security và policy sai.

    May 29, 2026 · ~4 min read
    vibe-codingsupabaserlsdatabasesecurity
  • Biết AI có rủi ro không đủ, phải biết verify

    Bài 52 của series Vibe Coding có kiểm soát. Khoảng cách thật không phải awareness, mà là kỹ năng verify: click test, second-user test, log test, diff test và claim classification.

    May 29, 2026 · ~3 min read
    vibe-codingverificationqanon-techreview
  • Không chỉ code sai: AI toolchain cũng có thể ship nhầm thứ không nên ship

    Bài 53 của series Vibe Coding có kiểm soát. Build artifacts như source maps, debug files, local configs và generated bundles cũng cần review trước deploy.

    May 29, 2026 · ~3 min read
    vibe-codingbuildsource-mapdeploysecurity
  • Bug nguy hiểm nhất của vibe coding là bug không crash

    Bài 51 của series Vibe Coding có kiểm soát. Code AI-generated có thể chạy đúng cú pháp nhưng sai nghiệp vụ, sai công thức, thiếu biến và tạo cảm giác an toàn giả.

    May 29, 2026 · ~4 min read
    vibe-codingsilent-failureverificationriskdomain
  • Agent không nguy hiểm vì thông minh, nó nguy hiểm vì được cấp quyền quá rộng

    Bài 56 của series Vibe Coding có kiểm soát. Coding agent có thể đọc file, chạy command, gọi network và deploy. Rủi ro thật nằm ở blast radius, không phải chỉ ở model quality.

    May 29, 2026 · ~3 min read
    vibe-codingagent-securitypermissionssandboxblast-radius
  • AI bịa package, attacker đăng ký package đó, app của bạn tự cài malware

    Bài 54 của series Vibe Coding có kiểm soát. Slopsquatting biến hallucinated dependency thành supply-chain risk: package nghe hợp lý nhưng không tồn tại cho tới khi kẻ xấu đăng ký nó.

    May 29, 2026 · ~3 min read
    vibe-codingslopsquattingdependencysupply-chainsecurity
  • Với coding agent, tài liệu cũng có thể biến thành lệnh

    Bài 55 của series Vibe Coding có kiểm soát. Prompt injection không chỉ nằm trong chatbot. Coding agents đọc README, issue, schema, docs, MCP tools và có thể biến text độc thành action thật.

    May 29, 2026 · ~3 min read
    vibe-codingprompt-injectionmcpcoding-agentsecurity
  • AI bug report slop: khi maintainer mất ngày để bác bỏ lỗi không tồn tại

    Bài 59 của series Vibe Coding có kiểm soát. AI có thể tạo bug report nghe chuyên nghiệp nhưng sai hàm, sai version, sai changelog, hoặc không reproduce được.

    May 29, 2026 · ~3 min read
    vibe-codingbug-reportai-slopopen-sourcemaintenance
  • AI viết code không làm license tự biến mất

    Bài 58 của series Vibe Coding có kiểm soát. Vibe-coded code vẫn cần provenance, license review, SBOM, human responsibility và policy rõ ràng trước khi đưa vào sản phẩm.

    May 29, 2026 · ~3 min read
    vibe-codinglicenseprovenanceopen-sourcecompliance
  • PR comment không phải chỗ an toàn để cho agent cầm secret

    Bài 57 của series Vibe Coding có kiểm soát. AI review bot chạy trong GitHub Actions có thể đọc comment độc, bị prompt injection, rồi leak secret nếu workflow cấp quyền quá rộng.

    May 29, 2026 · ~3 min read
    vibe-codinggithub-actionsprompt-injectionsecretscode-review
  • Code AI sinh ra không tự có người bảo trì

    Bài 61 của series Vibe Coding có kiểm soát. AI có thể tạo feature nhanh, nhưng maintenance debt vẫn nằm lại trong repo và con người vẫn phải trả.

    May 29, 2026 · ~3 min read
    vibe-codingtechnical-debtmaintenanceai-codingcode-quality
  • Cài MCP lạ là cho agent thêm tay, không phải thêm tiện ích

    Bài 60 của series Vibe Coding có kiểm soát. MCP server nối agent với tool, file, API và process thật. Cài bừa nghĩa là mở thêm đường chạy lệnh.

    May 29, 2026 · ~3 min read
    vibe-codingmcpagent-securitytool-usesupply-chain
  • Nếu prompt không nhắc security, AI sẽ coi security là việc để sau

    Bài 62 của series Vibe Coding có kiểm soát. AI coding làm security dễ bị đẩy từ lúc thiết kế sang lúc review, nghĩa là lỗi đã nằm trong diff rồi mới được nhớ tới.

    May 29, 2026 · ~3 min read
    vibe-codingsecuritysecure-codingpromptreview
  • AI Coding thực chiến, bài 12: deploy pipeline không được mơ hồ

    Field guide thiết kế deploy pipeline khi dùng AI coding hằng ngày: preview URL, deploy window, smoke test, rollback point, ownership và log bằng chứng.

    May 25, 2026 · ~8 min read
    ai-codingdeploypipelinesmoke-testrollback
  • AI Coding thực chiến, bài 13: rollback và incident khi code đã ra production

    Cách xử lý rollback và incident trong workflow AI coding: nhận tín hiệu, freeze scope, chọn rollback, ghi timeline, dùng AI để đọc log nhưng không để AI tự phá production.

    May 25, 2026 · ~7 min read
    ai-codingrollbackincidentproductionops
  • AI Coding thực chiến, bài 14: case study ship một feature end-to-end

    Một case study thực dụng về cách dùng AI coding để ship feature từ ticket tới deploy: scope, đọc code, contract, implementation, review, preview, smoke test và handoff.

    May 25, 2026 · ~7 min read
    ai-codingcase-studyfeatureend-to-endreview
  • AI Coding thực chiến, bài 15: anti-pattern checklist trước khi ship

    Checklist anti-pattern khi dùng AI coding để ship code hằng ngày: scope creep, mock data, endpoint bịa, diff quá rộng, test rỗng, deploy mù và incident không timeline.

    May 25, 2026 · ~8 min read
    ai-codingchecklistanti-patternreviewdeploy
  • AI Coding thực chiến, bài 2: viết task brief để ship đúng việc

    Bài 2 của series AI Coding thực chiến. Cách viết task brief/spec cho AI coding: problem, scope, constraints, acceptance criteria, validation, non-goals và handoff đủ rõ để agent không tự đoán.

    May 25, 2026 · ~7 min read
    ai-codingtask-briefspecdeveloper-workflowrequirements
  • AI Coding thực chiến, bài 4: chia việc cho nhiều agent

    Field guide để chia task AI coding cho nhiều agent: cắt scope theo file ownership, giữ rollback point, tránh đè diff của nhau, và biết lúc nào không nên song song hóa.

    May 25, 2026 · ~7 min read
    ai-codingagent-workflowgitworkflowsoftware-engineering
  • AI Coding thực chiến, bài 5: review code AI viết

    Cách review diff do AI viết: đọc file list trước, kiểm contract, tìm behavior drift, bắt mock data, debug log, over-engineering, và chỉ tin test khi test đúng lớp rủi ro.

    May 25, 2026 · ~6 min read
    ai-codingcode-reviewdiff-reviewtestingsoftware-engineering
  • AI Coding thực chiến, bài 7: debug khi agent sửa sai

    Cách xử lý khi AI coding đi sai hướng: dừng mở rộng diff, khoanh vùng file, đọc log thật, tạo rollback point, sửa prompt, và quyết định revert hay patch tiếp.

    May 25, 2026 · ~7 min read
    ai-codingdebuggingincident-responsegitworkflow
  • AI Coding thực chiến, bài 8: branch, commit, PR

    Git workflow khi dùng AI coding hằng ngày: chia branch, giữ diff nhỏ, commit có ý nghĩa, review PR như review đồng đội thật.

    May 25, 2026 · ~7 min read
    ai-codinggitpull-requestworkflowdeveloper-tools
  • AI Coding thực chiến, bài 11: budget cho context, cost, time

    Cách quản lý context, token cost, thời gian chạy tool, và scope khi dùng AI coding nhiều giờ trong repo thật.

    May 25, 2026 · ~7 min read
    ai-codingcontextcostworkflowdeveloper-tools
  • AI Coding thực chiến, bài 3: context pack, docs, memory, tracker

    Bài 3 của series AI Coding thực chiến. Cách chuẩn bị context pack gồm docs, memory, tracker, repo map và evidence để AI coding worker bắt đầu đúng chỗ, giữ tiến độ và không lặp lại lỗi cũ.

    May 25, 2026 · ~7 min read
    ai-codingcontextdocumentationmemorydeveloper-workflow
  • AI Coding thực chiến: từ task tới deploy

    Series field guide về cách dùng AI coding để ship code hằng ngày: setup repo, viết task brief, chuẩn bị context, review diff, test, CI, deploy và vận hành sau merge.

    May 25, 2026 · ~5 min read
    ai-codingdeveloper-workflowsoftware-engineeringseriesfield-guide
  • AI Coding thực chiến, bài 1: setup repo để agent không phá code

    Bài 1 của series AI Coding thực chiến. Cách chuẩn bị repo, rule, file ownership, test command và guardrail để agent có thể sửa code mà không vượt scope hoặc làm bẩn working tree.

    May 25, 2026 · ~7 min read
    ai-codinggitdeveloper-workflowcode-reviewsafety
  • AI Coding thực chiến, bài 10: safety khi dùng MCP, tools, API

    Dùng MCP và tool integration trong AI coding mà không biến agent thành script phá production: quyền hạn, dry-run, allowlist, audit log, và điểm dừng.

    May 25, 2026 · ~6 min read
    ai-codingmcptoolsapisafety
  • AI Coding thực chiến, bài 6: test strategy khi AI viết code

    Cách chọn test cho code AI viết: bắt contract trước, regression case sau, tránh mock sai lớp, dùng build/lint như guardrail, và không biến test thành nghi lễ.

    May 25, 2026 · ~6 min read
    ai-codingtest-strategyregressioncontract-testingsoftware-engineering
  • AI Coding thực chiến, bài 9: tracker JSON và progress loop

    Cách dùng tracker JSON để chia việc cho nhiều agent, tránh trùng scope, resume đúng chỗ, và biến progress thành dữ liệu kiểm chứng được.

    May 25, 2026 · ~6 min read
    ai-codingagentsjsonworkflowprogress-tracking
  • AI cho người không code: đọc series này thế nào

    Bài mở đầu series AI cho người không code, A-Z. Viết cho người dùng bình thường: gia đình, đồng nghiệp văn phòng, phụ huynh, sinh viên, và bất kỳ ai muốn hiểu AI mà không cần học lập trình.

    May 23, 2026 · ~5 min read
    ai-cho-nguoi-khong-codenon-techtutorialvietnameseai-101
  • Mở khóa /workflows: từ env CLAUDE_CODE_WORKFLOWS đến 10 multi-agent flow

    Từ v2.1.150, Claude Code gate slash /workflows sau env CLAUDE_CODE_WORKFLOWS=1. Bật xong, có 10 bundled flow (implement, bugfix, bughunt, dashboard, docs, plan-hunter, review-branch...) chạy multi-agent end-to-end và tự mở PR. Bài này deep-dive binary để xem cơ chế gate, liệt kê từng flow, kèm cú pháp gọi và gotcha hay dính.

    May 23, 2026 · ~8 min read
    claude-codeworkflowautomationmulti-agenttutorial
  • AI cho người không code, bài I: viết email và content

    Bài I. Bốn dạng email AI giúp được, cách prime tone bằng email cũ, viết caption và mô tả sản phẩm, lỗi sai tên ngày, khi nào không nên nhờ AI.

    May 22, 2026 · ~12 min read
    ai-cho-nguoi-khong-codeemailwritingnon-techtutorial
  • AI cho người không code, bài J: tóm tắt PDF dài, sách, báo cáo

    Bài J. Cách dùng ChatGPT, Claude, NotebookLM để tóm tắt PDF 80 trang, annual report, sách giáo trình. Prompt 3 lớp, chia chunk, OCR PDF scan, khi nào không nên upload.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codepdftom-tatnon-techtutorial
  • AI cho người không code, bài K: ghi chú họp và action items

    Bài K. Record meeting, transcript, prompt 4 phần (TL;DR, decisions, action items, open questions). Templates cho daily standup, 1-on-1, board update, client demo. Khi nào KHÔNG dùng AI (NDA, M&A, sa thải).

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codemeetingproductivitynon-techtutorial
  • AI cho người không code, bài L: Excel và Google Sheet với AI

    Bài L. Cách dùng AI để viết công thức, làm pivot, dọn dữ liệu trong Excel và Google Sheet. Hai workflow: AI viết công thức bạn gõ vào, hoặc AI làm hộ end-to-end. Bao gồm cả cảnh báo về privacy và limit file size.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codeexcelgoogle-sheetnon-techtutorial
  • AI cho người không code, bài M: slide thuyết trình với AI

    Bài M. So sánh 5 tool sinh slide (Gamma, Presentations.AI, Beautiful.AI, Google Slides + Gemini, Microsoft Copilot), quy trình 3 bước outline + sinh + edit, mẹo tránh deck nhìn như AI sinh, khi nào KHÔNG nên dùng AI.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codeslidepresentationnon-techtutorial
  • AI cho người không code, bài N: dịch thuật chuyên nghiệp với AI

    Bài N. Vì sao AI dịch vẫn miss, quy trình MTPE 3 bước, so sánh Google Translate vs DeepL vs ChatGPT/Claude, khi nào nên dùng và khi nào tuyệt đối không.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codedich-thuattranslationnon-techtutorial
  • AI cho người không code, bài O: one-day research với AI

    Bài O. Khi bạn có 4 tiếng để ra một quyết định lớn (đầu tư, mua xe, đổi job, chọn trường cho con). Cách dùng Deep Research của ChatGPT, Perplexity, Gemini, Claude để gói research nhiều ngày thành một buổi sáng, kèm khung prompt, khung output, và checklist verify.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-coderesearchdeep-researchnon-techtutorial
  • AI cho người không code, bài P: phát triển kỹ năng mới cùng AI

    Bài P. Học guitar, photography, nấu Thái, video editing từ zero với AI làm tutor 1-1. Workflow 30/60/90 ngày, feedback audio và ảnh, chỗ AI thua người thật.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codelearningskillnon-techtutorial
  • AI cho người không code, bài Q: quẩy du lịch cùng AI

    Bài Q. Dùng AI lên kế hoạch chuyến tự túc, từ itinerary nháp tới gợi ý food local, dịch tại chỗ, đổi tiền, hỏi luật. AI giỏi gì, dở gì, và một lần tôi đi xa 5 cây số chỉ để ăn quán đã đóng cửa.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codedu-lichtravelnon-techtutorial
  • AI cho người không code, bài R: rèn sức khoẻ với AI, ranh giới với bác sĩ

    Bài R. AI làm được gì cho sức khoẻ (meal plan, nhật ký triệu chứng, decode lab values) và làm KHÔNG được gì (chẩn đoán, kê đơn, trị liệu tâm thần). Ranh giới cứng, mẹo prompt, lúc nào phải đi bác sĩ thật.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codesuc-khoehealthnon-techtutorial
  • AI cho người không code, bài T: học và dùng tiếng Anh với AI

    Bài T. Cách dùng AI làm tutor tiếng Anh 24/7: speaking partner, grammar fix, IELTS writing feedback, business email. Mẹo prime AI sửa nghiêm, quy trình 30 phút mỗi sáng, lúc nào AI sai.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codetieng-anhenglishnon-techtutorial
  • AI cho người không code, bài S: sổ chi tiêu và đầu tư cơ bản với AI

    Bài S. Export sao kê ngân hàng, nhờ AI phân loại chi tiêu, ước tính lương net, hiểu stock vs ETF vs trái phiếu. Ranh giới cứng: AI không đưa khuyến nghị mã cụ thể, không thay luật sư hay kế toán.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codetai-chinhchi-tieunon-techtutorial
  • AI cho người không code, bài U: ươm con, AI giúp con học mà không hỏng

    Bài U. Dùng AI cho con học sao cho có ích mà không phụ thuộc. Giải bài, luyện tiếng Anh, đọc cùng con. Ranh giới đỏ, cảnh báo sycophancy, parental controls, ngưỡng tuổi.

    May 22, 2026 · ~13 min read
    ai-cho-nguoi-khong-codecon-caieducationnon-techtutorial
  • AI cho người không code, bài V: vai trò người lắng nghe, AI có coach được không

    Bài V. AI lắng nghe lúc 1h sáng có thật sự giúp, hay nó chỉ nịnh. Workflow CBT-light, ranh giới với therapy thật, cảnh báo sycophancy, và khi nào bắt buộc phải gặp chuyên gia.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codetam-lymental-healthnon-techtutorial
  • AI cho người không code, bài W: Wifi, privacy, dữ liệu nào không nên đưa AI

    Bài W. Wifi công cộng + AI app rủi ro gì, opt-out training ở ChatGPT/Claude/Gemini, danh sách dữ liệu cứng không bao giờ paste, mẹo redact mini, nguyên tắc 'ai khác nghe được câu này không lo'.

    May 22, 2026 · ~14 min read
    ai-cho-nguoi-khong-codeprivacysecuritynon-techtutorial
  • AI cho người không code, bài X: xác minh deepfake, ảnh AI, voice clone

    Bài X. Vụ Hong Kong 25 triệu USD do video call deepfake. Cách nhận biết deepfake bằng mắt thường, dấu hiệu ảnh AI, voice clone, và quy trình bắt buộc khi nhận tin nhắn lạ yêu cầu chuyển tiền.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codedeepfakesecuritynon-techtutorial
  • AI cho người không code, bài Y: những yêu cầu KHÔNG nên dùng AI

    Bài Y. Stop sign cho cả series. Bảy nhóm tình huống AI không nên đụng vào: pháp lý ràng buộc, y tế, tài chính cá nhân, học hành cao cấp, hire/fire, quan hệ riêng, khẩn cấp. Nguyên tắc quyết định khi nào AI là bonus, khi nào là tự lừa.

    May 22, 2026 · ~13 min read
    ai-cho-nguoi-khong-codekhong-nenlimitnon-techtutorial
  • AI cho người không code, bài Z: zero panic, AI có thay nghề bạn không

    Bài Z, bài cuối series A-Z. Một năm qua tôi bị hỏi 30 lần câu này. Framework chia nghề thành 3 lớp, lịch sử automation từ Excel tới Photoshop, lời khuyên cho 4 nhóm tuổi, khi nào nên panic thật, và nỗi sợ tôi giấu trong tủ riêng.

    May 22, 2026 · ~15 min read
    ai-cho-nguoi-khong-codecareertuong-lai-nghe-nghiepnon-techtutorial
  • CLAUDE_CODE_SUBPROCESS_ENV_SCRUB: Khi Claude Code tự vá credentials leak qua subprocess

    Phân tích flag CLAUDE_CODE_SUBPROCESS_ENV_SCRUB trong Claude Code (introduced v2.1.83): cơ chế strip credentials Anthropic + cloud providers khỏi subprocess env, subprocess sandboxing PID namespace trên Linux, side-effect ép permission mode về default, và khi nào nên bật hay tắt.

    May 21, 2026 · ~10 min read
    claude-codesecurityenv-varsclisubprocess
  • AI cho người không code, bài A: AI là gì (đúng cách)

    Bài A series 'AI cho người không code'. AI là gì theo cách hiểu đúng cho người không tech: không phải robot có cảm xúc, không phải Google nâng cấp. Câu chuyện dễ hiểu cho dân văn phòng, phụ huynh, sinh viên.

    May 21, 2026 · ~9 min read
    ai-cho-nguoi-khong-codeai-101non-techtutorialvietnamese
  • AI cho người không code, bài B: bộ não của AI hoạt động ra sao

    Bài B. Cách LLM 'dự đoán chữ tiếp theo' giải thích bằng ngôn ngữ thường ngày, không jargon.

    May 21, 2026 · ~9 min read
    ai-cho-nguoi-khong-codeai-101non-techtutorialvietnamese
  • AI cho người không code, bài C: ChatGPT vs Claude vs Gemini, chọn cái nào

    Bài C. So sánh 3 chatbot AI phổ biến cho người dùng cuối: ChatGPT, Claude, Gemini. Giá, tính năng, điểm mạnh, khi nào dùng cái nào.

    May 21, 2026 · ~11 min read
    ai-cho-nguoi-khong-codechatgptclaudegemininon-tech
  • AI cho người không code, bài D: dạy AI bằng prompt, cách 'ra lệnh' cho AI hiểu

    Bài D. Prompt là gì, cách viết prompt để AI hiểu đúng ý. 5 nguyên tắc cơ bản kèm ví dụ cho dân văn phòng.

    May 21, 2026 · ~9 min read
    ai-cho-nguoi-khong-codeprompt-engineeringnon-techtutorialvietnamese
  • Background Agents 2026, bài 1: anatomy của async coding

    Bài 1 series Background Agents. Async coding agent là gì, khác sync agent ở đâu, vì sao 2025-2026 cuộc đua nóng. Building blocks: sandbox, PR-based, long-running, branch isolation.

    May 21, 2026 · ~10 min read
    background-agentsasync-codingai-codinganatomytutorial
  • Background Agents 2026, bài 2: Claude Code BG mode và FleetView

    Bài 2. Claude Code background session: /bg command, EnterWorktree, FleetView multi-session UI, worktree isolation. Hands-on từ user thật.

    May 21, 2026 · ~11 min read
    background-agentsclaude-codefleetviewworktreetutorial
  • Local LLM 2026, bài 2: Apple Silicon vs CUDA vs CPU benchmark

    Bài 2 series Local LLM 2026. So sánh inference speed Apple Silicon (M3 Max), CUDA (RTX 4090, Quadro K620), CPU-only (Xeon E5). Methodology benchmark + dữ liệu thật từ homelab.

    May 21, 2026 · ~14 min read
    local-llmbenchmarkapple-siliconcudacpu
  • Local LLM 2026, bài 3: Ollama vs LM Studio vs vLLM vs llama.cpp

    Bài 3. So sánh 4 runner phổ biến 2026: Ollama (dev), LM Studio (GUI), vLLM (production throughput), llama.cpp (foundation). Khi nào dùng cái nào.

    May 21, 2026 · ~12 min read
    local-llmollamalm-studiovllmllama-cpp
  • Local LLM 2026: gpt-oss, Qwen 3, DeepSeek R1, Gemma 3 và Llama 4

    State of open-weight LLM 2026: model nào đáng tự host, kiến trúc, license, kích thước, ngưỡng phần cứng. Snapshot rõ ràng cho dev đang lên kế hoạch self-host.

    May 21, 2026 · ~16 min read
    local-llmself-hostopen-weightgpt-ossqwen
  • MCP từ zero, bài 2: build MCP server đầu tiên với TypeScript và Python

    Hands-on bài 2 series MCP từ zero. Build MCP server hello-world bằng TS SDK + Python SDK, expose 1 tool 1 resource 1 prompt, transport stdio, test với Claude Desktop. Đầy đủ code, gotchas, debug.

    May 21, 2026 · ~15 min read
    mcpmodel-context-protocolanthropicclaudetypescript
  • MCP từ zero, bài 3: transport sâu, stdio, SSE, Streamable HTTP

    Bài 3 series MCP từ zero. So sánh 3 transport của MCP: stdio (local), SSE (deprecated), Streamable HTTP (chuẩn mới 2025). Khi nào dùng cái nào, migration path, code example.

    May 21, 2026 · ~14 min read
    mcpmodel-context-protocolanthropictransporthttp
  • MCP từ zero, bài 4: Auth và Authorization, OAuth 2.0 Resource Server

    Bài 4 series MCP từ zero. Authorization Server, Resource Server, DCR, token boundaries. Cấm token passthrough, scope, security checklist từ spec 2025-06-18.

    May 21, 2026 · ~16 min read
    mcpoauthauthorizationresource-serversecurity
  • MCP từ zero, bài 5: resource design, pagination, cursor, MIME

    Bài 5. Cách thiết kế Resource cho MCP server: URI scheme, pagination với cursor, large payload, MIME types, streaming.

    May 21, 2026 · ~13 min read
    mcpresourcedesignpaginationtutorial
  • MCP từ zero, bài 6: tool design, schema, error handling, idempotency

    Bài 6. Best practices thiết kế Tool MCP: naming, Zod/JSON Schema, error code, idempotency, side effects, dry-run.

    May 21, 2026 · ~12 min read
    mcptoolschemadesigntutorial
  • MCP từ zero, bài 7: prompt resources và sampling

    Bài 7. Prompt resources reusable, parameter binding, sampling (server hỏi client gọi LLM), use cases thực tế.

    May 21, 2026 · ~10 min read
    mcppromptsamplingtutorial
  • AI cho người không code, bài E: 'em phịa' (hallucination) và cách phát hiện

    Bài E. Vì sao AI 'phịa' khi không biết, dấu hiệu phát hiện, 5 mẹo giảm rủi ro tin sai. Ví dụ thực tế: AI bịa luật, bịa số liệu, bịa link, bịa người.

    May 21, 2026 · ~11 min read
    ai-cho-nguoi-khong-codehallucinationai-101non-techtutorial
  • AI cho người không code, bài F: phòng đối thoại (context window) và tại sao AI quên

    Bài F. Context window là gì, tại sao AI 'quên' giữa cuộc nói chuyện dài. Cách quản lý hội thoại để AI nhớ đúng phần quan trọng.

    May 21, 2026 · ~10 min read
    ai-cho-nguoi-khong-codecontext-windowai-101non-techtutorial
  • AI cho người không code, bài G: ghi nhớ, AI có thực sự nhớ bạn không

    Bài G. Memory và Projects: AI có thực sự 'nhớ' bạn không, khác context window thế nào. Cách dùng Memory ChatGPT, Claude Projects, Gemini Saved Info.

    May 21, 2026 · ~9 min read
    ai-cho-nguoi-khong-codememoryprojectsai-101non-tech
  • AI cho người không code, bài H: token, gói trả phí, có đáng tiền không

    Bài H. Token là gì giải thích đơn giản, vì sao tiếng Việt tốn token gấp đôi tiếng Anh, gói free/Pro/Pro Max khác nhau ở đâu, ai nên trả tiền, ai dùng free đủ.

    May 21, 2026 · ~10 min read
    ai-cho-nguoi-khong-codetokenpricingnon-techtutorial
  • Background Agents 2026, bài 3: Cursor Background Agent deep dive

    Bài 3 series Background Agents. Cursor 1.0+ Background Agent: setup, sandboxed VM, PR-based workflow, billing, khi nào dùng. Hands-on 2026.

    May 21, 2026 · ~11 min read
    background-agentscursorasync-codingai-codingtutorial
  • Background Agents 2026, bài 4: Devin vs OpenDevin vs Replit Agent, so sánh

    Bài 4. Devin 2.0 (Cognition), OpenDevin/All-Hands, Replit Agent 3: kiến trúc, billing, kết quả thực tế 2026. Ai dùng cái nào.

    May 21, 2026 · ~9 min read
    background-agentsdevinopendevinopenhandsreplit
  • Background Agents 2026, bài 5: BG vs sync agent, chọn cái nào, khi nào

    Bài 5 (final). So sánh thực tế BG agent vs sync agent: cost, latency, observability, failure modes, debug. Decision framework + use cases hybrid.

    May 21, 2026 · ~9 min read
    background-agentsai-codingasync-codingclaude-codecursor
  • Local LLM 2026, bài 4: MCP cho local agents, Ollama, Cursor, gptme cắm tool

    Bài 4 series Local LLM 2026. Wire MCP server vào local LLM stack: Ollama + open-webui, Cursor + Ollama backend, gptme + local. Hands-on từ homelab.

    May 21, 2026 · ~12 min read
    local-llmmcpollamacursorgptme
  • Local LLM 2026, bài 5: failure modes, agent loops, tool-call format mismatch, OOM

    Bài 5. Khi local LLM dùng làm agent: agent loop hang, tool-call schema mismatch, OOM giữa generation, context overflow. Lessons từ homelab thực tế.

    May 21, 2026 · ~10 min read
    local-llmagentsollamallama-cppdebugging
  • MCP từ zero, bài 11: test và evaluate MCP server, MCP Inspector và security checklist

    Bài 11. MCP Inspector dev tool (anthropic), integration test với client mocking, security checklist trước khi publish, contract test cho schema.

    May 21, 2026 · ~11 min read
    mcptestingmcp-inspectorsecuritycontract-test
  • MCP từ zero, bài 12: MCP cho Cursor, Windsurf, gptme, Codex, không chỉ Claude

    Bài 12. MCP server của bạn chạy được với client nào ngoài Claude Desktop? Cursor, Windsurf, gptme, OpenAI Codex, Continue. Setup mỗi client + khác biệt.

    May 21, 2026 · ~11 min read
    mcpcursorwindsurfgptmecodex
  • MCP từ zero, bài 8: deploy MCP server, Cloudflare Workers, Railway, self-host

    Bài 8. Deploy MCP server lên production: Cloudflare Workers (cf-mcp-server), Railway, self-host Docker, secret management, HTTPS, observability.

    May 21, 2026 · ~9 min read
    mcpdeploycloudflarerailwayself-host
  • nf-cc-sync: Pull-Only Sync of ~/.claude/ Between Machines

    A Claude Code skill that syncs ~/.claude/ across machines using a branch-per-machine git layout. Pull-only, key-level merge for settings.json, prefer-newer for skills and rules, never auto-deletes. Plus the two design decisions that came out of real merge accidents.

    May 19, 2026 · ~7 min read
    claude-codeaiclaude-code-toolkitconfig-syncskills
  • nf-ignore: A .gitignore Auditor for AI Tools and Env Files

    A Claude Code skill that audits .gitignore for AI coding tool patterns and env file policy. Detects the project's framework (Vite, Next.js, Nuxt, Astro, SvelteKit, Remix) vs plain Node.js to apply the correct env convention, and patches AI tool entries that only ignore personal files while keeping team-shared configs committed.

    May 19, 2026 · ~6 min read
    claude-codeaiclaude-code-toolkitgitignoreskills
  • nf-direnv: A Per-Repo .envrc With a Dynamic GitHub Token

    A Claude Code skill that sets up .envrc in the current repo with GH_TOKEN resolved dynamically via gh auth, manages .gitignore, and runs direnv allow. Picks the correct gh account for multi-account setups, never writes a plaintext token to disk.

    May 19, 2026 · ~5 min read
    claude-codeaiclaude-code-toolkitskillsdirenv
  • 30 bài LLM bằng agents trong 1 tháng: cái được, cái dở, ~0.5M token

    Tôi vừa publish series 30 bài LLM từ zero trong gần 1 tháng (2026-04-22 đến 2026-05-17) bằng cách viết tay bài 1 làm reference, sau đó spawn Claude Code agents song song viết phần còn lại. Bài này kể lại workflow thực, cost rough estimate, cái hay, cái dở, một moment quirky của agent, và ai phù hợp dùng pattern này.

    May 18, 2026 · ~9 min read
    llmclaude-codeagentsworkflowmeta
  • Wire Anthropic-style SVG diagrams vào Astro blog: CSS vars, palette, 4 pitfalls

    Engineering log của việc thêm Style 2 diagram (palette coral/amber/teal kiểu Anthropic) vào blog Astro vốn dùng terminal mono. CSS vars trong global.css, inline SVG theme-adaptive, decision matrix Mermaid/PNG/extend Style 1/hand-roll, và 4 pitfall gặp khi ship 4 diagram đầu tiên.

    May 18, 2026 · ~8 min read
    svgastrocssdesigndiagrams
  • Agent là gì: LLM cộng tools cộng memory cộng loop

    Bài 1 series AI Agents từ zero. Định nghĩa agent từ góc nhìn dev, 4 thành phần cốt lõi (LLM, tools, memory, control loop), so sánh với chatbot, RPA, traditional code, kèm pseudocode tối giản và pitfall đầu tiên thường gặp.

    May 18, 2026 · ~8 min read
    ai-agentsllmanthropicclaudemental-model
  • AI Agents từ zero: Series Plan

    Roadmap 25 bài về AI agents cho senior dev đã hiểu LLM: control loop, tool use, planning, memory, multi-agent, eval, production. Code from scratch trước, framework sau. Pitfall storytelling thay vì tutorial sạch.

    May 18, 2026 · ~5 min read
    ai-agentsllmanthropicclaudetool-use
  • Control loop: ReAct, agentic loop, điều kiện dừng

    Bài 3 series AI Agents. Vòng lặp cốt lõi của agent: structure, stop conditions, max_iterations, token budget, early termination khi detect loop.

    May 18, 2026 · ~10 min read
    ai-agentsllmcontrol-loopreactanthropic
  • Chain-of-Thought so với structured reasoning

    Bài 10 series AI Agents. CoT prompting vs explicit reasoning steps trong structured output. Khi nào prompt 'think step by step' đủ, khi nào cần schema. Era reasoning model (o1, R1, Claude thinking).

    May 18, 2026 · ~10 min read
    ai-agentsllmcotreasoningstructured-output
  • Build agent từ đầu: 100 dòng Python với Anthropic SDK

    Bài 5 series AI Agents. Hands-on: code agent đầy đủ ~100 dòng Python với Anthropic SDK Claude Sonnet 4.6. Tools file system + shell. Walk-through từng phần code, demo task thực tế.

    May 18, 2026 · ~10 min read
    ai-agentsllmanthropicclaudepython
  • Memory cho agent: context window, scratchpad, summarization

    Bài 4 series AI Agents. Quản lý memory: short-term history, scratchpad notes LLM tự viết, summarization khi vượt context window, long-term store với vector DB.

    May 18, 2026 · ~10 min read
    ai-agentsllmmemorycontext-windowsummarization
  • Plan-and-Execute: tách planning khỏi execution

    Bài 7 series AI Agents. Pattern Plan-and-Execute, LLM lên plan đa-bước trước, executor chạy từng bước. Khác ReAct ở chỗ planning là phase riêng.

    May 18, 2026 · ~11 min read
    ai-agentsllmplanningplan-and-executelanggraph
  • Tree of Thoughts và tree search cho agent

    Bài 8 series AI Agents. Tree of Thoughts (ToT), explore nhiều branch of thought song song, evaluate, pick best. Compute-intensive nhưng giải được task ReAct fail.

    May 18, 2026 · ~10 min read
    ai-agentsllmtree-of-thoughtsplanningreasoning
  • Agent communication: shared state so với message passing

    Bài 17 series AI Agents. Hai cách multi-agent giao tiếp: shared state (blackboard) vs message passing (queue/RPC). Pros/cons, code patterns, state consistency.

    May 18, 2026 · ~10 min read
    ai-agentsllmmulti-agentstate-managementconcurrency
  • Eval cho agent: trace, replay, golden set, regression

    Bài 21 series AI Agents. Eval agent khó hơn eval LLM: nondeterministic, multi-step, có tool. 4 kỹ thuật: trace logging, replay, golden set, regression suite.

    May 18, 2026 · ~12 min read
    ai-agentsllmevaltraceregression
  • Cost và latency: token budget, streaming, prompt caching

    Bài 22 series AI Agents. Optimize cost (token, model tier) và latency (streaming, caching, parallelism). Concrete numbers từ Claude Sonnet 4.6 và Haiku 4.5.

    May 18, 2026 · ~12 min read
    ai-agentsllmcostlatencycaching
  • Failure modes: hallucination, infinite loop, hijacking

    Bài 23 series AI Agents. Catalog các fail mode thực tế: hallucination, infinite loop, goal hijacking, sandbagging. Detection signals và mitigation strategies.

    May 18, 2026 · ~12 min read
    ai-agentsllmfailure-modesreliabilityproduction
  • On-call cho agent: monitoring, alerts, rollback, A/B test

    Bài 25 series AI Agents (bài cuối). Vận hành agent trong production: metrics, alerts, dashboards, rollout strategy, rollback plan, A/B test framework. Closing the loop.

    May 18, 2026 · ~14 min read
    ai-agentsllmproductionmonitoringon-call
  • Security: prompt injection, tool sandboxing, secrets

    Bài 24 series AI Agents. 3 attack surface: prompt injection (chiếm via input), tool sandboxing (chiếm via output), secrets (chiếm via tool call). Mitigation tactics và least-privilege design.

    May 18, 2026 · ~12 min read
    ai-agentsllmsecurityprompt-injectiontool-sandboxing
  • Case study: Anthropic SDK agents và Claude Code agents

    Bài 20 series AI Agents. Phân tích 2 real-world implementation: Anthropic Agent SDK và Claude Code subagent system. Architecture, control flow, design lessons từ practice.

    May 18, 2026 · ~10 min read
    ai-agentsllmanthropicclaude-codesdk
  • Browser automation cho agent: Playwright và computer use

    Bài 13 series AI Agents. Cho agent dùng browser: Playwright (DOM-based) vs Computer Use (vision + click). Use cases, code, cost compare.

    May 18, 2026 · ~11 min read
    ai-agentsllmbrowserplaywrightcomputer-use
  • Code execution sandbox: subprocess, Docker, e2b

    Bài 12 series AI Agents. Cho agent chạy code do LLM viết, an toàn thế nào. Compare subprocess, Docker, e2b cloud sandbox. Security model từng option.

    May 18, 2026 · ~11 min read
    ai-agentsllmsandboxsecuritydocker
  • LangGraph, CrewAI, AutoGen: framework so sánh

    Bài 19 series AI Agents. Compare 3 framework multi-agent phổ biến. LangGraph (state graph), CrewAI (role-based), AutoGen (Microsoft event-driven). Khi nào dùng cái nào, khi nào skip framework.

    May 18, 2026 · ~10 min read
    ai-agentsllmlanggraphcrewaiautogen
  • MCP (Model Context Protocol): chuẩn hoá tool layer

    Bài 15 series AI Agents. MCP, protocol Anthropic open-source để chuẩn hoá tool/resource/prompt layer. Architecture, server vs client, real-world use cases.

    May 18, 2026 · ~9 min read
    ai-agentsllmmcpanthropicclaude-code
  • Multi-agent patterns: supervisor, handoff, debate

    Bài 16 series AI Agents. Khi nào nhiều agent tốt hơn một. 3 pattern: supervisor (1 boss), handoff (chuyền turn), debate (đối đáp). Trade-off compute vs quality.

    May 18, 2026 · ~11 min read
    ai-agentsllmmulti-agentorchestrationpatterns
  • RAG cho agents: retrieval trong vòng lặp, không phải QA

    Bài 14 series AI Agents. RAG cho agent khác RAG cho QA: retrieval là một tool trong loop, agent quyết định khi nào search và query gì. Multi-hop retrieval.

    May 18, 2026 · ~10 min read
    ai-agentsllmragretrievalvector-db
  • ReAct: thought, action, observation cycle

    Bài 6 series AI Agents. Pattern ReAct, LLM nghĩ trước khi hành động, observation kết quả, lặp. Original paper, why it works, code implementation, khi nào skip với modern model.

    May 18, 2026 · ~11 min read
    ai-agentsllmreactreasoningplanning
  • Self-reflection: critic, verifier, retry pattern

    Bài 9 series AI Agents. Agent tự đánh giá output trước khi return. Critic pattern, verifier pattern, retry với feedback. Reflexion paper baseline.

    May 18, 2026 · ~10 min read
    ai-agentsllmreflectioncriticevaluation
  • Specialized agent roles: planner, executor, reviewer

    Bài 18 series AI Agents. Pattern role-based: planner (plan), executor (run), reviewer (verify). Khi nào worth chia role, prompt template từng role, tradeoff cost vs quality.

    May 18, 2026 · ~10 min read
    ai-agentsllmmulti-agentrole-basedprompt-engineering
  • Tool design: schema, validation, idempotency

    Bài 11 series AI Agents. Sâu hơn bài 2: nguyên tắc thiết kế tool tốt, schema design pattern, validation layer, idempotency keys, atomic vs partial action.

    May 18, 2026 · ~11 min read
    ai-agentsllmtool-designschemavalidation
  • Tool use cơ bản: function calling, JSON schema, error handling

    Bài 2 series AI Agents. Cách định nghĩa tool cho LLM, viết JSON schema rõ ràng, handle error đúng cách, và pattern idempotency cho tool có thể retry an toàn.

    May 18, 2026 · ~14 min read
    ai-agentsllmtool-usefunction-callingjson-schema
  • Hermes Agent: AI tự học, persistent memory, chạy trên $5 VPS

    Bài 27 bonus AI Agents series. Deep-dive Hermes Agent từ Nous Research (Feb 2026, 140K+ stars). Self-evolving skills, FTS5 persistent memory, multi-channel (Telegram/Discord/Slack/CLI), self-host trên VPS rẻ. Lessons design self-improving agent.

    May 18, 2026 · ~12 min read
    ai-agentsllmhermesnous-researchopen-source
  • OpenClaw: open-source agent framework đang dẫn đầu 2026

    Bài 26 bonus AI Agents series. Deep-dive OpenClaw, framework agent open-source nổi nhất 2026 (Peter Steinberger, 347K stars). Kiến trúc, agent-loop, multi-model proxy, lessons từ vụ Anthropic third-party ban tháng 4.

    May 18, 2026 · ~11 min read
    ai-agentsllmopenclawopen-sourceagent-framework
  • AgentMemory MCP và hệ memory plain markdown tôi đã tự build

    Tôi đã build pipeline memory cho Claude Code từ vài tháng trước bằng autoMemoryDirectory, folder markdown chia theo project, frontmatter YAML, plus skill nf-dream để consolidate. Tuần này AgentMemory MCP trending GitHub với SQLite, vector embedding, 51 MCP tool, hybrid BM25 cộng vector cộng knowledge graph. Bài này là góc nhìn của người đã đi đường plain markdown soi tool DB-backed: cái nào đáng đổi, cái nào không, và khi nào tôi sẽ thử.

    May 18, 2026 · ~9 min read
    agent-memorymcpclaude-codelong-term-memoryrag
  • Semble: code search cho agent, tiết kiệm token so với grep

    Một agent đang chạy task refactor, nó `grep` ra 12 file, đọc nguyên 800 dòng mỗi file để tìm 1 function, hết context, mất task. Semble (Show HN hôm nay) đề xuất một cách khác: index codebase một lần, query bằng hash + embedding nhỏ, trả về snippet đã chunk theo tree-sitter. Bài này kể lại lý do mình plug Semble vào Claude Code qua MCP, so sánh thẳng với grep trong context của agent (không phải human), và những giới hạn mình note ra sau vài ngày dùng. Không phải tutorial, gần với workflow share hơn.

    May 18, 2026 · ~7 min read
    semblecode-searchmcpclaude-codeai-agents
  • nf-git-workflow: Opting Out of Ask-Before-Every-Commit, Safely

    A Claude Code skill that installs a project-scoped rule overriding the global 'ask before every commit and push' safety check, but only for this one repo. The current branch at install time becomes the protected head; one or more of three modes (worktree-pr, worktree-local-merge, direct-on-head) declares how work lands on it. Plus the four design decisions that took an incident each to get right.

    May 18, 2026 · ~12 min read
    claude-codeaiclaude-code-toolkitgitworkflow
  • nf-memory: Configuring Shared Memory Without Footguns

    A Claude Code skill that configures shared memory per project via the env var CLAUDE_COWORK_MEMORY_PATH_OVERRIDE in .claude/settings.local.json (not autoMemoryDirectory, which the binary silently ignores at project scope), picks the target folder via an interactive picker, optionally migrates existing per-project memory into a shared folder with smart merge, and refuses to point at a path that contains the project itself. Plus the four design decisions that took an incident each to get right.

    May 18, 2026 · ~14 min read
    claude-codeaiclaude-code-toolkitmemorysettings
  • Claude Code từ zero: Series Plan

    Roadmap 25 bài về Claude Code dành cho dev đã quen gõ /commands nhưng muốn hiểu kiến trúc bên dưới. Mental model trước, customization sau: rules, skills, agents, hooks, memory, MCP, worktree, team mode. Mỗi bài đứng độc lập, đọc tuần tự sẽ tích lũy đúng thứ tự.

    May 17, 2026 · ~8 min read
    claude-codeaideveloper-toolsseriestutorial
  • Claude Code là gì: CLI, IDE, Web, SDK và anatomy của 1 session

    Phần lớn dev nghĩ Claude Code là cái terminal có thể code. Thực tế nó có 4 entry point khác nhau, chia sẻ chung một core (model, tool loop, permissions) nhưng hành xử rất khác về state và context. Bài mở hộp đen: anatomy của một session, 5 lớp prompt được dựng mỗi turn, và lý do biết các lớp này quan trọng cho mọi customize sau này.

    May 17, 2026 · ~10 min read
    claude-codeaideveloper-toolstutorialarchitecture
  • autoMemoryDirectory: chia memory theo project hoặc client

    Memory mặc định của Claude Code là per-workdir và không sync. Nếu bạn có nhiều client hoặc nhiều project, không tách memory là recipe cho context leak. Bài này giải thích cách trỏ memory folder cho từng project, tại sao field autoMemoryDirectory ở scope local bị binary lờ đi, và route env CLAUDE_COWORK_MEMORY_PATH_OVERRIDE thực sự work.

    May 17, 2026 · ~11 min read
    claude-codememorydeveloper-toolsworkflowtutorial
  • Branch-per-machine: sync ~/.claude/ giữa các máy

    Bạn có MacBook ở nhà, server homelab, và có thể thêm một laptop nữa. Mỗi máy một bộ CC config. Không sync thì drift. Sync naively thì merge conflict mỗi lần pull. Bài này trình bày pattern branch-per-machine: một git branch cho mỗi máy, workflow để cherry-pick config từ máy khác, và skill tự động hóa quá trình đó.

    May 17, 2026 · ~7 min read
    claude-codedeveloper-toolsworkflowtutorialgit
  • Auto-memory: file-based, MEMORY.md index, các loại memory

    Claude Code không có database hay embedding store bên trong. Memory là một folder chứa file .md, và MEMORY.md là index được nạp vào prompt mỗi session. Bài này giải thích cấu trúc folder, 4 type memory, cách model đọc index, và khi nào nên hoặc không nên save.

    May 17, 2026 · ~9 min read
    claude-codememorydeveloper-toolstutorialworkflow
  • CLAUDE.md và rules: kiến trúc instructions hierarchical, path-scoping

    Bài 6 đi sâu vào L2 của prompt stack: ba mức CLAUDE.md từ global đến project, và cách rule modular với frontmatter paths dùng progressive context để chỉ load instruction cần thiết theo file đang touch.

    May 17, 2026 · ~8 min read
    claude-codedeveloper-toolstutorialarchitectureworkflow
  • Context window: prompt được dựng thế nào mỗi turn

    Mỗi lần bạn nhấn Enter, Claude Code không chỉ gửi câu hỏi của bạn lên model. Binary lắp ráp 5 lớp riêng biệt thành một prompt hoàn chỉnh trước khi gọi API. Bài này mổ xẻ từng lớp đó, kèm dữ liệu thực từ session log và số token cache để thấy rõ chi phí của mỗi turn.

    May 17, 2026 · ~8 min read
    claude-codecontext-windowarchitecturecachetutorial
  • Compaction và prompt cache: cách CC quản lý conversation dài

    Context window 1M token nghe to, nhưng một session làm việc thực vẫn chạm giới hạn sau vài giờ. Bài này đi sâu vào compaction: binary detect khi nào trigger, nó làm gì với history cũ, và tại sao session dài đôi khi quên chi tiết làm 30 phút trước. Kèm theo: prompt cache 1h TTL hoạt động thế nào và tại sao nó quan trọng hơn bạn nghĩ.

    May 17, 2026 · ~11 min read
    claude-codedeveloper-toolstutorialcontext-windowcompaction
  • Anatomy của 1 hook production-grade: shell script và exit codes

    Hook khác skill ở chỗ nó không phải gợi ý cho model mà là code chạy ngoài vòng lặp model, không thể bị bỏ qua. Bài này đi từ khái niệm đến script thực tế: chọn lifecycle event, parse stdin, dùng exit code đúng, handle idempotency và timeout, rồi wire vào settings.json. Bài cuối của series.

    May 17, 2026 · ~11 min read
    claude-codehooksdeveloper-toolstutorialworkflow
  • Hooks: lifecycle events, exit codes, và các kiểu hook thực tế

    Hook là shell script wired vào lifecycle event của Claude Code qua settings.json. Khác hoàn toàn với skill hay subagent: hook chạy ngoài model loop, không cần model invoke, không tiêu token. Bài này giải phẫu cơ chế hook, exit code semantics, stdin JSON payload, và hai ví dụ thực tế từ worktree đến notification.

    May 17, 2026 · ~8 min read
    claude-codehooksdeveloper-toolsworkflowworktree
  • Mobile coding qua Telegram bridge

    Laptop ở nhà, bạn đang trên tàu, nhưng cần CC chạy một task deploy hoặc fix typo gấp. Bài này mô tả pattern dùng Telegram bot làm bridge điều khiển Claude Code từ điện thoại: architecture, các thách thức kỹ thuật, và những chỗ dễ làm sai về security.

    May 17, 2026 · ~9 min read
    claude-codedeveloper-toolsworkflowarchitecturehooks
  • MCP servers: context bên ngoài, khi nào tự build, khi nào dùng có sẵn

    MCP (Model Context Protocol) là cơ chế để Claude Code kết nối ra external system: database, GitHub, Slack, browser. Bài này giải thích cách MCP hoạt động, khác hooks ở chỗ nào, và khi nào bạn nên tự build thay vì dùng server có sẵn.

    May 17, 2026 · ~10 min read
    claude-codemcpdeveloper-toolstoolsarchitecture
  • Memory submodule pattern: share memory cross-machine an toàn

    Memory của Claude Code là file-based, mỗi máy giữ một bản độc lập. Dev có nhiều máy thì memory không tự đồng bộ. Bài này trình bày pattern dùng git submodule để biến memory folder thành repo riêng, sync được giữa MacBook, server, và mọi máy khác mà không cần tool bổ sung.

    May 17, 2026 · ~6 min read
    claude-codememorygitdeveloper-toolsworkflow
  • Cross-agent communication: tránh race, slice theo file scope

    Chạy nhiều agent song song không đồng nghĩa với làm việc nhanh hơn nếu hai agent cùng đụng vào một file. Bài này phân tích ba cấp isolation, anti-pattern hay gặp nhất, và các coordination pattern giúp N agent chạy cùng lúc mà không có race condition.

    May 17, 2026 · ~10 min read
    claude-codeagentsworkflowarchitectureworktree
  • Plan mode: state file, exit prompt, plan vs todo vs memory

    Plan mode là cơ chế CC buộc model viết kế hoạch trước và chờ user approve trước khi thực thi. Bài giải thích workflow, file state, khi nào cần dùng, và sự khác biệt giữa plan, todo, và memory.

    May 17, 2026 · ~8 min read
    claude-codedeveloper-toolstutorialworkflowtools
  • Permission model: ask, auto, acceptEdits, bypassPermissions và deny list

    Bốn mode permission của Claude Code, cách cấu hình allowlist và deny list trong settings.json, và lý do tôi đã mất một bucket production để học bài này. Bài này cũng nói về PreToolUse hook và cách truyền mode khi spawn agent.

    May 17, 2026 · ~8 min read
    claude-codepermissionsdeveloper-toolstutorialworkflow
  • Plugins: khác skill thế nào, marketplace, khi nào dùng

    Plugin không phải skill lớn hơn. Đó là một cơ chế đóng gói khác: nhiều thành phần liên quan được bundle vào một đơn vị cài đặt. Bài này phân biệt plugin với skill, giải thích marketplace, và chỉ ra khi nào nên tự build thay vì dùng có sẵn.

    May 17, 2026 · ~7 min read
    claude-codedeveloper-toolstutorialpluginsworkflow
  • Settings.json load-bearing: env, permissions, hooks, plugins

    Ba file settings của Claude Code, thứ tự precedence, và các field thực sự điều khiển hành vi: permissions allow/deny, hooks lifecycle, env vars theo nhóm chức năng. Biết cái nào cần commit, cái nào phải gitignore.

    May 17, 2026 · ~8 min read
    claude-codedeveloper-toolspermissionshooksplugins
  • Anatomy của 1 skill production-grade: từ ý tưởng đến SKILL.md

    Skill trong Claude Code không phải là macro đơn giản. Một skill tốt có trigger rõ ràng, scope hẹp, xử lý failure, và lifecycle rõ ràng như bất kỳ module code nào. Bài này đi từng bước build 1 skill từ ý tưởng đến file SKILL.md cuối cùng, kèm các anti-pattern thường gặp.

    May 17, 2026 · ~9 min read
    claude-codedeveloper-toolsskillsworkflowtutorial
  • Skills: SKILL.md frontmatter, slash command, và disable-model-invocation

    Skill trong Claude Code không phải là tính năng built-in mà là một convention thư mục. Bài này mổ xẻ anatomy của một skill từ frontmatter, body, đến cách model quyết định khi nào trigger, và khi nào bạn cần tắt auto-trigger để tránh skill chạy lúc không mong muốn.

    May 17, 2026 · ~8 min read
    claude-codedeveloper-toolsskillstutorialworkflow
  • Subagents: anatomy, tools whitelist, system prompt, và examples block

    Subagent trong Claude Code không phải là session chia sẻ với main session. Nó là một session riêng biệt, có persona riêng, có tool subset riêng, và chạy độc lập. Bài này mổ xẻ cấu trúc một agent definition file: frontmatter, body system prompt, examples block, và cách spawn từ main session.

    May 17, 2026 · ~8 min read
    claude-codeagentsdeveloper-toolstutorialarchitecture
  • TeamCreate và SendMessage: persistent addressable agents

    Bài này đi vào team mode của Claude Code: cách tạo agent có tên, có thể resume xuyên turn qua SendMessage, khác gì so với one-shot Agent call, và khi nào dùng team thay vì spawn agent thông thường.

    May 17, 2026 · ~8 min read
    claude-codeagentsdeveloper-toolstutorialarchitecture
  • Spawning patterns: foreground, background, sequential, teammate

    Main session khởi tạo subagent theo 4 pattern khác nhau, mỗi pattern phù hợp với một nhóm tình huống cụ thể. Hiểu 4 pattern này giúp bạn ra quyết định đúng thay vì spawn agent theo quán tính.

    May 17, 2026 · ~8 min read
    claude-codeagentsworkflowarchitecturedeveloper-tools
  • Tool use loop: vòng giữa model và tool, retry, parallel calls

    Bài 1 giới thiệu tool loop trong 5 bước. Bài này đi sâu vào cơ chế bên dưới: khi nào model gửi nhiều tool call trong một turn, binary executor xử lý thế nào, lỗi được handle ra sao, và điều gì khiến vòng lặp dừng lại. Kèm ví dụ cụ thể 1 turn với 3 tool call chạy song song.

    May 17, 2026 · ~9 min read
    claude-codedeveloper-toolsarchitecturetoolshooks
  • Worktree hotfix trong khi main session đang debug production

    Scenario thực tế nhất của worktree agent: main session đang tail log, edit .env.production, scp script lên server. Một file cần hotfix. Nếu bạn checkout sang branch mới, mất hết scratch state. Worktree agent là pattern đúng, và bài này cho thấy chính xác cách làm.

    May 17, 2026 · ~7 min read
    claude-codeworktreeagentsworkflowdeveloper-tools
  • Worktree isolation: vì sao tách working tree và base branch hook

    Khi spawn agent mà để nó edit chung working tree với main session, bạn đang chấp nhận race condition và stale view. Bài này phân tích isolation: worktree, cách CC tạo git worktree riêng, tại sao base branch phải là HEAD thay vì origin/main, và hook WorktreeCreate làm gì bên dưới.

    May 17, 2026 · ~7 min read
    claude-codedeveloper-toolsworktreeagentshooks
  • Một vài session không phải là không xuất hiện, mà là xuất hiện trễ

    Bóc tách kiến trúc daemon của Claude Code 2.x: roster.json, spare worker pool, và cơ chế orphan adoption. Tại sao session foreground gõ `claude` trong terminal có thể không bao giờ tự xuất hiện trong `claude agents`, và `/bg` là cách deterministic duy nhất để buộc nó hiện ra.

    May 17, 2026 · ~12 min read
    claude-codedaemoninternalsfleet-viewarchitecture
  • Cách start session trong folder cụ thể từ `claude agents`

    FleetView dispatch session mới với cwd lấy từ chính process đang chạy `claude agents`. Bài này chỉ ra cách đúng (và một anti-pattern phổ biến) để session mới được spawn đúng thư mục.

    May 17, 2026 · ~9 min read
    claude-codefleet-viewcwdhowtoworkflow
  • Background session và worktree: setting worktree.bgIsolation từ 2.1.143

    Từ CC 2.1.143, có setting worktree.bgIsolation cho phép background session (session chạy nền, không phải subagent) edit working copy trực tiếp thay vì bị force vào worktree riêng. Bài giải thích tại sao background session cần một cơ chế isolation khác, khi nào nên tắt isolation, và khác gì so với isolation: worktree khi spawn subagent.

    May 17, 2026 · ~8 min read
    claude-codedeveloper-toolsworktreeworkflowarchitecture
  • FleetView: một màn hình thay cho 6 tmux pane và 3 tab desktop

    Trước FleetView, một dev dùng Claude Code nhiều project sẽ có 6 tmux pane, 2 Code tab trong Claude desktop, và một SSH session trên phone để thỉnh thoảng attach vào homelab xem agent batch đã xong chưa. Bài này kể lại workflow đó, sáu pain point cụ thể, và cách FleetView (TUI `claude agents`) gỡ được phần lớn trong số chúng. Không phải tất cả.

    May 17, 2026 · ~15 min read
    claude-codefleet-viewtuiworkflowtmux
  • Alert rules trong Kibana: ES query, threshold và burn rate

    Hướng dẫn dựng alert rule trong Kibana 8.x: ES query rule, threshold rule, burn rate cho SLO. Cover trigger condition, schedule, evaluation logic, pitfall của time window và pattern để giảm noise.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkalertingmonitoring
  • API keys nâng cao: Document-Level Security và Field-Level Security

    Khoá truy cập theo từng document và che field nhạy cảm bằng DLS và FLS. Hướng dẫn tạo API key có role descriptor scope tới tenant, mask PII, cộng quyền multi-role và pitfall query templating.

    May 17, 2026 · ~7 min read
    kibanaelasticsearchelksecurityapi-keys
  • Audit logging và compliance: ghi nhận ai làm gì cho SOC2

    Bật audit log Elasticsearch và Kibana, chọn event quan trọng, ship sang index riêng, giữ trail 1 năm và bảng câu hỏi auditor SOC2 hay hỏi với truy vấn KQL kèm sẵn.

    May 17, 2026 · ~7 min read
    kibanaelasticsearchelkauditcompliance
  • Sharing my Claude Code rules: agent safety and worktree isolation

    The global rule that decides when to delegate code edits to a sub-agent, when to put that agent in a worktree, and how to integrate the result without breaking the main session's working tree. Built from two real incidents.

    May 17, 2026 · ~9 min read
    claude-codeclaude-code-toolkitagentsworktreerules
  • Sharing my Claude Code rules: code style, no barrel files

    A tiny rule that bans barrel index.ts files and enforces direct component naming. Cheap to write, expensive to skip. The rule pays back every time the model is tempted to generate index.ts re-exports.

    May 17, 2026 · ~6 min read
    claude-codeclaude-code-toolkitcode-styletypescriptrules
  • Sharing my Claude Code rules: development, no mocks and no new endpoints

    A rule that forbids the model from generating mock data, modifying global API endpoints, or inventing new utilities when an existing helper already covers the case. The rule that makes Claude Code feel like a teammate instead of a stranger.

    May 17, 2026 · ~7 min read
    claude-codeclaude-code-toolkitdevelopmentrulesapi
  • Sharing my Claude Code rules: git commit format and multi-account workflow

    A global rule for commit message format, branch naming, GitHub CLI account switching, and the merge patterns that protect a debug session from being reset by a stray checkout. The biggest rule file in my setup.

    May 17, 2026 · ~8 min read
    claude-codeclaude-code-toolkitgitgithubrules
  • Sharing my Claude Code rules: guide-user progressive disclosure

    A rule that tells Claude Code how to walk a user through a procedure. One step at a time when the procedure is non-trivial. Anchor points for confirmation. Stop guessing when the user says I don't see that.

    May 17, 2026 · ~7 min read
    claude-codeclaude-code-toolkitrulesuxdocumentation
  • Sharing my Claude Code rules: local folder, credentials, and breadcrumbs

    The convention for the .local/ folder. Where credentials and personal project context live. Why every move out of a tracked path needs a breadcrumb so the next session can find what moved.

    May 17, 2026 · ~7 min read
    claude-codeclaude-code-toolkitrulescredentialssecurity
  • Sharing my Claude Code rules: safety, no auto-commit

    A short global rule that forbids Claude Code from running git commit or git push unless I type the explicit word. It cost me one bad push to write down. Now it lives in every session.

    May 17, 2026 · ~6 min read
    claude-codeclaude-code-toolkitsafetygitrules
  • Sharing my Claude Code rules: shell compatibility, zsh arrays and globs

    A rule that documents the three places zsh and bash diverge enough to break the model's shell snippets. Variable word-splitting, no-match globs, array indexing. Small differences, large failures, fixable with one rule.

    May 17, 2026 · ~6 min read
    claude-codeclaude-code-toolkitrulesshellzsh
  • Kibana Connectors: Slack, Email, Webhook và PagerDuty setup và best practices

    Hướng dẫn cấu hình connector trong Kibana 8.x cho Slack, Email (SMTP/Exchange), Webhook và PagerDuty. Cover security pattern, template variable, secret management và pitfall khi action không gửi notification.

    May 17, 2026 · ~9 min read
    kibanaelasticsearchelkalertingconnectors
  • Dashboard-as-code workflow: NDJSON, Git và CI/CD cho Kibana

    Workflow biến Kibana dashboard thành code: export NDJSON, commit Git, validate trong CI và import tự động qua API. Hết cảnh dashboard biến mất khi cluster rebuild hoặc người tạo nghỉ việc.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkdevopscicd
  • Deduplication và throttling trong Kibana: tránh alert fatigue

    Hướng dẫn dedup và throttle alert trong Kibana 8.x: notifyWhen, throttle interval, group alerts, dedup_key cho PagerDuty và patterns để giảm noise mà không miss critical alert.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkalertingsre
  • Disk full và shard imbalance: quy trình recovery Elasticsearch không mất data

    Runbook xử lý sự cố disk full và shard imbalance trên Elasticsearch: gỡ flood-stage read-only, free disk an toàn, force reroute shard, scale node và prevent tái diễn. Pattern thực chiến không mất data.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkopsrecovery
  • Distributed training: DP, DDP, FSDP, pipeline parallel

    Bài 17 series LLM từ zero. Khi model lớn quá 1 GPU, phải chia. Có 4 cách chia: replicate (DP/DDP), shard weights (FSDP/ZeRO), shard layers (pipeline parallel), shard matmul (tensor parallel). Bài này giải thích từng cái và khi nào nên dùng cái nào.

    May 17, 2026 · ~9 min read
    llmaimachine-learningtrainingdistributed-training
  • DPO và RLHF: alignment với preference data

    Bài 20 series LLM từ zero. Sau SFT là alignment. RLHF dùng reinforcement learning, DPO bỏ RL bằng một loss đơn giản hơn. Bài này giải thích Bradley-Terry model, KL penalty, reward hacking, và lý do DPO đang dần thay thế PPO trong production.

    May 17, 2026 · ~9 min read
    llmaimachine-learningalignmentrlhf
  • Elasticsearch query chậm: profiler, slow log và shard distribution

    Debug query Elasticsearch chậm theo bài bản: bật slow log, đọc profile API, hiểu shard distribution và segment merge. Pattern fix thường gặp cho query phức tạp và aggregation lớn.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkperformancedebug
  • Evaluation: MMLU, GSM8K, HumanEval, custom benchmark

    Một model claim 92% MMLU, model khác 89%. Có nghĩa là model A tốt hơn không? Câu trả lời ngắn: chưa chắc. Bài cuối series mở câu hỏi sống còn của AI engineering: làm sao đánh giá LLM đúng cách, benchmark nào đáng tin, và xây custom benchmark cho use case của bạn.

    May 17, 2026 · ~10 min read
    llmaimachine-learningevaluationbenchmark
  • Hands-on fine-tune Llama-3 với dataset tiếng Việt LoRA $20 GPU

    Bài 21 series LLM từ zero, capstone Part 5. Tutorial step-by-step fine-tune Llama-3-8B với dataset tiếng Việt trên GPU cloud rental ~$20. Tổng hợp LoRA, QLoRA, SFT đã học từ bài 18-19. Sau bài này bạn có một model fine-tuned VN thực của riêng mình.

    May 17, 2026 · ~9 min read
    llmaimachine-learningfine-tuninglora
  • Index Lifecycle Management (ILM): hot/warm/cold/delete và shrinking

    Thiết kế ILM policy cho log index: rollover theo size, shrink xuống 1 shard, force-merge, freeze và delete. Kèm bảng node tier, rollover alias và pitfall data stream với rollover thủ công.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkilmstorage
  • Kibana API tự động hoá: bulk user creation và mass dashboard update

    Hướng dẫn dùng Kibana REST API cho automation thực chiến: tạo hàng loạt user và role, cập nhật nhiều dashboard cùng lúc, wrap API thành CLI nội bộ. Pattern retry, pagination và error handling production-grade.

    May 17, 2026 · ~7 min read
    kibanaelasticsearchelkautomationrest-api
  • Kibana không load được: checklist debug từ browser tới Elasticsearch

    Quy trình debug khi Kibana không lên: kiểm tra browser console, network, Kibana server logs, kết nối Elasticsearch, cluster health và disk. Mỗi layer có symptom và fix riêng.

    May 17, 2026 · ~9 min read
    kibanaelasticsearchelkdebugtroubleshooting
  • Kibana behind reverse proxy: Nginx, Cloudflare với XSRF

    Đặt Kibana sau Nginx hoặc Cloudflare đúng cách: server.publicBaseUrl, XSRF header, websocket upgrade, kích thước header và pitfall khi Cloudflare strip header kbn-xsrf.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkreverse-proxynginx
  • KV cache và PagedAttention: tăng throughput inference

    Inference LLM chậm không phải vì model lớn mà vì mỗi token mới phải tính lại attention với toàn bộ token trước đó. KV cache giải quyết bằng cách lưu kết quả trung gian. PagedAttention giải quyết vấn đề KV cache lãng phí memory. Hai kỹ thuật, ba lần tăng tốc.

    May 17, 2026 · ~10 min read
    llmaimachine-learninginferencekv-cache
  • LLM Agents: ReAct, tool use, planning, multi-step reasoning

    Một LLM trả lời câu hỏi là một thứ. Một LLM tự lên kế hoạch, gọi tool, đọc kết quả, sửa kế hoạch, lặp lại cho đến khi xong nhiệm vụ, là thứ khác hoàn toàn. Bài viết mở mental model agent, ReAct pattern, tool use, kèm code Python loop tối giản.

    May 17, 2026 · ~10 min read
    llmaimachine-learningagentsreact
  • Log shippers đối chiếu: Filebeat, Fluentd, Vector cho ELK stack

    So sánh thực chiến ba log shipper phổ biến nhất cho ELK stack: Filebeat của Elastic, Fluentd của CNCF và Vector của Datadog. Resource footprint, ngôn ngữ pipeline, performance, debugging và lựa chọn theo use case.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkloggingdevops
  • Long context: RoPE scaling, YaRN, ALiBi extrapolation

    Llama-3 train context 8k. Llama-3.1 hỗ trợ 128k. Gemini quảng cáo 2M. Model không retrain từ đầu, chỉ điều chỉnh cách encode position. Bài viết mở RoPE, RoPE scaling, YaRN, ALiBi, và cách phân biệt context dài thật vs quảng cáo.

    May 17, 2026 · ~9 min read
    llmaimachine-learninglong-contextrope
  • LoRA và QLoRA: parameter-efficient fine-tuning

    Bài 18 series LLM từ zero. Fine-tune full Llama-3-8B tốn 60GB VRAM. LoRA cắt xuống 1.5%, vẫn giữ 95% performance. QLoRA cắt thêm bằng 4-bit quantization, fit 7B model trong 8GB VRAM. Bài này giải thích low-rank decomposition, code triển khai với peft, và khi nào nên dùng cái nào.

    May 17, 2026 · ~9 min read
    llmaimachine-learningfine-tuninglora
  • Maps: geo visualization cho IoT và telemetry trong Kibana

    Hướng dẫn dùng Kibana Maps để render dữ liệu địa lý từ IoT, telemetry và log có toạ độ. Cover geo_point mapping, layer types, heatmap, cluster, choropleth và pitfall hay gặp khi data từ device đẩy lên Elasticsearch.

    May 17, 2026 · ~9 min read
    kibanaelasticsearchelkmapsgeo
  • Mixed precision FP16 BF16 và gradient checkpointing

    Bài 16 series LLM từ zero. Train 7B model trên GPU 24GB là khác biệt giữa OOM step đầu và chạy được. Mixed precision cắt memory một nửa, gradient checkpointing cắt thêm 30-40%. Bài này giải thích tại sao FP16 không đủ, BF16 thay thế nó, và checkpointing trade compute cho memory.

    May 17, 2026 · ~9 min read
    llmaimachine-learningtrainingmixed-precision
  • Mixture of Experts (MoE): Mixtral, DeepSeek architecture

    Mixtral-8x7B có 47 tỷ params nhưng mỗi token chỉ kích hoạt 13 tỷ. DeepSeek-V3 671B nhưng chỉ active 37B mỗi forward pass. MoE là kiến trúc cho phép scale model lên kích thước khổng lồ mà compute không bùng nổ. Bài viết mở MoE từ ý tưởng đến triển khai.

    May 17, 2026 · ~9 min read
    llmaimachine-learningmoemixtral
  • Performance tuning Elasticsearch: JVM heap, field caps cache và merge throttling

    Bài cuối series Kibana từ A đến Z. Tuning sâu Elasticsearch ở production: JVM heap sizing, GC tuning, field caps cache, segment merge throttling, refresh interval và circuit breaker.

    May 17, 2026 · ~9 min read
    kibanaelasticsearchelkperformancetuning
  • Quantization: INT8, INT4, GGUF, AWQ và BitNet 1.58-bit

    Llama-3-70B nặng 140GB ở FP16. Sau khi quantize INT4 còn 35GB, chạy được trên một con GPU 48GB hoặc CPU 64GB RAM. Bài viết mở hộp quantization: tại sao nén được, nén kiểu gì, mất gì khi nén, và khi nào nên chọn GGUF vs AWQ vs GPTQ.

    May 17, 2026 · ~8 min read
    llmaimachine-learningquantizationinference
  • RAG: retrieval-augmented generation từ vector DB tới prompt

    Bạn muốn LLM trả lời theo tài liệu công ty mà không fine-tune. Câu trả lời ai cũng nghe: RAG. Nhưng RAG không phải một feature, nó là một pipeline 5 bước, và mỗi bước có hàng tá lỗi có thể xảy ra. Bài viết mở pipeline RAG từ chunking đến prompt construction, kèm code Chroma chạy được.

    May 17, 2026 · ~10 min read
    llmaimachine-learningragvector-database
  • Reasoning models: o1, R1, chain-of-thought training

    OpenAI o1 ra 9/2024 đánh bại GPT-4o trong toán và code dù model nhỏ hơn. DeepSeek R1 cuối 2024 open source kèm paper, phơi bày công thức. Reasoning model không phải prompt engineering, mà là cách train mới: thưởng cho việc suy nghĩ trước khi trả lời.

    May 17, 2026 · ~9 min read
    llmaimachine-learningreasoningo1
  • Scaling laws: Chinchilla, compute-optimal, data efficient

    Bài 15 series LLM từ zero. Scaling laws là kinh tế học của LLM. Bao nhiêu parameter, bao nhiêu data, bao nhiêu compute là tối ưu? Kaplan 2020, Chinchilla 2022, và những hệ quả của chúng đến Llama-3 hôm nay. Hiểu được scaling laws là biết tính cost trước khi pretrain.

    May 17, 2026 · ~8 min read
    llmaimachine-learningscaling-lawschinchilla
  • Serving frameworks: vLLM, llama.cpp, Ollama, bitnet.cpp đối chiếu

    Cùng một model Llama-3-8B Q4 chạy trên vLLM cho throughput 2000 tokens/s, trên Ollama cho 40 tokens/s. Khác biệt 50 lần không phải vì engine tệ mà vì mục đích khác nhau. Bài viết phân biệt 4 serving framework theo trục concurrency, hardware, ops complexity.

    May 17, 2026 · ~9 min read
    llmaimachine-learningvllmllama-cpp
  • SFT: supervised fine-tuning với instruction dataset

    Bài 19 series LLM từ zero. SFT là bước biến một pretrained model thành một instruction-following assistant. Bài này dissect data format, chat template, loss masking, và cách build SFT pipeline thực tế bằng trl library. Code chạy được trên Colab free.

    May 17, 2026 · ~8 min read
    llmaimachine-learningfine-tuningsft
  • SLO tracking trong Kibana: SLI, error budget và alert progression

    Hướng dẫn dựng SLO với Kibana 8.x: định nghĩa SLI từ log, cấu hình Service Level Objective, tính error budget, và setup alert progression theo Google SRE Workbook (burn rate multi-window).

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkslosre
  • Snapshot & Restore: backup ES lên S3, disaster recovery

    Cấu hình S3 snapshot repository, Snapshot Lifecycle Management (SLM), restore index, test DR và bảng RPO/RTO so sánh các chiến lược backup cluster Elasticsearch.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelksnapshotbackup
  • Spaces: tách dev/staging/prod và team con cùng cluster Kibana

    Dùng Kibana Spaces để chia dev, staging, prod và team con trên cùng một cluster. Hướng dẫn tạo space, copy saved object, default route, disabled features và pitfall với index pattern dùng chung.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkspacesmulti-tenant
  • Terraform và Kibana: quản lý saved objects, rules, connectors như infrastructure

    Hướng dẫn dùng Terraform provider Elastic Stack để declarative manage saved objects, alert rules và connectors của Kibana. State management, dependency graph, migration từ NDJSON workflow.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkterraformiac
  • TLS/SSL end-to-end: cert giữa Kibana-ES-Beats và public endpoint

    Setup TLS cho Elasticsearch transport, HTTPS giữa Kibana-ES, mTLS cho Beats và rotate cert không downtime. Kèm elasticsearch-certutil, keystore và pitfall verification_mode.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelktlsssl
  • Training loop: forward, backward, optimizer, lr schedule

    Mở Part 4 của series LLM từ zero. Training loop là phần code mọi research engineer phải viết hàng ngày, nhưng ít dev thực sự hiểu từng dòng. Bài này dissect 5 thành phần: forward pass, loss, backward, optimizer step, lr schedule. Code PyTorch chạy được, không phải pseudo.

    May 17, 2026 · ~9 min read
    llmaimachine-learningtrainingpytorch
  • Upgrade ELK: minor version in-place và major cluster-swap

    Hai chiến lược upgrade ELK production: minor version rolling restart in-place và major version cluster-swap dual-write. Kèm checklist tiền upgrade, deprecation API, downgrade plan và pitfall ILM/template incompatibility.

    May 17, 2026 · ~10 min read
    kibanaelasticsearchelkupgradedevops
  • Users, Roles, RBAC: mô hình phân quyền Kibana 8.x

    Hiểu mô hình RBAC trong Kibana 8.x: cluster privileges, index privileges, Kibana feature privileges và cách map user qua native realm hoặc SSO để chia quyền theo team.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkrbacsecurity
  • Visualization pitfalls: lỗi hay gặp với aggregation và time bucket trong Kibana

    Tổng hợp các lỗi thường gặp khi dựng dashboard Kibana: cardinality đếm trùng, terms aggregation cắt mất nhóm nhỏ, time bucket lệch múi giờ, sum trên doc_values vs source và cách tránh báo cáo sai số liệu.

    May 17, 2026 · ~8 min read
    kibanaelasticsearchelkaggregationdashboard
  • AI agent local: pattern cũ, blast radius mới

    Self-hosted AI agent (OpenClaw, gptme, AutoGPT, LangChain agents) thực chất là ChatOps đã có từ 2000s với LLM thay parser. Pattern giống Slack bot, Zapier, n8n bạn dùng hằng ngày, nhưng blast radius khác hẳn: full shell access, prompt injection thành privilege escalation, supply chain qua skill cộng đồng. Bài này strip hype kỹ thuật, đo resource thật sự cần, và 7 câu hỏi trước khi cài lên máy có dữ liệu cá nhân.

    May 11, 2026 · ~10 min read
    aiagentself-hostedsecuritychatops
  • Claude Code Toolkit: Sharing the Customizations I Actually Use

    An ongoing series where I publish, white-labeled, the Claude Code customizations I rely on day-to-day. Skills, hooks, rules, subagents, and slash commands. Each post explains one artifact, the problem it solves, and the patterns inside it that you can copy or adapt.

    Apr 27, 2026 · ~5 min read
    claude-codeaideveloper-toolsclaude-code-toolkitskills
  • nf-agents: Spawning Claude Code Teams Without Footguns

    A Claude Code skill that wraps team and agent spawning into five named modes, runs a four-line pre-flight check, and bakes the cooperative shutdown protocol into the workflow. Plus the four design decisions that took an incident each to get right.

    Apr 27, 2026 · ~15 min read
    claude-codeaiclaude-code-toolkitagentstmux
  • LLM hoạt động thế nào: mental model cho dev

    Bạn gõ câu hỏi vào ChatGPT, 3 giây sau nhận được câu trả lời. Ở giữa có gì? Bài viết mở hộp đen: tokenize, embed, attention, sample. Không dùng một công thức toán nào, chỉ mental model cho dev đã quen code nhưng lần đầu đọc kỹ về LLM.

    Apr 22, 2026 · ~16 min read
    llmaimachine-learningtransformertutorial
  • Calculus cho LLM: gradient, chain rule, backprop intuition

    Đạo hàm nghe sợ nhưng cốt lõi chỉ là đo độ dốc. Gradient là đạo hàm của hàm nhiều biến. Chain rule là cách chuyền gradient ngược qua nhiều layer. Backprop = chain rule áp dụng có hệ thống. Mục tiêu là intuition cho dev, không giải bài tập toán.

    Apr 22, 2026 · ~9 min read
    llmaimachine-learningmathcalculus
  • LLM từ zero: Series Plan

    Roadmap 30 bài học LLM từ foundation math đến production deployment cho senior dev muốn pivot AI: mental model, tokenization, attention, training, fine-tuning, inference, advanced topics. Hybrid approach: 70% hands-on code + 30% blog.

    Apr 22, 2026 · ~6 min read
    llmaimachine-learningserieslearning-path
  • Linear algebra cho LLM: vector, matrix, dot product

    Bài 1 nói mọi thứ bên trong LLM đều là vector và matrix. Vector là gì? Matrix là gì? Tại sao dot product là backbone của attention và RAG? Mình phá băng math foundation cho dev: chỉ 4 khái niệm, không công thức phức tạp.

    Apr 22, 2026 · ~13 min read
    llmaimachine-learningmathlinear-algebra
  • Neural network tối giản: perceptron, MLP từ zero

    Ghép linear algebra + calculus + probability thành neural network đầu tiên. Từ perceptron 1957 đến MLP đa layer, code 60 dòng NumPy train XOR không cần PyTorch. Đọc xong, bạn hiểu building block gốc của mọi LLM hiện đại.

    Apr 22, 2026 · ~12 min read
    llmaimachine-learningneural-networkperceptron
  • Probability cho LLM: softmax, cross-entropy, perplexity

    LLM output là xác suất, không phải lựa chọn cứng. Softmax biến logits thành phân phối. Cross-entropy là loss function chuẩn. Perplexity là metric đánh giá model. Bài này giải thích tại sao mấy khái niệm này là trái tim của training và evaluation, với code NumPy minh hoạ.

    Apr 22, 2026 · ~11 min read
    llmaimachine-learningmathprobability
  • Build BPE tokenizer từ đầu (theo Karpathy minbpe)

    Bài 6 giới thiệu BPE. Bài này code từ zero, 150 dòng Python thuần không dependency. Train tokenizer trên Shakespeare, encode/decode, visualize merges. Đọc xong, BPE bớt abstract hơn nhiều.

    Apr 22, 2026 · ~12 min read
    llmaitokenizationbpepython
  • Attention mechanism: Query, Key, Value intuition

    Paper 'Attention is All You Need' (2017) là điểm bùng nổ của Transformer. Nhưng Q/K/V từ đâu ra, nghĩa gì, tại sao 3 cái thay vì 1? Bài này giải thích bằng ẩn dụ thư viện, không công thức - xây intuition trước khi đến code ở bài 10.

    Apr 22, 2026 · ~11 min read
    llmaiattentiontransformerqkv
  • Embeddings: word2vec, contextual, và positional encoding (RoPE)

    Token ID biến thành vector - đó là embedding. Nhưng vector đó từ đâu? word2vec (2013) dạy model hiểu semantic. Contextual embedding (BERT/GPT) khác word2vec thế nào? Tại sao cần thêm positional encoding, và RoPE làm điều đó cách nào?

    Apr 22, 2026 · ~11 min read
    llmaiembeddingsword2vecrope
  • Multi-head attention: tại sao chia nhiều head

    Bài 10 code single-head attention. GPT/Llama có 32-128 heads. Tại sao chia? Mỗi head làm gì khác nhau? Cost tính thêm bao nhiêu? Bài này: intuition + code multi-head bằng NumPy, visualize head specialization (syntax, coreference, long-range).

    Apr 22, 2026 · ~13 min read
    llmaiattentionmulti-headtransformer
  • nanoGPT: 300 dòng PyTorch tái tạo GPT từ đầu

    Capstone Part 3. Karpathy nanoGPT là implementation GPT-2 trọn vẹn trong ~300 dòng PyTorch. Mình đọc code, train GPT nhỏ trên Shakespeare trong 15 phút CPU, rồi generate text. Đọc xong bạn code được GPT-2 nhỏ không cần HuggingFace.

    Apr 22, 2026 · ~12 min read
    llmaigptpytorchnanogpt
  • Self-attention: code từ đầu bằng NumPy

    Bài 9 đã xây intuition QKV. Bài này code từ zero một self-attention layer hoàn chỉnh bằng NumPy thuần - 80 dòng, xử lý batch, causal mask, scaling. Verify output matches PyTorch implementation. Đọc xong, attention không còn là hộp đen.

    Apr 22, 2026 · ~10 min read
    llmaiattentionself-attentionnumpy
  • Transformer block: attention + MLP + layer norm + residual

    Multi-head attention là một nửa Transformer. Nửa còn lại: MLP (feed-forward), layer normalization, residual connection. Bài này ghép 4 thành phần thành 1 block hoàn chỉnh, stack 12 block thành GPT-2, giải thích thứ tự (pre-norm vs post-norm) và tại sao residual quan trọng.

    Apr 22, 2026 · ~13 min read
    llmaitransformermlplayer-norm
  • Tokenization: BPE, WordPiece, SentencePiece

    Bài 1 nói input text biến thành tokens. Nhưng cách biến là gì? BPE, WordPiece, SentencePiece có gì khác nhau? Tại sao tokenizer quyết định nhiều hơn bạn nghĩ - từ cost API đến khả năng model xử lý tiếng Việt. Deep dive cho dev.

    Apr 22, 2026 · ~14 min read
    llmaimachine-learningtokenizationbpe
  • AI Coding Providers Series: Chọn đúng plan cho workload của bạn

    Series research và so sánh các AI coding plan (subscription + API pay-per-token) của Anthropic, Alibaba, GLM, Moonshot, OpenAI. Giúp lập trình viên chọn đúng provider cho ngân sách và workflow thực tế.

    Apr 21, 2026 · ~1 min read
    aillmcodingpricingcomparison
  • Mua AI Coding Plan nào? Research 5 providers lớn (2026-04)

    So sánh chi tiết subscription plan và API pay-per-token pricing của Anthropic, Alibaba, GLM, Moonshot, OpenAI tại thời điểm tháng 4/2026. Kèm decision framework và cảnh báo billing pitfall.

    Apr 21, 2026 · ~11 min read
    aillmcodingpricingcomparison
  • Tiếng Việt tốn hơn x2 token? Data nói khác

    Benchmark trên 5626 prompt thực tế từ 555 sessions Claude Code. Claim 'tiếng Việt tốn hơn x2 token' chỉ đúng 2.9% use case. Phần lớn thời gian mix-lang Việt-Anh còn tiết kiệm hơn pure English, và data cho thấy lý do.

    Apr 21, 2026 · ~14 min read
    llmprompt-engineeringtoken-optimizationbenchmark
  • Does Vietnamese really cost 2x+ tokens in LLM prompts? Data from 5626 real messages

    Benchmark across 5626 real prompts from 555 Claude Code sessions shows the '>2x token' claim for Vietnamese only applies to 2.9% of actual usage. Mixed Vietnamese-English prompts are more token-efficient than pure English on longer messages, and the data shows why.

    Apr 21, 2026 · ~13 min read
    llmprompt-engineeringtoken-optimizationbenchmark
  • Canvas: dựng report branded cho stakeholder

    Dùng Canvas của Kibana để dựng infographic pixel-precise có brand công ty: khác Dashboard thế nào, expression language pipeline, data source ESSQL, dynamic image/color theo value, và export PDF multi-page giao CEO/CFO. Dành cho developer backend và platform team.

    Apr 16, 2026 · ~8 min read
    kibanacanvasreportingessqlvisualization
  • Discover nâng cao: Runtime fields, filter phức tạp, highlighting

    Nâng Discover từ mức cơ bản lên power-user: tạo Runtime field không cần reindex, filter nested object và regex, bật highlighting để scan log nhanh, phân biệt Saved Query với Saved Search, inspect request để debug query và tối ưu performance.

    Apr 16, 2026 · ~8 min read
    kibanadiscoverruntime-fieldspainlesselasticsearch
  • KQL và ES|QL: So sánh hai ngôn ngữ query của Kibana

    Phân biệt KQL và ES|QL trong Kibana 8.x: triết lý khác nhau, cú pháp đối chiếu, pitfall phổ biến, và quy tắc tay chọn ngôn ngữ nào cho filter, aggregation, alert và dashboard. Dành cho developer backend và DevOps.

    Apr 16, 2026 · ~10 min read
    kibanaelasticsearchkqlesqlquery-language
  • Lens: từ drag-drop tới công thức phức tạp

    Dựng visualization trong Kibana 8.x bằng Lens: drag-drop chart cơ bản, Formula mode với function và time shift, annotation layer cho deploy marker, reference line cho SLO, pitfall về cardinality và time interval. Dành cho developer backend muốn tự làm dashboard production-grade.

    Apr 16, 2026 · ~8 min read
    kibanalensvisualizationdashboardformula
  • Kibana cho Developer: Filter log, Saved Search, Dashboard và REST API

    Hướng dẫn toàn diện sử dụng Kibana cho lập trình viên backend: filter error log bằng KQL, tránh pitfall với ES|QL, tạo Saved Search và Dashboard qua GUI, tương tác Kibana qua REST API và quản lý API key an toàn.

    Apr 15, 2026 · ~10 min read
    kibanaelasticsearchloggingelkobservability
  • Kibana từ A đến Z: Series Plan

    Roadmap series 28 bài học Kibana từ cơ bản đến production: cover Discover, KQL/ES|QL, Lens, Dashboard, Alerts, RBAC, ILM, automation và troubleshooting cho developer backend.

    Apr 15, 2026 · ~5 min read
    kibanaserieslearning-pathelkobservability
  • Backstage on Kubernetes: Practical Platform Engineering Guide

    Implement a practical Internal Developer Platform with Backstage on Kubernetes, software templates, service catalog, and golden paths for engineering teams.

    · ~2 min read
    backstagekubernetesplatform-engineeringidpdeveloper-experience
  • ArgoCD Advanced Patterns: App of Apps and Promotion Flows

    Implement advanced ArgoCD patterns for scalable GitOps: App of Apps, environment promotion, sync waves, and safe progressive delivery workflows.

    · ~2 min read
    argocdgitopskubernetesprogressive-deliverycicd
  • [24/24] E is for Etcd: Understanding the Brain of Kubernetes

    A deep dive into etcd, the distributed key-value store that powers Kubernetes. Learn about consistency, high availability, and backup strategies.

    · ~3 min read
    kubernetesa-to-z-seriesetcddatabasedistributed-systems
  • [23/24] B is for Best Practices: Building Secure and Reliable Apps

    The second post in our Kubernetes A-to-Z series covering essential best practices for security, reliability, and resource management.

    · ~3 min read
    kubernetesa-to-z-seriesbest-practicessecurityreliability
  • [19/24] A is for Authentication and RBAC: Securing Your Cluster

    The sixteenth post in our Kubernetes A-to-Z series covering authentication mechanisms, Role-Based Access Control, security contexts, and cluster security best practices.

    · ~6 min read
    kubernetesa-to-z-seriesauthenticationrbacsecurity
  • [4/24] D is for Deployments: Managing Application Lifecycle

    The fourth post in our Kubernetes A-to-Z series covering Deployments, rolling updates, rollbacks, and application lifecycle management strategies.

    · ~7 min read
    kubernetesa-to-z-seriesdeploymentsrolling-updatesrollbacks
  • [2/24] C is for Containers: Docker Fundamentals Before Kubernetes

    The second post in our Kubernetes A-to-Z series covering container fundamentals, Docker basics, and essential concepts needed before learning Kubernetes.

    · ~8 min read
    dockercontainersa-to-z-serieskubernetesfundamentals
  • [20/24] F is for Federation: Multi-Cluster Management

    The seventeenth post in our Kubernetes A-to-Z series covering multi-cluster architectures, federation patterns, service mesh, disaster recovery, and cross-cluster communication.

    · ~6 min read
    kubernetesa-to-z-seriesfederationmulti-clusterservice-mesh
  • [22/24] G is for GitOps: Modern Deployment Workflows

    GitOps principles and practical ArgoCD and FluxCD examples for Kubernetes deployment workflows.

    · ~10 min read
    gitopsargocdfluxcdkubernetesci-cd
  • Building Internal Developer Platforms on Kubernetes: A Practical Guide

    Build an Internal Developer Platform (IDP) on Kubernetes with Backstage, self-service capabilities, golden paths, and platform engineering practices.

    · ~12 min read
    platform-engineeringkubernetesbackstagedeveloper-experiencedevops
  • [11/24] I is for Ingress: Managing External Access

    The tenth post in our Kubernetes A-to-Z series covering Ingress controllers, routing rules, TLS termination, and advanced traffic management patterns.

    · ~6 min read
    kubernetesa-to-z-seriesingressnetworkingtls
  • [1/24] K is for Kubernetes: Understanding the Basics and Architecture

    The first post in our Kubernetes A-to-Z series covering Kubernetes fundamentals, architecture, components, and basic cluster setup.

    · ~7 min read
    kubernetesa-to-z-seriesarchitecturebasicstutorial
  • [7/24] J is for Jobs and CronJobs: Batch Processing in Kubernetes

    Learn how to run one-off tasks and scheduled batch jobs in Kubernetes using Jobs and CronJobs resources.

    · ~2 min read
    kubernetesa-to-z-seriesjobscronjobsbatch-processing
  • Kafka Partition Design for IoT: Throughput and Ordering

    Design Kafka topic and partition strategy for IoT workloads with practical guidance on throughput, ordering, consumer scaling, and operational limits.

    · ~3 min read
    kafkaiotstreamingpartitionsarchitecture
  • Kubernetes Backup and Disaster Recovery: Velero and etcd

    Design a practical backup and disaster recovery strategy for Kubernetes with etcd snapshots, Velero, restore drills, and RTO/RPO planning.

    · ~2 min read
    kubernetesdisaster-recoverybackupveleroetcd
  • [12/24] H is for Helm: Package Management for Kubernetes

    The eleventh post in our Kubernetes A-to-Z series covering Helm charts, repositories, templating, values, and application lifecycle management.

    · ~7 min read
    kubernetesa-to-z-serieshelmpackage-managementcharts
  • Kubernetes Multi-Tenancy: Namespace, RBAC, and Quota Design

    Design a practical multi-tenant Kubernetes model with namespace boundaries, RBAC, network isolation, quotas, and operational guardrails.

    · ~2 min read
    kubernetesmulti-tenancyrbacnamespaceresourcequota
  • Kubernetes Cost Optimization in Production

    A practical guide to reducing Kubernetes infrastructure spend with right-sizing, autoscaling, scheduling strategy, and workload-level optimization.

    · ~3 min read
    kubernetesfinopscost-optimizationautoscalingperformance
  • Kubernetes Security Hardening Checklist for Production

    A practical security hardening checklist for production Kubernetes clusters, covering identity, network, workloads, supply chain, and runtime controls.

    · ~3 min read
    kubernetessecurityhardeningrbacnetworkpolicy
  • Kubernetes A-to-Z Series

    A practical map of the Kubernetes A-to-Z series, from core concepts to production operations, security, GitOps, and cluster lifecycle work.

    · ~5 min read
    kubernetesserieslearning-pathdevopscontainers
  • Kubernetes vs Docker Swarm: Practical Comparison

    A practical comparison of Kubernetes and Docker Swarm container orchestration platforms, including command references, architecture differences, and examples.

    · ~8 min read
    kubernetesdocker-swarmcontainer-orchestrationdevopscomparison
  • [10/24] M is for ConfigMaps and Secrets: Managing Configuration

    The ninth post in our Kubernetes A-to-Z series covering ConfigMaps, Secrets, configuration management patterns, and environment-specific deployments.

    · ~7 min read
    kubernetesa-to-z-seriesconfigmapssecretsconfiguration
  • [15/24] L is for Logging and Monitoring: Observability in Kubernetes

    The thirteenth post in our Kubernetes A-to-Z series covering logging architectures, Prometheus metrics, distributed tracing, and observability best practices.

    · ~7 min read
    kubernetesa-to-z-seriesloggingmonitoringobservability
  • [13/24] O is for Operators: Extending Kubernetes Functionality

    The twelfth post in our Kubernetes A-to-Z series covering Operators, Custom Resource Definitions (CRDs), controller patterns, and extending Kubernetes.

    · ~6 min read
    kubernetesa-to-z-seriesoperatorscrdcustom-resources
  • [8/24] N is for Namespaces: Organizing Your Cluster

    The seventh post in our Kubernetes A-to-Z series covering Namespaces, multi-tenancy, resource quotas, and cluster organization strategies.

    · ~8 min read
    kubernetesa-to-z-seriesnamespacesmulti-tenancyresource-quotas
  • [3/24] P is for Pods: The Basic Building Blocks of Kubernetes

    The third post in our Kubernetes A-to-Z series covering pods, their lifecycle, networking, storage, and multi-container patterns.

    · ~10 min read
    kubernetesa-to-z-seriespodscontainersmulti-container
  • Kubernetes Observability Stack: Prometheus, OpenTelemetry, and Loki

    Build a practical Kubernetes observability stack using metrics, logs, and traces with Prometheus, OpenTelemetry, Loki, and actionable SLO-driven alerting.

    · ~2 min read
    kubernetesobservabilityprometheusopentelemetryloki
  • PostgreSQL Index Size Deep Dive: Why Indexes Grow Fast

    Understand why PostgreSQL indexes can grow quickly in production and how to control index bloat with better schema design, maintenance, and query patterns.

    · ~3 min read
    postgresqldatabaseindexperformancestorage
  • [17/24] Q is for Quality Assurance: Testing in Kubernetes

    Testing strategies, chaos engineering, CI/CD integration, and quality assurance practices for Kubernetes workloads.

    · ~6 min read
    kubernetesa-to-z-seriestestingquality-assurancechaos-engineering
  • [6/24] R is for ReplicaSets: Ensuring High Availability

    The sixth post in our Kubernetes A-to-Z series covering ReplicaSets, scaling strategies, pod disruption budgets, and high availability patterns.

    · ~7 min read
    kubernetesa-to-z-seriesreplicasetshigh-availabilityscaling
  • Stateful Workloads on Kubernetes: PostgreSQL and Kafka Operators

    Run stateful workloads safely on Kubernetes with operator-based patterns for PostgreSQL and Kafka, including storage, scaling, backup, and failure recovery.

    · ~2 min read
    kubernetesstatefulpostgresqlkafkaoperators
  • Service Mesh Deep Dive: Istio vs Linkerd vs Consul Connect

    A comprehensive comparison of service mesh platforms including architecture, features, performance benchmarks, and practical implementation guides for Istio, Linkerd, and Consul Connect.

    · ~12 min read
    service-meshistiolinkerdconsulkubernetes
  • [5/24] S is for Services: Networking and Service Discovery

    The fifth post in our Kubernetes A-to-Z series covering Services, networking patterns, service discovery, and load balancing in Kubernetes.

    · ~7 min read
    kubernetesa-to-z-seriesservicesnetworkingservice-discovery
  • [16/24] T is for Troubleshooting: Common Issues and Solutions

    The fourteenth post in our Kubernetes A-to-Z series covering debugging techniques, common issues, diagnostic commands, and systematic troubleshooting approaches.

    · ~8 min read
    kubernetesa-to-z-seriestroubleshootingdebuggingdiagnostics
  • [18/24] U is for Upgrades: Managing Cluster Lifecycle

    Master the art of Kubernetes upgrades. Learn about version skew policies, node draining, and strategies for zero-downtime cluster maintenance.

    · ~2 min read
    kubernetesa-to-z-seriesupgradesmaintenancelifecycle
  • [9/24] V is for Volumes: Persistent Storage in Kubernetes

    The eighth post in our Kubernetes A-to-Z series covering Volumes, PersistentVolumes, PersistentVolumeClaims, storage classes, and stateful application patterns.

    · ~8 min read
    kubernetesa-to-z-seriesvolumespersistent-storagepv
  • [14/24] Y is for YAML: Mastering the Language of Kubernetes

    Love it or hate it, YAML is the language of Kubernetes. Learn syntax tips, common pitfalls, and tools to validate your manifests.

    · ~2 min read
    kubernetesa-to-z-seriesyamlconfigurationtools
  • [21/24] Z is for Zero-Downtime Deployments: Advanced Deployment Strategies

    The final post in our Kubernetes A-to-Z series covering advanced deployment strategies, GitOps, progressive delivery, canary deployments, and production-ready patterns.

    · ~6 min read
    kubernetesa-to-z-serieszero-downtimedeployment-strategiesgitops
  • [25/26] W is for Workloads: Managing Application Types in Kubernetes

    The twenty-fifth post in our Kubernetes A-to-Z series covering workload types: Pods, ReplicaSets, Deployments, StatefulSets, DaemonSets, Jobs, and CronJobs, with decision guidance and YAML examples.

    · ~12 min read
    kubernetesa-to-z-seriesworkloadsdeploymentstatefulset
  • [26/26] X is for eXtensibility: CRDs, Webhooks, and the API Aggregation Layer

    How Kubernetes extends itself. Custom Resource Definitions, admission webhooks, the API aggregation layer, and kubectl plugins, with real-world examples from cert-manager, Istio, and Argo CD.

    · ~14 min read
    kubernetesa-to-z-seriesextensibilitycrdoperator
$ echo "built with Astro"
© 2026 Nghia Pham | RSS | GitHub | nghia-pham.com