grep -r "benchmark"
5 posts tagged benchmark
- Tiếng Việt tốn hơn x2 token? Data nói khác
- Does Vietnamese really cost 2x+ tokens in LLM prompts? Data from 5626 real messages
- Evaluation: MMLU, GSM8K, HumanEval, custom benchmark
- Local LLM 2026, bài 2: Apple Silicon vs CUDA vs CPU benchmark
- Gần một nửa AI code có lỗi security: đừng hoảng, hãy đặt gate