Vua Bài Đến Rồi! Hướng Dẫn Claude Code Token Không Giới Hạn Trên Máy Cục Bộ
Claude Code rất mạnh, nhưng tiêu hao Token khiến người ta đau gan!
Cuối cùng, Claude Code có thể kết nối với mô hình cục bộ để làm việc, cấu hình rất đơn giản.
Môi trường dưới đây là Mac Mini4. Môi trường Windows cũng có thể được.
Thời đại hiện nay, nếu chơi AI trên desktop, nên sắm máy chủ nhỏ Mac M series, như mini4\mini4 pro\m3 ultra\m4 max, thần khí AI desktop cá nhân.
Trước tiên, cần nâng cấp LM Studio lên phiên bản mới nhất, tức là 0.4.1, vì phiên bản mới nhất đã thêm hỗ trợ cho Claude Code. (Ollama cũng có thể được)

Bạn có thể chạy bất kỳ mô hình mã nguồn mở nào trên máy cục bộ của mình, miễn là bộ nhớ Mac của bạn đủ. Chúng ta lấy gpt-oss-20b-mlx làm ví dụ, đây là một mô hình mã nguồn mở của OpenAI.

Lưu ý một điểm: Kéo dài Context length tối đa, tức là kéo dài độ dài ngữ cảnh đến mức tối đa mà mô hình hỗ trợ, vì hiệu suất của tác nhân thông minh trong nhiều nhiệm vụ phụ thuộc rất nhiều vào độ dài ngữ cảnh, quá ngắn sẽ không được. Tham số này cũng cần được điều chỉnh cân bằng dựa trên bộ nhớ Mac của bạn và tốc độ suy luận của mô hình. Lưu ý thêm một điểm: Môi trường Mac, ưu tiên tải xuống mô hình định dạng MLX, tốc độ suy luận nhanh hơn mô hình định dạng GGUF.
Tiếp theo, chúng ta cài đặt claude code trong terminal dòng lệnh.
Cấu hình biến môi trường:
export ANTHROPIC_AUTH_TOKEN=lmstudioexport ANTHROPIC_BASE_URL=http://localhost:1234Cài đặt bản thân claude code:
npm install -g @anthropic-ai/claude-codeSau đó, khởi động cluade code:
claude --model gpt-oss-20b-mlxLúc này, claude code sẽ gọi mô hình cục bộ của bạn để xuất ra.
Ngoài việc sử dụng trong terminal, còn có thể sử dụng trong VS Code, cấu hình như sau:
Trước tiên chúng ta cài đặt tiện ích mở rộng Claude Code for VS Code.
Sau đó thiết lập biến môi trường:

{ "claudeCode.environmentVariables": [ { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:1234" }, { "name": "ANTHROPIC_AUTH_TOKEN", "value": "lmstudio" } ]}Sau đó có thể bắt đầu làm việc.
Câu hỏi suy nghĩ: Claude Code không sử dụng mô hình Anthropic có còn là Claude Code đó không?
Mô hình gpt-oss-20b-mlx chúng ta sử dụng tất nhiên không thể so sánh với Opus 4.5, nhưng nếu bạn triển khai Kimi K2.5 trong môi trường cục bộ, hiện tại xem ra, khả năng hoàn toàn không thua kém Opus 4.5.





