Vua Bài Đến Rồi! Hướng Dẫn Claude Code Token Không Giới Hạn Trên Máy Cục Bộ

Claude Code rất mạnh, nhưng tiêu hao Token khiến người ta đau gan!

Cuối cùng, Claude Code có thể kết nối với mô hình cục bộ để làm việc, cấu hình rất đơn giản.

Môi trường dưới đây là Mac Mini4. Môi trường Windows cũng có thể được.

Thời đại hiện nay, nếu chơi AI trên desktop, nên sắm máy chủ nhỏ Mac M series, như mini4\mini4 pro\m3 ultra\m4 max, thần khí AI desktop cá nhân.

Trước tiên, cần nâng cấp LM Studio lên phiên bản mới nhất, tức là 0.4.1, vì phiên bản mới nhất đã thêm hỗ trợ cho Claude Code. (Ollama cũng có thể được)

Bạn có thể chạy bất kỳ mô hình mã nguồn mở nào trên máy cục bộ của mình, miễn là bộ nhớ Mac của bạn đủ. Chúng ta lấy gpt-oss-20b-mlx làm ví dụ, đây là một mô hình mã nguồn mở của OpenAI.

Lưu ý một điểm: Kéo dài Context length tối đa, tức là kéo dài độ dài ngữ cảnh đến mức tối đa mà mô hình hỗ trợ, vì hiệu suất của tác nhân thông minh trong nhiều nhiệm vụ phụ thuộc rất nhiều vào độ dài ngữ cảnh, quá ngắn sẽ không được. Tham số này cũng cần được điều chỉnh cân bằng dựa trên bộ nhớ Mac của bạn và tốc độ suy luận của mô hình. Lưu ý thêm một điểm: Môi trường Mac, ưu tiên tải xuống mô hình định dạng MLX, tốc độ suy luận nhanh hơn mô hình định dạng GGUF.

Tiếp theo, chúng ta cài đặt claude code trong terminal dòng lệnh.

Cấu hình biến môi trường:

export ANTHROPIC_AUTH_TOKEN=lmstudio

export ANTHROPIC_BASE_URL=http://localhost:1234

Cài đặt bản thân claude code:

npm install -g @anthropic-ai/claude-code

Sau đó, khởi động cluade code:

claude --model gpt-oss-20b-mlx

Lúc này, claude code sẽ gọi mô hình cục bộ của bạn để xuất ra.

Ngoài việc sử dụng trong terminal, còn có thể sử dụng trong VS Code, cấu hình như sau:

Trước tiên chúng ta cài đặt tiện ích mở rộng Claude Code for VS Code.

Sau đó thiết lập biến môi trường:

{    "claudeCode.environmentVariables": [        { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:1234" },         { "name": "ANTHROPIC_AUTH_TOKEN", "value": "lmstudio" }     ]}

Sau đó có thể bắt đầu làm việc.

Câu hỏi suy nghĩ: Claude Code không sử dụng mô hình Anthropic có còn là Claude Code đó không?

Mô hình gpt-oss-20b-mlx chúng ta sử dụng tất nhiên không thể so sánh với Opus 4.5, nhưng nếu bạn triển khai Kimi K2.5 trong môi trường cục bộ, hiện tại xem ra, khả năng hoàn toàn không thua kém Opus 4.5.

Vua Bài Đến Rồi! Hướng Dẫn Claude Code Token Không Giới Hạn Trên Máy Cục Bộ

You Might Also Like

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm qua

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này

Hướng dẫn vận hành ổn định AI Browser 24 giờ