Vua Bài Đến Rồi! Hướng Dẫn Claude Code Token Không Giới Hạn Trên Máy Cục Bộ

2/11/2026
3 min read

Claude Code rất mạnh, nhưng tiêu hao Token khiến người ta đau gan!

Cuối cùng, Claude Code có thể kết nối với mô hình cục bộ để làm việc, cấu hình rất đơn giản.

Môi trường dưới đây là Mac Mini4. Môi trường Windows cũng có thể được.

Thời đại hiện nay, nếu chơi AI trên desktop, nên sắm máy chủ nhỏ Mac M series, như mini4\mini4 pro\m3 ultra\m4 max, thần khí AI desktop cá nhân.

Trước tiên, cần nâng cấp LM Studio lên phiên bản mới nhất, tức là 0.4.1, vì phiên bản mới nhất đã thêm hỗ trợ cho Claude Code. (Ollama cũng có thể được)

Bạn có thể chạy bất kỳ mô hình mã nguồn mở nào trên máy cục bộ của mình, miễn là bộ nhớ Mac của bạn đủ. Chúng ta lấy gpt-oss-20b-mlx làm ví dụ, đây là một mô hình mã nguồn mở của OpenAI.

Lưu ý một điểm: Kéo dài Context length tối đa, tức là kéo dài độ dài ngữ cảnh đến mức tối đa mà mô hình hỗ trợ, vì hiệu suất của tác nhân thông minh trong nhiều nhiệm vụ phụ thuộc rất nhiều vào độ dài ngữ cảnh, quá ngắn sẽ không được. Tham số này cũng cần được điều chỉnh cân bằng dựa trên bộ nhớ Mac của bạn và tốc độ suy luận của mô hình. Lưu ý thêm một điểm: Môi trường Mac, ưu tiên tải xuống mô hình định dạng MLX, tốc độ suy luận nhanh hơn mô hình định dạng GGUF.

Tiếp theo, chúng ta cài đặt claude code trong terminal dòng lệnh.

Cấu hình biến môi trường:

export ANTHROPIC_AUTH_TOKEN=lmstudio
export ANTHROPIC_BASE_URL=http://localhost:1234

Cài đặt bản thân claude code:

npm install -g @anthropic-ai/claude-code

Sau đó, khởi động cluade code:

claude --model gpt-oss-20b-mlx

Lúc này, claude code sẽ gọi mô hình cục bộ của bạn để xuất ra.

Ngoài việc sử dụng trong terminal, còn có thể sử dụng trong VS Code, cấu hình như sau:

Trước tiên chúng ta cài đặt tiện ích mở rộng Claude Code for VS Code.

Sau đó thiết lập biến môi trường:

{    "claudeCode.environmentVariables": [        { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:1234" },         { "name": "ANTHROPIC_AUTH_TOKEN", "value": "lmstudio" }     ]}

Sau đó có thể bắt đầu làm việc.

Câu hỏi suy nghĩ: Claude Code không sử dụng mô hình Anthropic có còn là Claude Code đó không?

Mô hình gpt-oss-20b-mlx chúng ta sử dụng tất nhiên không thể so sánh với Opus 4.5, nhưng nếu bạn triển khai Kimi K2.5 trong môi trường cục bộ, hiện tại xem ra, khả năng hoàn toàn không thua kém Opus 4.5.

Published in Technology

You Might Also Like

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạnTechnology

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn Giới thiệu...

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mấtTechnology

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất G...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõiTechnology

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi Giới thiệu Với sự phát triển nhanh chóng của trí tuệ nhân tạo...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 Trong thời đại công nghệ phát triển nhanh chóng ngày nay, trí tuệ nhân tạo (AI) đã trở ...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Trong lĩnh vực điện toán đám mây đang phát triển nhanh chóng, Amazon Web Services (AWS) luôn là ...