未登录用户
首 页
书 架
登录系统
注册账号
联系我们
duidaima.com
版权声明
闽ICP备2020021581号
闽公网安备 35020302035485号
搜索
我要提问
随便写写
我要写书
自己部署 GLM4.7 或者 MiniMax2.1,能接入 Claude code 或者 opencode 么?
发布于 3小时前
15 热度
9 评论
携酒天涯
0 粉丝 52 篇博客
关注
打赏
公司有设备可以本地部署,想求问:
1.本地部署后的 API 接口,是否能接入 Claude code 或者 opencode ?
2.自己部署的开源模型,和 coding plan 里的 api ,功能和效果是一样的么?
用户评论
弄潮儿
可以啊,自己搞个大模型网关,通过这个网关来调用网关后面的大模型能力,就像 nginx 差不多
2026/1/21 12:00:00
[
0
]
[
0
]
回复
原木风
好几个开源 llm 网关,统一所有接口而且可以遥测和统计 token ,另外多卡用 vllm 或 sglang 部署都有很好的并发优化。必须先部署上之后效果需要不断优化,就对着这俩文档研究参数和基本原理就行。但是我不建议使用 claude code router ,至少公司使用这个不可行,推荐 Bifrost go 写的比 litellm python 的快。难点就是瞬时 token 数量会不会爆显存,如果观测一段时间爆了要么加算计要么上手段比如 fp8 (前提调点精度能不能接受)
2026/1/21 11:57:00
[
0
]
[
0
]
回复
李明发
code plan 9.9 5 小时 40 条 prompt.
手上有 cursor + claude sonnet 4.5 + codex
整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。
目前还没有强烈感觉到它很差劲的地方。平替是可以的
2026/1/21 11:55:00
[
0
]
[
0
]
回复
张蜚
Ollama 已经提供 Anthropic Compatible API 了: https://x.com/ollama/status/2012434308091224534
但模型只是 Claude Code 调用的一部分,工具是另一个大头,比如 Web Search 能力是服务提供商提供的,内网自己做 Web Search 的效果不管好坏,肯定是跟服务提供商的有区别。
另外就是模型的多模态能力,GLM 4.7 我不清楚是否有变动,4.6 本身没有视觉理解能力,得通过 MCP Tool 调用智谱的服务来实现,所以你还得额外部署视觉模型以及研究要如何通过 MCP 调用视觉模型服务。
2026/1/21 11:53:00
[
0
]
[
0
]
回复
似水流年
先说结论 不好用。能用。一直听人吹,他们真用过嘛。等一个工程化,当前使用应该是原始人。等轮子吧。现在修 al 写的 bug
2026/1/21 11:50:00
[
0
]
[
0
]
回复
一个人流浪
后端要做接口适配, 现在市面上流行的两种接口 OPENAI 和 Cluad 的 至少需要兼容一个
2026/1/21 11:48:00
[
0
]
[
0
]
回复
北风吹
可以,不过 cc 一个窗口一秒几十次请求,你确定你们的 gpu 资源够么
2026/1/21 11:45:00
[
0
]
[
0
]
回复
一世煙花
不好说,我从 glm4.6 用下来,最开始和 cc 一起用,有很多 bug,乱码,报错等等,这些不知道是在模型层面修复,还是哪里的,可能存在一些使用上的问题
2026/1/21 11:43:00
[
0
]
[
0
]
回复
骤雨初歇
可以是可以,但是 GLM4.7 的硬件成本非常高,一般的公司搞不下来的,你确定能说服公司搞?
2026/1/21 11:41:00
[
0
]
[
0
]
回复
点击加载更多评论
吐槽.灌水
449 成员 |
1836 话题
+我要提问
+随便写写
可能感兴趣的话题
如何用一句话证明你是老程序员?
短视频中毒,该如何戒掉?
家里远程公司的电脑写代码,如何体验最好?
你们都vibe coding 了吗?还有跟我一样使用传统编程方式的码农吗?
手上有 cursor + claude sonnet 4.5 + codex
整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。
目前还没有强烈感觉到它很差劲的地方。平替是可以的
但模型只是 Claude Code 调用的一部分,工具是另一个大头,比如 Web Search 能力是服务提供商提供的,内网自己做 Web Search 的效果不管好坏,肯定是跟服务提供商的有区别。
另外就是模型的多模态能力,GLM 4.7 我不清楚是否有变动,4.6 本身没有视觉理解能力,得通过 MCP Tool 调用智谱的服务来实现,所以你还得额外部署视觉模型以及研究要如何通过 MCP 调用视觉模型服务。