01
开源 + MIT 协议 ── 模型权重 + 推理代码全部开源,企业可自部署
02
671B MoE 架构 ── 总参数 671B,每个 token 仅激活 37B,推理效率高
03
极低 token 单价 ── 输入 ¥1/M tokens、输出 ¥8/M tokens,是 GPT-4o 的 1/10
04
API 100% OpenAI 兼容 ── 已有项目改个 base_url 即可切换
05
缓存命中折扣 ── 重复输入 90% 折扣,对话场景成本进一步降
06
国内可直连 ── 国内 API 可用,无需梯子