2026.07.05 · 周日工具
←返回首页话题 · Topic
#VLLM
共 9 条相关资讯
2026.07.05 · 周日工具
Blackwell 实测 Qwen3.5 35B MoE NVFP4 量化
2026.07.03 · 周五研究论文
ELDR:面向 PD 分离 MoE 推理的专家局部性感知路由
2026.07.03 · 周五工具
GLM-5.2 128K 推理提速近 60%:vLLM 的 DCP 配置拷贝 bug 被揪出并修复
2026.07.02 · 周四工具
社区开发者为 Ornith 35B 引入 MTP 推测解码,推理提速约 18%
2026.06.30 · 周二开源
vLLM Semantic Router:把多模型协作搬进推理服务层
2026.06.29 · 周一工具
Llama 3.1 405B 单节点 8xA100 多 LoRA 部署实测
2026.06.29 · 周一开源
GLM-5.2 NVFP4 量化在 4×DGX Spark 跑通 128K 推理
2026.06.28 · 周日工具
