通用
综合对话、推理、长上下文与产品完成度
#1
DeepSeek V3.2 DeepSeek
通用对话、推理、长上下文、性价比
MMLU 90.1%,HumanEval 92.5%,1M+ context
98
推荐
#2
GLM-5 Zhipu AI
综合智能、低幻觉率、国产算力适配
HLE 50.4%,Hallucination Rate 1.2%
96
#3
Kimi K2 Moonshot AI
长文理解、中文体验、开放权重影响力
LMSYS Arena #1 open-weight,1.04T params
95
#4
Doubao Seed 2.0 ByteDance
产品化、Agent 场景、多模态联动
多模态能力强,适合字节生态产品化
93
#5
MiniMax M2.7 MiniMax
通用能力平衡、生成式交互、多模态协同
Arena code 1445,综合产品成熟度高
91