#llm
10 articles
GLM-5.1 vs Claude、GPT、Gemini、DeepSeek:智谱AI最新模型综合评测
智谱AI的GLM-5.1声称达到Claude Opus 4.6编程性能的94.6%——完全基于华为芯片训练,并开放权重。以下是它与2026年各大前沿LLM的详细对比。
Claude Mythos(Opus 5)泄露:我们目前所知道的一切
Anthropic 的下一代 Claude Mythos 模型在一次数据泄露中被曝光。以下是泄露文件中关于其编码、推理和网络安全能力的内容——以及这对 AI 意味着什么。
Claude Opus 4.6 与 Sonnet 4.6:你需要了解的一切
深入解析 Anthropic 的 Claude Opus 4.6 与 Sonnet 4.6——迄今为止最强大的 Claude 模型,支持 100 万 token 上下文窗口、自适应思考模式,并在多项基准测试中达到业界顶尖水平。
MiniMax M2.7:能与Claude和GPT媲美的自进化AI模型,价格仅为其一小部分
MiniMax M2.7是新一代旗舰文本模型,具备自我进化能力,SWE-Pro得分56.22%,速度达100 TPS,输入价格仅$0.30/百万tokens。从基准测试、定价和智能体能力等维度,全面对比M2.7与Claude Opus 4.6、GPT-5和Gemini 3.1。
Claude Sonnet 5:关于Anthropic的Fennec模型我们所知的一切
Claude Sonnet 5(Fennec)已推出,具有突破性的82.1% SWE-Bench分数、100万token上下文和Opus 4.5成本的一半。以下是我们所了解的一切。
GPT-5.3 Garlic 现已登陆WaveSpeedAI:关于OpenAI下一代模型的所有信息
GPT-5.3 'Garlic'据传具有400K上下文、128K输出和高密度训练,将GPT-6级别的推理能力以更快、更便宜的方式呈现。
Kimi K2.5现已登陆WaveSpeedAI:Moonshot视觉智能体模型完全解析
Kimi K2.5是Moonshot AI推出的开源1T参数模型,具备Agent Swarm技术、256K上下文和多模态能力。本文提供完整解析。
DeepSeek V4:关于即将推出的编码AI模型的所有信息
DeepSeek V4 将在2026年2月推出,具有革命性的编码能力。以下是我们对其架构、功能和基准的了解。
WaveSpeedAI vs OpenRouter:选择哪个AI API平台?
比较WaveSpeedAI和OpenRouter的AI API服务。了解模型专注领域、价格和用途的关键差异,涵盖图像/视频与LLM工作负载。
WaveSpeedAI vs Together AI:哪个AI推理平台最适合您的应用?
比较WaveSpeedAI和Together AI的AI推理能力。发现哪个平台提供更好的多模态功能、模型选择和价值。