在核心能力上,M2.7在SWE-bench Pro...
在核心能力上,M2.7在SWE-bench Pro中取得56.22%成绩,接近国际一线水平;同时在VIBE-Pro、Terminal Bench 2等真实工程测试中表现突出,支持端到端项目交付与复杂系统理解。
办公场景方面,其在 GDPval-AA 的ELO得...
办公场景方面,其在 GDPval-AA 的ELO得分是1495,为开源最高,并显著提升Office文档处理与多轮编辑能力。
M2.7现已在MiniMax Agent与开放平台全球上线。
业内认为,随着龙虾走红Agent范式加速落地,M2...
业内认为,随着龙虾走红Agent范式加速落地,M2.7标志着AI正从工具阶段迈向具备自我演化能力的系统阶段。
(澎湃新闻记者 范佳来)
: