在人工智能技术迭代加速的今天,多模态大模型正在掀起认知革命的浪潮。我们针对当前最受关注的两大顶尖模型(以下简称模型A与模型B),设计了包含12个维度、38项细分指标的测评体系,通过自主研发的M³Eval多模态评估平台,在72小时连续测试中获得超过150GB的实测数据,揭示了两大模型在视觉认知领域的真
技术Geek,分享技术学习路上的解决方案,喜欢我的文章就关注我
在人工智能技术迭代加速的今天,多模态大模型正在掀起认知革命的浪潮。我们针对当前最受关注的两大顶尖模型(以下简称模型A与模型B),设计了包含12个维度、38项细分指标的测评体系,通过自主研发的M³Eval多模态评估平台,在72小时连续测试中获得超过150GB的实测数据,揭示了两大模型在视觉认知领域的真