让这些大模型来解答数学题目,看看它们的能力如何。
这个题目,乍一看很难,其实仔细想想,也比较简单,是3的倍数。
成绩统计表。
文心一言,明显错误。
豆包比较聪明,一眼就看出来了。
元宝也试出来了,不错。
通义千问和元宝差不多。
星火自己有点迷茫了,本来思路对了,但是又否定了自己,结果错了。
Kimi编程了,但是最终错误。
天工也是试出来了,和通义差不错。
智谱清言编程了,结果对了,但是没给过程。
纳米的思路也很清晰,正确。
蓝心千寻在数学方面不是很强啊。
DeepSeek的思路也是很清晰,正确。
小结:这个题目不是很难,出错的有:文心一言、Kimi、讯飞星火、蓝心千寻。希望这几个大模型继续加油,不断完善。
,