给deepseek出一道烧脑题,看看哪个版本的deepseek回答比较靠谱

咱们给deepseek出一道题,也烧烧他的脑吧。用这个问题去问模型,你有可能会发现很多模型在乱答。

题目如下

请用我给你的4个数字,通过加、减、乘、除、括号,组成一个运算,使得结果为24。注意:数字需要全部使用我提供的数字:4 4 6 8

腾讯云满血deepseek回答

用腾讯云的满血版测试了一下,思考了220秒,给出了正确答案
file

本地部署的deepseek-1.5

思考了多个小时之后,给出了不可能的回答。下面图上显示的70.9是不对的,实际上思考了2个小时左右,看看输出的token就知道了。
file

纳米满血deepseek回答

用360的纳米搜索满血版测试了一下,思考了46.94秒,给出了正确答案,两个答案。
file

对比了一下,还是满血的DeepSeek R1 靠谱。你那里的测试情况是怎么样的呢?

发表回复 0

Your email address will not be published.