DeepSeek R1 “小更新”,网友:“讲真这其实就是 R2 吧。”

前言

DeepSeek 终于还是在端午节前来炸场了:R1 更新新版本 DeepSeek - R1 - 0528,看名字你可能以为是个小版本更新,但实际上在 LiveCodeBench 上几乎与 OpenAI o3 - high 相当!

“讲真这其实就是 R2 吧。” 不怪网友们惊呼声一片,看第一波实测结果,就知道事情并不简单。

根据 DeepSeek 官方信息,目前官方网站、App 和小程序都已经上新了 R1 - 0528。

一手实测

先简单做一个数学题:一个工厂生产两种产品 A 和 B,生产一件 A 产品需要 3 个单位的原材料甲和 2 个单位的原材料乙,生产一件 B 产品需要 4 个单位的原材料甲和 1 个单位的原材料乙。已知工厂现有原材料甲 100 个单位,原材料乙 60 个单位,A 产品每件利润为 50 元,B 产品每件利润为 40 元,问如何安排生产才能使利润最大化?

在思考了118秒后给出回答:

再来看一个案件推理题:在一个密室中,发现了一具尸体,死者身旁有一封神秘的信件,房间门窗紧闭,只有一个小窗户但无法让成年人通过,现场还有一些奇怪的粉末。已知嫌疑人有 A、B、C 三人,A 是死者的商业竞争对手,B 是死者的秘书,C 是一个神秘的陌生人,根据这些线索推理出可能的凶手及作案手法。

推理思考了219秒,看来还是挺烧脑的,思考后给出了推测:

最后来看一下代码能力:生成一段 HTML/CSS/JS 代码,用于创建一个电商网站的促销活动页面,需包含轮播图展示商品、倒计时功能显示活动剩余时间、用户点击按钮可加入购物车等功能。

仅仅思考了16秒,共746行代码,结果还是非常惊艳的,过程没有多余对话,各种动效和颜色搭配都很符合现代审美。

结语

有业内人士猜测,是否模型架构不更新,只是增加或调整了训练数据,DeepSeek 就不将更新定义为大版本升级,而业内其他模型给出明显的版本号迭代则是一种品牌营销需求。

除了上述模型能力,开发者也希望未来 DeepSeek R2 若进行升级能大幅提升上下文长度,以及增加多模态的能力,毕竟这两个方面的能力对于生产使用很重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值