LLM Weekly(2025.03.03-03.09)

😎 网络新闻

  • QwQ-32B:拥抱强化学习的力量。研究人员推出了QwQ-32B,这是一个拥有320亿参数的模型,它利用强化学习来提升推理能力。尽管参数较少,但通过整合类似智能体的推理和反馈机制,QwQ-32B的表现可与更大规模的模型相媲美。该模型可在Hugging Face平台上获取。
  • **人工智能领域的先驱安德鲁·巴托(Andrew Barto)和理查德·萨顿(Richard Sutton)因对强化学习的开创性贡献而荣获2025年图灵奖。**安德鲁·巴托和理查德·萨顿因其在强化学习方面的开创性工作而获得2024年图灵奖。他们的研究为人工智能奠定了重要基础,其应用范围涵盖了聊天机器人、自动驾驶汽车以及个性化推荐等领域。他们的工作还在人工智能和神经科学之间架起了桥梁,揭示了多巴胺在人类和机器学习中所起的作用。
  • 据报道,OpenAI计划对专门的人工智能 “智能体” 每月收取高达2万美元的费用。OpenAI计划对为销售线索管理、软件工程和博士级研究等任务量身定制的专门人工智能智能体每月收取高达2万美元的费用。其主要投资者软银已为这些智能体投入了30亿美元。由于去年运营成本导致亏损约50亿美元,OpenAI希望通过这种方式获取收入。
  • Anthropic公司在E轮融资后,估值达到615亿美元。Anthropic公司以615亿美元的估值获得了35亿美元的融资&#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值