😎 网络新闻
- QwQ-32B:拥抱强化学习的力量。研究人员推出了QwQ-32B,这是一个拥有320亿参数的模型,它利用强化学习来提升推理能力。尽管参数较少,但通过整合类似智能体的推理和反馈机制,QwQ-32B的表现可与更大规模的模型相媲美。该模型可在Hugging Face平台上获取。
- **人工智能领域的先驱安德鲁·巴托(Andrew Barto)和理查德·萨顿(Richard Sutton)因对强化学习的开创性贡献而荣获2025年图灵奖。**安德鲁·巴托和理查德·萨顿因其在强化学习方面的开创性工作而获得2024年图灵奖。他们的研究为人工智能奠定了重要基础,其应用范围涵盖了聊天机器人、自动驾驶汽车以及个性化推荐等领域。他们的工作还在人工智能和神经科学之间架起了桥梁,揭示了多巴胺在人类和机器学习中所起的作用。
- 据报道,OpenAI计划对专门的人工智能 “智能体” 每月收取高达2万美元的费用。OpenAI计划对为销售线索管理、软件工程和博士级研究等任务量身定制的专门人工智能智能体每月收取高达2万美元的费用。其主要投资者软银已为这些智能体投入了30亿美元。由于去年运营成本导致亏损约50亿美元,OpenAI希望通过这种方式获取收入。
- Anthropic公司在E轮融资后,估值达到615亿美元。Anthropic公司以615亿美元的估值获得了35亿美元的融资&#x