Meta 发布Llama 3，能力直逼GPT-4,一己之力拉高开源大模型水位

凭空起惊雷

于 2024-04-24 13:45:00 发布

阅读量1.1k

点赞数 13

CC 4.0 BY-SA版权

分类专栏：物联网 / 互联网 / 人工智能 / 其他文章标签： llama 开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leyang0910/article/details/137997608

物联网 / 互联网 / 人工智能 / 其他专栏收录该内容

554 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

Meta的Llama系列在开源领域取得重大突破，特别是Llama3的发布，性能超越GPT-3.7，与闭源模型竞争加剧。Llama3的强大源于其巨大的训练规模和高质量的数据，Meta计划继续推出更大规模的4000亿参数模型，引发AI赛道的深度思考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Meta麾下“羊驼”一路狂奔在开源的大道上。

在过去的一年里，Llama系列可以说开辟了开源LLM的半壁江山。

嫌弃开源模型能力只有GPT-3.5,不够用?

如今Llama 3发布，又是一石激起千层浪。粗看其基础benchmark，足以让国内外一众大模型公司瑟瑟发抖。借用一句业内人士的话，“性能上来说感觉就是GPT-3.7的水平。一己之力急速拉高了开源水位”。

首先从数据层面看，Llama 3 在15T tokens上进行了训练，践行了又一次堪称恐怖的大力出奇迹；再者从训练资源方面看，2.4万卡集群训练的部署也足以展示Meta的志在必得。

Llama 3让Meta重夺开源大模型的王位，且其性能无限接近甚至超过OpenAI GPT、Gemini和Claude等闭源大模型。

难怪Meta有底气放言，就各自的参数数量而言，经过两个定制的24000 GPU集群训练的Llama 3 8B和Llama 3 70B是目前可用的性能最佳的生成式AI模型之一。

更加劲爆的是。扎克伯格在最新访谈中透露，Llama3的三个版本中，是80亿参数、700亿参数的模型开源了，而超过 4000 亿个模型还在加紧训练的路上……

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

凭空起惊雷 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。