×
资讯活动

Llama 4 来袭,DeepSeek V3 危矣?AI 开源圈这场大战太震撼!

发布时间:2025-07-03 来源:地知网

小编今天带大家来聊聊 AI 圈最近发生的 “大事件”,简直比电视剧还精彩!

Meta 在近段时间静静的开源了 Llama 4,这一出手,直接在 AI 圈扔下一颗重磅炸弹,把 DeepSeek V3 “炸” 得晕头转向。国内网友看到消息都傻眼了,直呼 “这突袭也太狠了”,国外网友也没闲着,各种犀利调侃,AI 圈瞬间热闹得不行!

图片

小编先给大家详细介绍下 Llama 4 这一 “大家族”。Llama 4 有好几个厉害的成员,各有各的 “看家本领”。


01 Llama 4

Llama 4 Scout堪称 “文档收割机”,专为文档摘要和大代码库推理打造。它的上下文长度直接拉到了 1000 万 tokens,这是什么概念?一本《红楼梦》大约 160 万 token,Llama 4 Scout 能一次性 “读” 6.25 本,而 DeepSeek V3 却只能读 0.8 本,差距一目了然。而且它参数 1090 亿,激活 170 亿,一台 H100 GPU 就能跑起来。

图片

Hugging Face 社区爆料,有开发者用它处理 500 万字代码库,10 分钟就出结果,这效率,简直是文档处理界的 “闪电侠”!

图片


02 Llama 4 Maverick

Llama 4 Maverick是编程神器,更是聊天界的高手,堪称开源圈的 “全能王”。它拥有 4000 亿参数,128 个专家模块,在大模型竞技场(Arena)刷出 1417 分的好成绩。不管是多语言处理、编程,还是视频处理,它都不在话下。

图片


03 Llama 4 Behemoth

Llama 4 Behemoth则是个 “巨无霸”,激活参数 2880 亿,总参数高达 2 万亿,光听这数字就够吓人的。虽然现在还是 “半成品”,但已经展现出了强大的潜力。据 TechCrunch 报道,它在数学推理上暂时落后 GPT - 4o,不过 Meta 团队信心满满,放话优化后会更猛。就是这 “大块头” 对设备要求太高,普通电脑根本跑不动,估计得租个 “核电站” 才能带动它,网友们的调侃也是相当有趣。

图片
图片

图片

再来说说 DeepSeek V3,之前它可是开源圈的 “性价比”,训练成本不到 600 万美元,性能却能和 OpenAI GPT - 4o 硬刚,在开源圈混得风生水起。可 Llama 4 一出现,形势瞬间逆转。X 上有人爆料,Meta 高管听说 DeepSeek R2 要来,吓得连夜催 Llama 4 上线,这 “赶鸭子上架” 的操作,也让这场竞争变得更加扑朔迷离。而且 DeepSeek 前天刚发了新论文,R2 估计已经在来的路上了,不少国内外网友都在猜测,DeepSeek 是不是要憋个大招实现反杀呢?

这场 Llama 4 和 DeepSeek 的较量,背后其实是开源模型的全面崛起。VentureBeat 统计显示,开源模型去年的下载量涨了 87%,Llama 4 首日下载量超 Llama 3 同期的 2 倍,热度高得离谱。对于咱们用户来说,最关心的无非就是超长上下文、多模态和实际效果这些方面。Llama 4 在这些方面表现得相当出色,而 DeepSeek V3 不是多模态,在这场竞争中似乎有点跟不上节奏了。

但这还没完,Qwen 和马斯克的 Grok 也在暗中发力,都在憋大招。可以预见,今年的 AI 圈注定是一场 “龙争虎斗”,各大模型你方唱罢我登场,竞争只会越来越激烈。





写留言