就在3月24日晚,也就是刚刚,没有预兆,DeepSeek 悄悄在 Hugging Face 平台上面更新了它的 V3 模型,DeepSeek-V3-0324。
看了许多 X 网友的帖子发现,DeepSeek-V3-0324 模型(以下统称最新版V3)在前端代码的生成能力上有了质的提升,审美方面也提升了不少,甚至有网友说可以媲美 Claude 3.7 Sonnet。
网友表示最新版 V3 的编码能力已经接近目前地表最强扛把子 Claude 3.7 了。
DeepSeek 也在官方微信群通知,V3 模型已经完成小版本的升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。
最新版 V3 主要更新:
1. 上下文窗口达到 128k(之前64k)( fp注:此条持疑,旧版本也是 128k,只是很多平台都部署的 64k );
2. 代码能力有了质的提升,审美也跟上了;
3. 还是老规矩,免费、开源、可商用,更新变成了 MIT 开源许可。
Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~进群之后,你有机会得到:
高浓度的主流模型(如 DeepSeek 等)开发交流;
资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;
- 好用、有趣的产品/案例,Founder Park 会主动做宣传。
01
模型规模与架构
DeepSeek-V3 模型参数 685B,每个 token 激活 37 亿参数,继续沿用 “混合专家系统”(MoE)架构,由 256 个 “专家模型” 组成,根据问题选择 8 位专家协作,采用多头潜在注意力(MLA)降低推理时 KV 缓存,提升推理效率;引入无辅助损失的负载平衡策略,动态调整专家负载;使用多 token 预测(MTP)目标,增加训练信号密度,提高数据效率。
同时,最新版 V3 上下文窗从 64k 提升到128k,支持超长文本理解和生成。不过,有细心的群友发现论文已经的 128k 了,但是官方 API 文档中还是 64k,可能是做了限制,又或是还没更新。
从最新版 V3 与其同类产品的基准性能中,V3 在数学、代码、逻辑推理、知识问答等方面表现优秀,相比 V2 版本有显著提升。
02
实测案例
2.1 代码能力及审美
输入:
用 Vue 3 或 React 编写一个动态天气卡片组件,要求: 1. 响应式布局,适配移动端和桌面端 2. 包含天气图标(如晴/雨/云)、温度、城市搜索输入框 3. 背景色根据天气类型动态变化(如晴天为渐变橙,雨天为渐变蓝)
4. 悬停时有微交互动画(如卡片浮动)
附:使用 Tailwind CSS 或 CSS-in-JS 实现样式。
以上的效果,一遍就过,输入城市名字,就能给出响应的天气卡片,同时背景颜色也会根据天气情况适应变化(当然天气我没配API,都是随机的),响应式布局也ok,网页移动端均适配,审美确实也不错,跟上了。
2.2 数学推理能力
输入:若一个长方体的长、宽、高分别增加 10%、20%、15%,体积增加了多少百分比?
测试模型能否正确分步计算,并给出逻辑清晰的解释。
从模型给出的答案来看,这个数学题的解题思路还是非常清晰的,输出速度也非常快,也没有过多的废话。
2.3 多轮对话与知识问答
输入:量子计算的主要优势是什么? 模型回答后,继续追问:它与传统计算机在 Shor 算法上的具体区别是什么?
继续追问:用表格总结一下量子计算和传统计算的主要区别
连续追问细节,测试上下文保持能力。
刚好前段时间看到朋友关于量子计算的文章,就问了一个关于量子计算的问题,从有限的知识,整体来看,连续追问 3 次之后,上下文的关联能力和一致性还是很不错的,懂量子计算的朋友们也帮我检查一下回答的质量怎么样,欢迎评论区留言。
2.4 高难度翻译
输入: 将以下包含文化隐喻的句子翻译成英语,并解释如何处理隐喻部分:“这个算法像‘老黄牛’一样稳定,但缺乏‘灵鹤’的灵活性。”
用豆包、百度翻译进行验证。
翻译效果不错,翻译成英文的句子再让豆包、百度翻译都能进行中文意思的还原,处理隐喻部分也解释到位。
2.5 长文本理解与摘要
输入:请用500字概括这篇论文的主要贡献和方法
我用 DeepSeek-V3-0324 的论文进行了长文本的测试,论文字数应该是有几万字的,并且是全英,总结的效果和追问都很准确,该模型就是在 2048 个 NVIDIA H800 GPU 的集群上训练出来的。
03
Last but not least
从以上 5 个方面,包括代码能力、数学推理能力、上下文关联、翻译以及长文本理解来看,V3 确实有了质的提升,尤其是代码能力,生成速度快,审美能力也大幅度提升,相比以往大多数模型的审美,确实像网友所说,可以跟 Claude 3.7 Sonnet 媲美了。
最后,还有就是刚刚开源的最新版 V3 同样可商用,该模型权重已开源在 HuggingFace,可用于研究和商业用途。
AI Coding,它在东方升起来了。
DeepSeek nb!
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除