采用华为昇腾国产算力,背后布摆价格大幅下调,助力V正性能比肩顶级闭源模型,脱英湖北来凤贩毒新闻网DeepSeek V4终于来了!伟达

4月24日,背后布摆DeepSeek官方正式发文,助力V正称DeepSeek V4的脱英预览版本正式上线并同步开源。
DeepSeek V4拥有Pro与Flash两个版本模型,伟达分别对应网页端/App上的背后布摆“专家模式”与“快速模式”。

DeepSeek V4 Pro的助力V正参数达到1.6T,激活参数49B,脱英湖北来凤贩毒新闻网预训练数据33T,伟达上下文长度达到1M。背后布摆
DeepSeek V4 Flash的助力V正参数达到284B,激活参数13B,脱英预训练数据32T,上下文长度同样达到1M。
那么DeepSeek V4的性能表现如何呢?根据DeepSeek公布的测试数据:
在Agent能力方面,DeepSeek V4 Pro在Agentic Coding测评中,是开源模式中最佳水平,交付质量接近Opus 4.6非思考模式,与Opus思考模式还存在一定差距。

在世界知识方面,DeepSeek V4 Pro仅稍落后于闭源模型Gemini-Pro-3.1。
而在推理性能方面,DeepSeek V4 Pro在已公开评测的开源模型中排名第一。

DeepSeek V4 Pro与V4 Flash的API已经同步上线,价格上Pro版本每百万token输入(缓存未命中)12元,输出24元,而Flash版本则是每百万Token输入(缓存未命中)1元,输出2元。
不过DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。

实际上目前DeepSeek V4的价格已经在行业内非常有竞争力,而通过这番注解,可以看到DeepSeek V4并未采用CUDA生态,而是实现了国产化适配,因此价格有望一降再降。
虽然发布比大家想象中要更晚一些,但是DeepSeek V4的意义还是比较重大的,它意味着国产顶级开源大模型在推理环节已经摆脱对英伟达GPU的依赖。