DeepSeek V4预览版4月24日正式放出,GitHub和Hugging Face上星数半天就破纪录。V4-Pro总参数1.6万亿(激活49B),V4-Flash 284B(激活13B),俩都是MoE架构,上下文直接拉到100万token——这意味着整本代码库或者超长文档一次喂进去都不卡。官方宣称,V4-Pro在推理基准上甩开所有开源竞品,编码赛道跟GPT-5.4打平,部分任务甚至干翻GPT-5.2和Gemini 3.0 Pro。
价格更狠:Flash版输入0.14美元/M tokens,输出0.28美元/M;Pro版输入0.145美元/M,输出3.48美元/M,比同级闭源模型便宜30-50%。开发者社区已经炸锅,有人拿Flash版直接跑企业级RAG,QPS轻松上千,成本比V3.2低了差不多40%。腾讯云和阿里云估计很快就会跟进托管,中小企业不用自己搭集群就能玩转长上下文Agent。
金融市场闻风而动。中际旭创、光模块链条昨天盘中异动明显,公募一季报里AI硬件重仓逻辑被再次验证——算力需求不光是GPU,还有存储、带宽、供电全链条。短期看,这波开源红利能持续到6月底,等通义、Kimi新版跟进,价格战估计又得重演。不过监管层面,中国刚表态要严控美资进顶尖AI企业,DeepSeek这种纯国产路线反而成了香饽饽。
建议大家现在就去Hugging Face拉权重试试Flash版做个demo,晚了可能又得等排队。真正能吃到红利的,是那些把V4塞进垂直场景的团队,而不是光喊口号的。


评论一下吧
取消回复