
DeepSeek向开发者发送邮件披露,DeepSeek V4正式版将于 7月中旬上线,新版本将完成功能与性能升级;同步推出峰谷分时API计费机制,工作日高峰时段调用费用翻倍,以此平衡算力资源、改善服务稳定性。
官方划定北京时间9:00-12:00、14:00-18:00为算力高峰,V4 Pro、V4 Flash两套模型执行差异化收费,高峰各项单价均为平峰两倍。V4 Pro缓存命中输入平峰0.025元/百万tokens,高峰0.05元;缓存未命中输入平峰3元、高峰6元;输出平峰6元、高峰12元。V4 Flash价格更低,缓存命中输入平峰0.02元、高峰0.04元,未命中输入与输出同样翻倍计费。平台将在调价前24小时邮件通知用户,不接受新定价可申请退费。
此次分时调价并非单纯涨价,而是应对算力挤兑的资源调控手段。数据显示,DeepSeek V4 Flash 周调用量突破4.66万亿tokens,连续六周登顶全球单模型调用榜,庞大流量长期拉高集群负载,办公时段接口超时、服务波动频发。高峰加价可引导离线批量任务错峰运行,保障金融、代码、智能体等高优先级实时业务稳定。官方同时提及,下半年昇腾超节点批量落地后,V4 Pro价格有望大幅下调。
回顾定价历程,DeepSeek此前持续下调API成本。4月24日V4预览版上线,两天后全系降价,缓存命中输入价格降至首发十分之一;V4 Pro叠加限时2.5折优惠,创下全球大模型低价纪录,也直接催生海量调用需求。
今年4月推出的V4预览版标配百万字上下文,支持工具调用、代码智能体等企业功能,适配研发、金融、法律多领域。实测其Agent编码能力优于Sonnet 4.5,效果接近Claude Opus 4.6非思考模式;轻量化V4 Flash推理速度快、成本更低,简单任务表现接近Pro版,复杂任务存在差距。此前适配预览版的DSpark投机解码框架可提速60%-85%,相关技术也将落地正式版,优化推理效率。
产品迭代背后,DeepSeek资本与人才储备同步加码。6月16日消息,公司完成首轮外部融资,募资超 500 亿元,投后估值3380亿元。创始人梁文锋出资200亿元为最大出资方,腾讯、宁德时代、网易、京东、IDG 等多家企业与机构相继参投。
人才层面,企业开启大规模扩招,计划各部门人员规模至少翻倍,在北京、杭州两地开放33个岗位,覆盖算法、研发、运维、数据等七大类别,全部岗位接收实习生。






