版本升级！DeepSeek又变强了-马小秋公主号

3月25日晚，DeepSeek称，DeepSeek-V3模型已完成小版本升级，目前版本号DeepSeek-V3-0324（下文称“新版V3模型”）。同时，DeepSeek对模型能力展开全面分析。这是该公司在3月24日宣布DeepSeek-V3模型完成小版本升级后，对模型能力的官方详细介绍。　　据介绍，用户登录DeepSeek官方网页、App、小程序进入对话界面后，关闭深度思考即可体验新版V3模型。“API接口和使用方式保持不变。如非复杂推理任务，建议使用新版本V3模型，即刻享受速度更加流畅、效果全面提升的对话体验。”DeepSeek称。　　模型能力全面进阶　　在推理能力方面，DeepSeek称，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过国际头部模型的得分成绩。　　在前端开发能力方面，DeepSeek介绍，在HTML等代码前端任务上，新版V3模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。部分网友体验称，新版V3的设计能力甚至超过了DeepSeek-R1。　　在中文写作方面，新版V3模型基于DeepSeek-R1的写作水平进行了进一步优化，同时特别提升了中长篇文本创作的内容质量。同时，DeepSeek称，在中文搜索方面，新版V3模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。　　此外，DeepSeek称，新版V3模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。　　坚持开源精神　　在模型开源方面，DeepSeek称，此次开源仓库（包括模型权重）统一采用MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。　　据介绍，新版V3模型与之前的DeepSeek-V3使用同样的base模型，仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json（tool calls相关变动）。模型参数约660B，开源版本上下文长度为128K（网页端、App和API提供64K上下文）。同时，DeepSeek分享了新版V3模型的模型权重。　　业内人士称，DeepSeek继续坚持开源精神，直接采用MIT开源协议，让开发者可以自由修改、商用，这彻底打破了闭源AI对顶级代码模型的垄断。DeepSeek让更多创业团队和个人开发者都能平等地享受顶级AI能力，真正实现了“技术平权”。　　此前，DeepSeek宣布，从2月24日起将开源5个代码库，以完全透明的方式与全球开发者社区分享他们的研究进展。　　3月1日中午，DeepSeek公布模型推理成本利润细节，并披露成本利润率关键信息。DeepSeek称，假定GPU租赁成本为2美元/小时，总成本为87072美元/天……统计包括网页、App和API在内的所有负载，如果所有tokens全部按照DeepSeek-R1的定价计算，理论上一天的总收入为562027美元，成本利润率为545%。（文章来源：上海证券报）

免责声明：本文章由会员“极目新闻”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

版本升级！DeepSeek又变强了

相关推荐