接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划
近日,市场再度传出深度求索(DeepSeek)下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。受此消息影响,8月12日早盘,人工智能概念股集体拉升,寒武纪等个股涨幅显著。
8月13日,接近DeepSeek人士向腾讯科技表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。
这已是该备受瞩目的模型年内第二次传出发布消息后又归于沉寂。回顾深度求索近半年的动态,其重心并非推出全新一代模型,而是对现有产品线进行“小步快跑”式的迭代优化。
今年3月,深度求索公司对约660B参数的DeepSeek V3模型进行升级,提升了推理、编程及中文处理能力;5月底,又推出了DeepSeek-R1-0528版本,该版本通过在后训练阶段投入更多算力,显著增强了模型的思维深度与推理能力,并在改写、摘要等多个场景下将“幻觉率”大幅降低了45%至50%。
对于R2模型为何迟迟未能面世,外媒 The Information 于6月的报道揭示了两个可能的核心原因。其一,尽管研发团队已投入数月高强度开发,但公司CEO梁文锋对新模型的性能表现尚不满意。其二,公司或面临算力储备紧缺的困境。据报道,由于英伟达H20芯片的意外禁售,深度求索的算力储备受到影响,公司担心新模型一旦上线,短时间内激增的调用量可能会因算力不足而导致用户体验不佳。
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。
本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。
如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!