DeepSeek R2有望8月下旬发布?内部人士:不属实
近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。
8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。
早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,上述内部人士曾向记者坦言,该传言真实度不高。
此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。
5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。
大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。
但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。
在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。
- • 探索米其林星级餐厅:官网带你领略世界美食巅峰
- • 工业生产者出厂价格:揭示我国工业经济运行态势的重要指标
- • 男子网球大满贯冠军次数排名榜:盘点网球史上最伟大的选手
- • 衡量推进法治中国能否实现的评判标准探析
- • 《瘟疫公司中文电脑版:一场全球防疫的智慧挑战之旅》
- • 理想ONE汽车:揭秘这家中国汽车制造商的崛起之路
- • 《播出电影网K8经典:重温经典,感受电影魅力》
- • 证监会将助受关税影响较大公司纾困解难,鼓励符合条件企业依法依规赴境外上市
- • “咔嗒编程:开启儿童编程启蒙之旅”
- • 《五年级数学课堂上的趣味故事:智慧的小蜜蜂》
- • 荣耀L4级手机智能工厂首次公开
- • Word文档大小写转换的快捷键技巧,轻松提升办公效率!
- • 2021年青海环湖赛:激情燃烧的赛道,绿色环保的盛会
- • 《青面修罗:一部挑战传统恐怖电影界限的视觉盛宴》
- • 印度航空公司又有航班发动机故障,乘客被迫下机
- • 汉堡:德国通往世界的门户,有一条上海街
- • 66只基金涨超20%!基金经理:医药开始赚钱了!
- • 《我的遗憾,与你有关——一部关于成长与救赎的电影》
- • 林毅夫人民日报撰文:习近平经济思想是扎根中国、放眼世界、引领未来的科学理论
- • 刘俏院长在北大光华40周年院庆主题活动上的发言
- • 潭州学院官网:探索湖南教育新篇章
- • 磁悬浮陀螺:未来交通的革新者
- • 马迭尔冰棍:夏日里的清凉小确幸,价格几何?
- • 现场|奥赛大展浦美开幕,上芭带来《茶花女》对应德加名作
- • 消息人士称加沙停火谈判取得重大进展
- • 揭秘“VK女王”:社交网络中的璀璨星辰
- • 多层、小高层与高层建筑的差异分析
- • 高子华︱不尽海天不尽山——舟山嵊泗马鞍列岛船行记
- • 《最强掌教:引领武林风潮的传奇人物》
- • 上海普陀区疫情:多措并举,共筑防疫防线
- • 中办、国办印发《关于进一步保障和改善民生 着力解决群众急难愁盼的意见》
- • 新冠特效药价格高达2300元一盒,民众担忧用药负担加重
- • 孙允珠裸装:时尚界的独特风格与审美追求
- • 《新浪热议:体育生草场上的帅哥风采》
- • 长沙银行:选举程青龙为第八届董事会职工董事
- • 天眼新知 一束追光,照亮千亿级产业链:演唱会经济的全景洞察
- • 北京新政执行首日:购房者高温下看房,房企火速营销抢客
- • 新浪博客敏感词揭秘:了解平台内容审核标准
- • 福建执业注册管理中心:助力专业人才发展的坚实后盾
- • 越南插头:探索越南电力系统的独特之处
- • 美白补水护肤品哪个牌子好?揭秘市场上最受欢迎的品牌!
- • 广播站栏目:传递声音,编织生活
- • 流感疫苗出现八元/支的历史新低价
- • 前美国劳工统计局局长谴责特朗普解雇其继任者
- • 《浪浪山小妖怪》为何让孩子快乐,让大人沉默
- • 对话TCL中环副总裁鞠霞:“G12+BC”双擎领航,TCL中环SNEC引领光伏行业新标杆
- • 马斯克称将恢复公司 "全天候 "工作,X 停电已基本恢复
- • 三毛:穿越时空的流浪心灵——浅析三毛作品中的情感与人生
- • 湖南临澧县一花炮厂发生爆炸,涉事公司曾因违法违规多次受处罚
- • 《红色警戒2:中国科技时代的崛起与挑战》
- • 适度宽松货币政策取向下首度降准降息!一揽子货币政策三大类共十项
- • 护理查房记录内容:全面了解患者状况,确保护理质量
- • 汽车早报|小米YU7确认参加粤港澳大湾区车展 沃尔沃汽车将在全球裁员近3000人
- • 揭秘美国UFO最真实视频:科技与神秘现象的碰撞
- • 《黄书漫画:揭秘成人漫画的隐秘世界》
- • 银质纪念币:见证历史,传承文化
- • 小学生奖项名称大全:助力成长,彰显荣誉
- • 长安汽车成独立央企?董事长朱华荣这个动作回应
- • 8月7日隔夜要闻:美元四连跌 特朗普拟对芯片征收100%关税 特朗普计划最早下周与普京会面
- • 浩瀚慧鹰德博客:探索科技与智慧的交汇之地
- • 演员王静:从平凡到闪耀,揭秘她的演艺生涯与成长之路
- • 连续四个月稳居新势力首位,何为零跑汽车的爆款秘诀?
- • 在全国生态环境保护大会上的讲话
- • 叶子楣:真正裸露的艺术家灵魂
- • 汽车早报|李想透露理想i8小订用户超3万 捷豹路虎任命塔塔汽车CFO为新任CEO
- • 李老汉和他的三个女儿:岁月里的温情故事
- • 西安交通大学少年班:培养未来科技领军人才的摇篮
- • 北方长龙上市首年即亏损去年差点被*ST 营收与应收账款增速严重背离 溢价511%收购袖珍标的可规避退市风险
- • 北京站:这座百年老站的历史与所属区域
- • 《罗马欲乐园:一场穿越时空的视觉盛宴,在线观看体验指南》
- • 汽化潜热计算公式:揭秘物质从液态到气态的能量转换
- • “啪啪啪”:网络流行语背后的文化内涵与心理解读
- • 我的上影节片单|迷影重重
- • OpenAI 已讨论过从沙特阿拉伯和印度投资者处筹集资金的问题
- • 被控受贿数额特别巨大,中国联通原副总经理曹兴信被公诉
- • 特朗普:将于19日分别与普京和泽连斯基通话
- • 每年费用超2000万美元!《纽约时报》内容授权给亚马逊,可用于AI应用
- • 百亿私募连续两周加仓,仓位指数再破80%关口
- • 纪念是给无法安息的死者的礼物|一周新书推荐
- • 界面早报 | 李强会见欧洲中央银行行长拉加德;印度坠机事故仅1人幸存
- • 中航飞机股份有限公司:中国航空制造业的领军企业
- • 美国股市:标普500指数反弹 鲍威尔发言与特朗普潜在芯片新政齐助推
- • 夏日出境游必看!谨防三种蚊媒传染病→丨安全贴心话
- • 爱康回应“体检十年未查出患癌风险”:以第三方权威机构以及专家建议为准
本文 快租网 原创,转载保留链接!网址:https://wap.kuaizu.me/post/26299.html