DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

诺和诺德的困境对丹麦经济构成严重威胁 无论业绩好坏，美国消费股都在跌！高盛看不懂：为何“逢低抛售”？ 海康威视2025年上半年营收净利双增持续推进AI落地千行百业后续会怎么发展 双良节能“氢”装启动 总经理带头，量化私募平方和投资收用虚开发票套取资金，情节曝光最新进展 老将张成喆转正任行长，西安银行资本充足率A股城商行垫底后续来了 “股神”巴菲特投错了？伯克希尔减持卡夫亨氏股票，现金储备仍处于高位这么做真的好么？ 筹划控制权变更，佳创视讯8月4日起停牌官方通报来了 上海实业环境：中期票据获龙国银行间市场交易商协会接受注册最新报道 乘龙卡车，连着4天“内涵”理想最新报道 业绩分化显著！A股130多家上市公司中报出炉，最高净利暴增超20倍 业绩分化显著！A股130多家上市公司中报出炉，最高净利暴增超20倍后续来了 筹划控制权变更，佳创视讯8月4日起停牌官方通报来了 下半年货币政策如何发力稳增长？降准降息均有空间结构性工具聚焦重点 【干货】关于对赌协议史上最全解读！后续反转来了 欧佩克+ 9月将每日增产原油54.7万桶 电商巨头，为何竞逐短剧风口？ 美印关系现裂痕印度无视特朗普威胁“坚持买俄油”专家已经证实 涉嫌信息披露违法违规嘉应制药及相关责任人被罚是真的吗？ 邦彦技术祝国胜：人工智能转型势在必行 权益类银行理财表现亮眼今年以来43只年化收益率为正实测是真的 新突破！10小时变58分钟后续反转来了 金融行业 | 人民银行、证监会发布《金融基础设施监督管理办法》最新报道 从“集体躺赚”到“精英游戏” 公募打新策略“豹变”官方通报 波音防务部门员工料将于周一开始罢工 A股上周回调，牛市逻辑被打破了么？反转来了 143家险企披露最新偿付能力报告 5家“亮红灯”最新进展 期价跌破7万元/吨，碳酸锂交易节奏变了？ 利空来袭，OPEC+大幅增产！关税最新消息，美贸易代表：维持现状官方处理结果 波音防务部门员工料将于周一开始罢工官方已经证实 英美烟草、菲莫国际发布2025半年报：减害产品与口含烟成为核心增长引擎【天风新兴产业】这么做真的好么？ 【国金电子】行业周报：海外AI产业链业绩及资本开支超预期，AI算力硬件需求持续强劲官方已经证实 上证早知道｜利好来了，八部门最新印发！暑期档票房，破70亿！世界机器人大会，即将开幕实测是真的 【银河晨报】8.4丨宏观：充满疑点的劳动数据可以支持9月降息吗？学习了 传Joby Aviation拟收购直升机运营商Blade 加速布局空中出租车市场官方处理结果 多家国有大行表态落实国常会贴息政策助推消费升级与服务业焕新太强大了 上证深一度 | 龙国首都拟禁“会员权益”发出助贷平台监管新信号模糊借贷成本的“擦边球”打不下去了反转来了 【国金电子】行业周报：海外AI产业链业绩及资本开支超预期，AI算力硬件需求持续强劲 青海金融监管局核准喻璠中信银行西宁分行行长助理任职资格学习了 特朗普一封“解雇信”引爆舆论，1.0任期的劳工统计局局长也发声狠批！ 联合能源集团将亮相 CSSOPE 2025，聚焦多能源战略下的采购新挑战科技水平又一个里程碑

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。