产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于启明 +

企业简介 +

企业简介

企业价值 +

企业荣誉

行业地位

资质认证

社会责任 +
企业文化 +
投资者关系 +
麾下企业 +
加入启明 +

业务发展规划

福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入启明

客户留言

710公海寰宇-中国唯一!阿里千问斩获全球AI顶会最佳论文
2026-03-30 18:04:28

  导语:据悉,今朝阿里千问已经开源300多款模子,涵盖全模态、全尺寸,全世界下载量冲破7亿次,衍生模子跨越18万个,位居全世界第一。

11月28日动静,人工智能范畴顶级集会NeurIPS 2025宣布了论文奖,阿里通义千问团队最新研究结果从全世界2万多篇投稿论文中脱颖而出,被评为最好论文,是独一得到该奖项的中国团队。该论文初次于业内揭秘了留意力门控机制对于年夜模子机能及练习的影响,业内子士遍及认为该研究是冲破当下年夜模子练习瓶颈的主要一步,将有力鞭策AI年夜模子技能的成长。

中国唯一!阿里千问斩获全球AI顶会最佳论文

阿里通义千问研究结果被评为NeurIPS 2025最好论文

NeurIPS是人工智能范畴影响力最年夜的顶会之一,该集会降生了Transformer、AlexNet等里程碑式研究结果。本年,google、微软、OpenAI、阿里巴巴和麻省理工学院等全世界顶尖科技公司及机构共有2万多篇论文投稿,仅有约25%的论文被吸收,而最好论文仅有4篇,入选几率不和万分之二,代表了今朝全世界人工智能范畴最有价值及影响力的研究。

2017年,google于NeurIPS发表的论文初次提出Transformer模子架谈判‌自留意力机制,这一研究让AI像人类同样具有有选择性地存眷要害信息的能力,是当下年夜模子研究的基础。只管此刻年夜模子于许多范畴已经经取患上靠近甚至逾越人类的体现,但现有留意力机制仍存于诸多局限,例如当下年夜模子会由于过分存眷特定信息而致使对于其它主要信息的纰漏或者处置惩罚误差,这些局限性极年夜地影响了模子机能及练习不变性,为此业界最先摸索对于留意力举行优化的新方案。

门控机制被认为是模子的“智能阀门”,可以帮忙模子过滤无效信息并晋升模子机能。最近几年来,AlphaFold二、Forgetting Transformer等学术界及工业界模子最先测验考试将门控及留意力机制联合。但业界还没有破解门控于留意力中阐扬作用的内涵缘故原由,也缺乏年夜范围实践的经验。

这次,通义千问研究团队经由过程于1.7B浓厚模子(Dense)与15B混淆专家模子(MoE)长进行了数十组试验,单组试验练习至多跨越 3.5 万亿 tokens,初次清楚揭秘了门控留意力暗地里的作用道理,并周全展示利用该方案的最好方式。

试验成果显示,对于各留意力头的输出举行门控,是晋升模子机能最有用的方式。利用该方式,于引入分外1%参数的环境下,可实现0.2以上的困惑度降落、MMLU基准评测2个点的晋升。研究还有发明,该技能还有能于更年夜范围的模子练习上实现更好的机能。

中国唯一!阿里千问斩获全球AI顶会最佳论文

利用论文要领,于引入分外1%参数的环境下,可以实现0.2以上的困惑度降落、MMLU基准评测2个点的晋升

今朝,该研究结果已经运用在Qwen3-Next模子,并显著晋升模子的机能与鲁棒性,相干技能方案、试验模子和产物级模子均已经开源。NeurIPS评审委员会指出:“这项事情将被广泛运用,并极年夜鞭策AI研究职员对于年夜语言模子中留意力机制的理解。”

通义千问团队暗示:“对于门控留意力机制的深切理解,不仅为年夜语言模子架构设计提供了新思绪,也为构建更不变、更高效、更可控的年夜模子奠基了基础。”据悉,今朝阿里千问已经开源300多款模子,涵盖全模态、全尺寸,全世界下载量冲破7亿次,衍生模子跨越18万个,位居全世界第一。

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

-710公海寰宇


地址:长春净月高新技术产业开发区百合街1009号

版权所有:启明信息技术股份有限公司

电话:0431-85861717/ 4001182299