计算机科学与技术学院博士研究生张宇科研成果获高度评价

chengsenw 项目开发评论2阅读模式

计算机科学与技术学院博士研究生张宇科研成果获高度评价

近日,中国人工智能企业月之暗面(Kimi)团队发布论文《Attention Residuals》(《注意力残差》),引发全球人工智能领域广泛关注。月之暗面创始人杨植麟在英伟达GTC大会上发表题为《How We Scaled Kimi K2.5》的主题演讲,系统披露了Kimi开源大模型新架构演进的三项核心技术,分别为模型优化器MuonClip、线性模型架构KimiLinear以及注意力残差机制(AttnRes)。

FUTURE 

TECHNOLOGY

计算机科学与技术学院博士研究生张宇科研成果获高度评价

我校计算机科学与技术学院博士研究生张宇,作为KimiLinear第一作者、注意力残差AttnRes共同第一作者,为月之暗面Kimi开源大模型核心架构演进作出关键贡献,相关技术被正式纳入Kimi K2.5模型核心技术路线。特别是AttnRes,有效解决了传统残差连接的信息稀释、训练不稳定等痛点,打破了长期以来的大模型架构发展惯性。相关成果发布后,迅速引发热议,月之暗面在X平台官方帖文阅读量逼近500万次,得到埃隆·马斯克,前OpenAI核心成员、“推理模型之父”杰瑞·特沃雷克,OpenAI联合创始人、前特斯拉AI高级总监安德烈·卡帕西等全球顶尖人工智能专家在社交平台上的高度评价。杰瑞·特沃雷克更是明确指出,深度学习2.0时代即将来临。

计算机科学与技术学院博士研究生张宇科研成果获高度评价
计算机科学与技术学院博士研究生张宇科研成果获高度评价

在校攻读博士期间,张宇聚焦人工智能、深度学习与大模型核心方向,深度参与开源生态建设,长期担任知名开源项目Flash Linear Attention(FLA)的主要维护者,在GitHub上已获得超过4000颗星(Stars),代码质量与运行效率达到工业级标准,已被通义千问(Qwen)、蚂蚁集团、Grok等国内外知名科技公司大模型团队深度采用。特别是其重点维护的Gated DeltaNet更是成为Qwen 3.5的主要架构,有力支撑了国产大模型的自主创新与迭代升级。

计算机科学与技术学院博士研究生张宇科研成果获高度评价

张宇的科研成果离不开导师付国宏教授的精准指引与悉心培养。作为江苏省双创人才、国内人工智能与大模型领域知名学者,付国宏深耕自然语言处理与人工智能研究三十余年,始终紧盯国际学术前沿与产业发展动态。在指导学生过程中,他坚持价值引领与能力塑造并重,着力提升博士生科学思维、原始创新与工程实践能力,构建起开放包容的科研环境与“校内筑基+企业攻坚”两段式培养模式。在张宇博士研究中期关键阶段,付国宏凭借对AI浪潮算法-算力-数据三要素轮动规律的深刻洞察,敏锐预判大模型研发将从“堆算力、堆数据”转向“底层算法优化”的核心趋势,果断指导其调整研究方向,确立清晰技术路线,并为其量身定制自由探索的培养模式,充分释放学生创新潜能,为系列成果的产出奠定了坚实基础。

计算机科学与技术学院博士研究生张宇科研成果获高度评价

大模型底层技术创新需要大算力和工程技术支持。为此,2023年开始导师付国宏将张宇送到多家企业进行实习合作研究。正是有月之暗面等高水平团队的大力支持,张宇得以潜心大模型底层架构和算法探索,先后完成门控槽注意力GSA(2024年)、KimiLinear(2025年)和注意力残差机制AttnRes(2026年)三项具有行业影响力的研究工作,构建起完整高效线性注意力模型技术体系,圆满实现了中期时导师所制定的博士论文研究目标。

计算机科学与技术学院博士研究生张宇科研成果获高度评价

优异成绩的取得,更是计算机科学与技术学院深厚学科积淀与学校创新人才培养体系同频共振的成果。作为国内最早开展中文信息处理研究的单位之一,计算机科学与技术学院在自然语言处理领域拥有近30年研究积累,已形成由近30名教师、200余名硕博研究生组成的高水平研究团队,先后承担国家杰出青年科学基金、优秀青年科学基金、国家自然科学基金重点项目等国家级科研任务,荣获2025年度吴文俊人工智能科技进步特等奖,并与阿里、华为等行业龙头企业共建联合实验室,形成坚实学科平台与创新生态。

计算机科学与技术学院博士研究生张宇科研成果获高度评价

学校坚持“把企业实验室建到高校,把高校课堂搬到企业”的创新人才培养理念,大力推进产学研深度融合。作为我校本硕博全流程自主培养的优秀学子,张宇正是学校拔尖创新人才培养的生动缩影。未来,学院也将持续优化人才培养机制,拓展科研实践平台,为我国人工智能领域人才培养、技术突破与产业高质量发展持续贡献智慧与力量。

FUTURE TECHNOLOGY

【供稿】| 王绍丹

【审核】| 陈国凤、黄河、高珊、付国宏

【排版】| 董辛

 
chengsenw
  • 本文由 chengsenw 发表于 2026年3月27日 23:03:53
  • 转载请务必保留本文链接:https://www.gewo168.com/27481.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: