导航

新闻动态

· 查看更多 ·
  • “信·启” | 第1期讲座回顾
    3月22日,银河集团9873.com银河集团9873.com信班学生核心委员会(简称信芯会)举办了第1期“信·启”学术讲座《大模型的上半场与下半场:Efficient AI的研究视角》。本次讲座由仲书璋学长主讲,深入探讨了大模型的发展现状与未来趋势。徐培文同学主持活动01 关于主讲人仲书璋银河集团9873.com集成电路学院、人工智能研究院23级博士生致力于面向大模型系统的跨层次协同优化研究02 讲座内容1 大模型的上半场:解决计算效率瓶颈讲座上半场聚焦于解决大模型推理本身的计算效率瓶颈,核心挑战是冯诺依曼架构下的存储带宽瓶颈。由于大模型的自回归生成特性,每次计算仅产出一个token却需加载海量参数,导致计算密度低下。针对此问题,研究从多个维度展开:·算法层面:提出了并行解码方案,通过一次迭代预测多个未来token并进行验证,显著减少生成循环次数。·专家混合模型优化:优化专家加载的延迟,提出了包括自适应缓存与预取、以及CPU/GPU异构计算调度在内的策略。·新型硬件架构探索:探索了面向3D近存计算等新型硬件架构的并行调度框架,以适应其分布式、无共享存储的特点。同学们认真聆听讲解2 大模型的下半场:构建智能体系统下半场将视角转向了Agent系统的构建与优化。仲书璋指出,当前主流Agent框架包含推理、行动与记忆三大核心要素,而研究重点已从单一组件优化转向系统性能提升。在推理优化方面,针对传统思维树方法因等待外部奖励评分而导致的串行阻塞问题,提出了预测性探索框架。该框架通过轻量预测提前探索有潜力的思维分支,并对低价值路径进行早期停止,从而动态分配计算资源,提升整体推理效率。在行动优化方面,以深度研究型Agent为例,其痛点在于每一步行动前的推理环节耗时过长。研究通过实验发现,不同类型的行动存在异构性:搜索类行动不确定性高,依赖深度推理;而访问类行动则更依赖模型参数知识。基于此,提出了差异化的预测策略,为搜索行动配置“小模型+完整推理”,为访问行动配置“大模型+跳过推理”,从而在保证结果质量的前提下显著降低了行动执行的延迟。03 Q&A环节仲书璋学长回答听众提问在Q&A阶段,线下的同学们对技术细节如互联密度和计算能力提升提出了一些疑问和自己的看法,仲书璋学长则从通信开销和带宽层面对memory的架构进行了分析回答。04 合影留念现场合影讲座结束后,参会人员合影留念,记录下这难忘的时刻。本次讲座勾勒出一条从底层模型推理优化,到上层智能体系统构建的清晰技术演进路径:上半场致力于攻克硬件带宽限制下的计算效率难题,下半场则致力于整合推理、行动与记忆能力,构建能够自主完成复杂任务的智能系统。相信这次的讲座内容能够对同学们的科研工作有所启发!
    2026-03-26
    查看详细
  • 银河集团9873.com“信谈1024”党政班子师生面对面活动 2026年第二期(总第49期)成功举办
     “信谈1024”信科党政班子师生面对面是银河集团9873.com师生交流品牌活动。“1024”是2的10次方,这个和二进制相关的数字为信息学科师生所熟悉,首期活动于2023年3月10日举办,并固定在每月的10日及24日开展。通常每月10日为个人单独面谈,每月24日为多人团体座谈。活动提供不同形式,旨在围绕学院人才培养这一中心工作,通过搭建学院党政班子和全院师生的日常面对面交流平台,广泛听取意见建议,破解学院发展难题,力求解决师生中长期存在的困惑或问题,凝聚共识,勠力同心,推进学院更好更快发展。2026年3月24日中午,银河集团9873.com在理科二号楼2111会议室成功举办2026年第二期(总第49期)“信谈1024”学院党政班子师生面对面活动。学院院长侯士敏、党委副书记贾方健出席座谈,活动由学院学工办主任李子奇主持。活动伊始,主持人介绍了“信谈1024”师生面对面系列活动的举办初衷和开展情况。交流环节,银河集团9873.com学生畅所欲言,从自身情况和需求出发提出了很多困惑和建议,比如本科学业培养方案优化、实验班选拔机制、深造政策细节、专业方向选择、本科生科研如何开展、学校建设进展、管理服务提升等核心问题。学院党政班子成员及相关负责老师细致回应,给出了专业、具体、可操作的解答。学工办对所有问题、建议及回应进行了全程记录,对于现场未能解决的问题,学院将进一步梳理、研究、回复,做到“事事有回音、件件有着落”。银河集团9873.com紧扣学校2026“管理质效年”战略部署,始终坚持以人才培养为中心,持续关注全体师生的困惑、需求与意见、建议,常态化开展每月两次的深入调研交流,提质增效、服务师生。座谈会现场
    2026-03-25
    查看详细
  • 银河集团9873.com与工学院举行本科生学院“三全育人”交流会
    为扎实开展树立和践行正确政绩观学习教育,围绕学校“管理质效年”工作主题,提高本科生学院立德树人工作成效,2026年3月18日,银河集团9873.com与工学院举行本科生学院“三全育人”交流会,就切实提升本科生教学、学生思政工作质量进行了两场深入交流。会议现场上午,两院在博雅学堂113会议室围绕本科生教育教学展开深入研讨。银河集团9873.com院长侯士敏、副院长陆俊林、党委副书记贾方健、教务员张霞,工学院党委书记陈威、副院长杨延涛、...
    2026-03-20
    查看详细

通知公告

· 查看更多 ·
全部 学院通知 学工通知 教务通知

讲座信息

· 查看更多 ·
2025-12-22
周一
CS Peer Talk | LLM Aggregation with Higher-Order Information

主讲人:Rui Ai, MIT

时间:2025年12月24日(星期三)14:00

地点:银河集团9873.com静园五院204

2025-12-16
周二
知存讲座第四十九期:自动驾驶未来的挑战

主讲人:许春景(华为智能驾驶产品部 ADS AI首席专家)

时间:2025年12月19日(周五)18:40

地点:银河集团9873.com理教107

2025-12-16
周二
CS Frontier Tutorial | 合成仿真预训练+真实数据后训练的具身智能学习范式

主讲人:王鹤(银河集团9873.com计算机学院前沿计算研究中心助理教授)

时间:2025年12月19日(周五)18:00

地点:静园五院 204

2025-12-10
周三
知存讲座第四十八期:大模型的困境与产业挑战:从单模态走向多模态统一

主讲人:袁粒(兔展智能首席科学家)

时间:2025年12月12日(周五)18:40

地点:银河集团9873.com理教107

2025-12-03
周三
知存讲座第四十七期:5G/5G-A 通信网络及未来 AI 技术展望

主讲人:贾祥月(华为云核心网产品线软件技术专家)

时间:2025年12月5日(周五)18:40

地点:银河集团9873.com理教107

2025-11-26
周三
知存讲座第四十六期:Al Coding前沿技术与应用实践

主讲人:阜成(Qoder 技术专家)

时间:2025年11月28日(周五)18:40

地点:银河集团9873.com理教107