微软亚洲研究院学术报告会

发布者：曹玲玲发布时间：2025-04-07浏览次数：10

【时间】2025年4月9日（周三）14:00

【地点】东南大学九龙湖校区计算机楼233室

【日程】

时间	内容	讲者
14:00-14:05	开场介绍	吴天星
14:05-14:15	如何进行高水平的科研	郭百宁
14:15-14:45	面向商业图像的视觉生成模型	元玉慧
14:45-15:05	大型语言模型时代的网络研究	程文雪
15:05-15:20	微软亚洲研究院及人才项目介绍	陈昊
15:20-15:30	自由交流环节

【报告信息】

1.题目：如何进行高水平的科研

报告人简介：郭百宁，微软杰出首席科学家，微软亚洲研究院常务副院长，负责图形图像视频领域的研究工作。郭博士于1999年加盟微软中国研究院（微软亚洲研究院前身）。此前他是美国英特尔公司硅谷总部研究院的资深研究员。郭博士拥有美国康乃尔大学硕士和博士学位，北京大学学士学位。他还是美国电气电子工程师学会会士（IEEE Fellow）,美国计算机协会会士（ACM Fellow）,和加拿大国家工程院院士。

郭百宁博士的研究兴趣包括计算机图形学、计算机可视化、自然用户界面以及统计学习。他在纹理映射建模、实时渲染以及几何模型等领域取得的研究成果尤为突出。

郭博士曾是电气电子工程师学会视觉及计算机图形学会刊（2006-2010）以及计算机和图形学会刊（2007-2011）的编委会成员。目前他还担任电气电子工程师学会计算机图形和应用的副主编。他担任过多届国际图形学和计算机可视化大会委员会委员，包括国际计算机图形学大会（ACM SIGGRAPH）、电气电子工程师学会举办的国际计算机可视化大会（IEEE Visualization）。郭博士拥有40多项技术专利。

2.题目：面向商业图像的视觉生成模型

摘要：商业图像生成是人类沟通、说服与信息分析的重要支撑工具，涵盖信息图表、海报、横幅及PPT等多种常见形式。尽管现有的生成模型已经能够产出视觉上令人满意的图像，但在准确传达信息和明确表达语义等核心商业场景需求上，仍然存在显著的技术挑战。本报告将全面介绍我们在商业图像生成领域取得的一系列突破性进展，特别包括针对精准视觉文本生成问题而开发的GlyphByT5系列研究，以及我们最新完成的多图层图像生成研究项目——ART系列。作为商业视觉内容生成领域的重要任务，精准视觉文本生成与多图层图像生成技术致力于将用户文本描述中的关键信息准确地转化为视觉文本，并生成高质量、多层次且可编辑的视觉内容。这使得用户能够像编辑文本一样直观、高效地修改生成结果，从根本上提升交互体验与内容创作的灵活性。然而，受任务本身复杂性的制约，此领域的发展长期以来相对缓慢，未受到应有的广泛关注。在本次报告中，我们将详细阐述GlyphByT5及ART项目的核心算法设计、数据集构建方法及实验验证策略。我们相信，随着这些关键技术的进一步完善与推广，商业图像生成领域将在未来一年迎来突破性进展，给各类实际应用场景带来革命性的变化。

报告人简介: 元玉慧博士现任微软亚洲研究院视觉计算组高级研究员。他分别于2022年、2017年和2014年，在中国科学院计算技术研究所、北京大学和南京大学获得了博士、硕士和学士学位。目前，他主要负责开发商业图像生成系统，以生成高质量商业内容（例如海报、宣传单、信息图、图表和幻灯片）。他近期的代表性工作包括：用于推理分割的LISA（CVPR 2024）、用于精准视觉文本呈现的Glyph-ByT5（ECCV 2024）、用于多层且可编辑图像生成的ART（CVPR 2025）以及用于扩散模型的人类偏好学习的SPO（CVPR 2025）。他在分割和目标检测方面的代表性工作还包括OCRNet（ECCV 2020）、OCNet（IJCV 2021）和H-DETR（CVPR 2023）。此外，他还担任多个顶级计算机视觉学术会议和期刊的审稿人，并曾担任多个领域的主席职务，例如ICCV 2025和MM2024的领域主席等。

3.题目：大型语言模型时代的网络研究

摘要：大型语言模型（LLMs）的迅速发展为网络研究带来了重大挑战，并引入了新的研究方法。随着LLMs的规模不断扩大，参数数量和训练数据集的增加，迫切需要提供能够扩展、超高性能和可靠的网络解决方案，以连接成千上万甚至数十万的GPU。当前的技术，如以太网和InfiniBand，无法满足这些需求。为了解决这一问题，我们提出通过改进以太网的架构和协议，使其成为专为LLMs设计的下一代网络基础设施。此外，传统的网络研究方法，包括专家驱动的方案迭代和数据驱动的模型训练，缺乏足够的自动化和通用性。我们发现，在优化网络过程中，既需要从数据中学习，又需要基于知识的思考。而LLMs恰好具有这一能力，因此我们提出了基于LLMs的自动化网络优化流程。

报告人简介: 程文雪博士，微软亚洲研究院高级研究员。他于2019年在清华大学计算机科学与技术专业获得博士学位，师从任丰原教授，此前于2014年获得计算机科学学士学位。其研究方向聚焦人工智能与网络技术的交叉领域，具体包括两个维度：人工智能应用于网络（AI for Networking）和网络技术优化人工智能（Networking for AI）。近期研究重点为人工智能基础设施中的数据传输与路由优化，致力于提升大规模AI系统的网络性能与资源利用率。

4.题目：微软亚洲研究院及人才项目介绍

报告人简介: 陈昊，微软亚洲研究院学术合作经理，CCF高级会员。2018年加入微软亚洲研究院后，主要负责联合培养博士生项目，以及与清华大学、上海交通大学、复旦大学、西安交通大学、浙江大学、南京大学、东南大学等国内一流高校和中国计算机学会的学术合作。

导航

微软亚洲研究院学术报告会