数据集蒸馏与修剪(Dataset Distillation and Pruning):精简机器学习效能

发布者:曹玲玲发布时间:2024-07-08浏览次数:10

报告人:周天异 博士 新加坡前沿人工智能中心

报告时间:2024年7月11日(周四)上午10:00-11:00

报告地点:#腾讯会议:614-703-637

报告人简介:周天异博士,毕业于新加坡南洋理工大学, 现为新加坡前沿人工智能中心担任副主任(Deputy Director)以及主任研究员(Principal Scientist)职位。周天异博士主持多项新加坡重点研发项目,并且已在机器学习,人工智能,信息安全等领域核心期刊(中科院一区)和国际会议(CCF A类)上发表论文100余篇;此外是CCF A类期刊AIJ, IEEE Transactions等国际重要SCI 期刊的副主编/常任编委;担任多个国际顶级/重要学术会议NeurIPS,ICML,ICLR,AAAI,IJCAI 等国际顶级会议领域主席 (Area Chair);获得IJCAI,ECCV,ACML等多个国际顶级/重要学术会议及其专题报告会最佳论文奖,被斯坦福大学评为世界前2%的科学家。

报告摘要:在迅速发展的机器学习领域,“数据集蒸馏与修剪”已成为提升模型效能的关键策略。数据集蒸馏涉及从广泛的数据集中提取关键信息,创造出经过提纯的新的小规模数据,既保持模型的强健性又减轻计算负担。可以将其类比为从海量数据中提炼出知识的精华。另一方面,数据集修剪类似于修剪树木的不必要枝条。这一技术涉及删除多余或影响较小的数据点,从而实现更为精简、更快速、更节约资源的机器学习模型。通过消除多余信息,数据集修剪有助于构建性能卓越且无需不必要计算开销的精简算法。 这两种方法共同应对当今数字时代数据丰富性带来的挑战。数据集蒸馏与修剪可以作为模型压缩研究的互补并且进一步优化了机器学习整个流程的能耗, 从而最终现在大规模数据和大模型在终端的可持续化部署。

  • 联系方式
  • 通信地址:南京市江宁区东南大学路2号东南大学九龙湖校区计算机学院
  • 邮政编码:211189
  • ​办公地点:东南大学九龙湖校区计算机楼
  • 学院微信公众号