青大主页 加入收藏 旧版回顾
学院信息

徐凯教授作“融合三维感知与多模态大模型的具身智能”学术报告

上传时间 :2024-06-08    浏览次数 :    编辑 :赵俊莉

6月6日下午,我院在博知楼510会议室举办“求真讲堂”系列报告,国防科技大学徐凯教授为我院师生作题为“融合三维感知与多模态大模型的具身智能”的学术报告。本次学术报告由我院副院长王国栋教授主持,中科院计算所高林教授、北京交通大学温玉辉老师、清华大学梁永倩博士后和我院杨熙鑫主任、贾世宇老师等及相关专业的同学们共60余人线下参加。

徐凯教授首先讲解了具身人工智能的定义。与普通的人工智能相比,具身智能能够主动感知和实时互动环境,通过交互行为学习不断地适应周围环境。他认为,实现复杂动作执行和高层次知识学习是人工智能的重要发展目标,而当前的大模型学习的语言和文本信息并不包含这些高级知识。

接着,徐教授讲解了机器人具身智能在三维几何感知领域的众多作用,包括主动场景重建、主动场景理解以及任务驱动交互等内容。特别是在任务驱动方面,要求机器人能够主动探索未知环境、理解环境并整理物体,这需要高水平的环境感知和交互能力。徐凯教授利用了大模型的推理能力和上下文理解能力,使用多模态大模型驱动具身智能,在房间整理任务中展示了优异的效果。

最后,徐教授指出,视觉语言感知、交互序列生成、多模态环境表达等人工智能方法都是构建世界模型的关键部分。徐教授还认为,构建多模态世界模型的核心在于多模态融合的环境表达和相应的动力学建模。徐教授的报告加深了学生对具身智能的理解,为师生提供了宝贵的学术见解。

徐凯,国防科技大学教授,国家杰出青年基金获得者,普林斯顿大学访问学者。研究方向为计算机图形学、三维视觉、具身智能、数字孪生等。在国际上较早开展了数据驱动三维感知、建模与交互工作,提出面向复杂三维数据的结构化感知、建模与交互理论方法系统。发表TOG/T-PAMI/TVCG等A类论文90余篇,其中图形学顶会SIGGRAPH论文29篇(第一作者10篇)。获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖(排名3)、军队科技进步二等奖、军队教学成果二等奖等。担任图形领域顶级国际期刊ACM Transactions on Graphics的编委,以及多个领域重要会议的主席。任中国图像图形学会三维视觉专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。

 

版权所有  青岛大学计算机科学技术学院  | copyright 2019 School of Computer Science, Qingdao University. All Rights Reserved.