(通讯员 张荣蜀)3月30日下午,应理工学部邀请,北京大学郭宗明教授在我校博学楼A204进行了主题为“基于视觉感知的行为分析”的学术讲座。
郭教授首先对比了机器感知与视觉感知,强调视觉感知无需传感器,而是模拟人类视觉感知能力的视觉计算并用于视频内容的分析和理解,并以基于骨架的动作识别为例,阐述了其优缺点。在应用前景上,可以用于远程医疗、家庭康复和行为监控等等。接着,郭教授介绍了深度学习和行为识别相关的背景知识,包括神经网络以及传统的处理方法。在核心技术方面,郭教授重点介绍了基于时空注意力模型的骨架行为识别算法,强调关节变量和图像帧变量的重要性,给出了基于时空注意力模型的神经网络流程图。另外,结合所做实验获得的数据,与其他算法进行了对比。目前该方法已经应用于某医院的骨科临床诊疗中。
讲座结束后,郭教授非常细心的回答了同学们的问题,也欢迎他们去北大实验室进行参观交流。
郭宗明,北京大学博士,研究员,博士生导师。1983年考入北京大学数学系,1994年于北京大学计算机系获得博士学位。研究方向包括、模式识别、计算机图形图象处理等。国家十一·五课题——“数字媒体内容集成分发平台”,子课题“海量内容管理”负责人。863项目——“面向IPTV的视频检索关键技术与内容管理系统的实现”课题副组长,其主持的“数字化音视频控制技术研究及应用”项目获得国家科技进步二等奖。
(编辑:陈艺文)