报告题目:Statistical Models for Big Data with Applications in Precision Medicine
报告摘要:可穿戴设备和图像数据已经被越来越多地用于日常生活和健康医疗中,但对其海量数据的统计学习方法还处在初期阶段。本讲座聚焦于对可穿戴设备中的无约束数据(即free-living数据)的分析。相对于实验数据,free-living数据有以下特点(以AX6数据为例子):(1)Free-living数据的随意性:受试者收集的数据是多段长短不同的,非标准的多维时间序列和函数型数据,我们要对此类非标准数据建立标准,和建立个体化的精准预测模型;(2)巨大的差异性(非齐性):除了个体间的差异外,还有环境文化差异,以及同一个体日常生活的非规律性等;(3)数据结构异常复杂:例如原始数据可以是对应各类动作步态的过程变量(加速度或角速度),通常还包含较大的噪音信号,使得数据在不同时间和频率上都有非常不同的均值和方差结构;(4)海量数据:受试者佩戴可穿戴设备七天产生的原始数据总量超过5G,如何去除海量数据中的无用信息,保留建模所需的有效信息是待解决的问题。本讲座将会利用一些实际例子探讨如何解决这些问题的思路。
报告时间:2025年2月11日,8:30-10:30
报告地点:理学楼601
线上链接:腾讯会议:609 530 353
会议密码请联系邮箱1064021951@qq.com获取
报告人简介:南方科技大学统计与数据科学系和深圳国家应用数学中心教授,理学院生物医学统计中心主任,英国皇家统计学会会士,科技部十四五重点项目首席科学家。曾任英国国家艾伦图灵研究院图灵研究员,剑桥大学牛顿学院访问研究员,英国纽卡斯尔大学(Newcastle University)统计学教授,纽卡斯尔大学云计算和大数据研究中心副主任。主要研究方向包括函数型数据分析,生物医学统计,缺失数据分析,meta-analysis等。在国际学术刊物上发表高水平学术论文100多篇,包括统计和医学顶级期刊 JRSSB, JASA, Biometrika, Nature Medicine 和British Medical Journal。现任J. of Computational and Graphical Statistics和Statistical Methods & Applications等期刊副主编;曾任英国皇家统计协会《应用统计》(JRSSC)等国际期刊副主编,Guest AE for JRSS discussion paper。获IEEE康复游戏和健康国际年会最佳论文奖、美国统计协会非参数统计分会年度最佳论文奖。在Chapman & Hall 出版专著:Gaussian Process Regression Analysis for Functional Data。