专栏名称: 统计之都
专业、人本、正直的中国统计学门户网站
目录
相关文章推荐
闹闹每日星运  ·  星历0319:天蝎建议保持礼貌 仙女做事效率很高 ·  昨天  
闹闹每日星运  ·  周运 | 闹闹12星座周运势:0317~0323 ·  3 天前  
闹闹每日星运  ·  星历0318:狮子适合关注基础 射手注意收支平衡 ·  2 天前  
闹闹每日星运  ·  线上全熟线下不到三分熟的星座 ·  昨天  
闹闹每日星运  ·  2025乙巳年九宫飞星布局详解(特别注意篇) ·  4 天前  
51好读  ›  专栏  ›  统计之都

专场介绍 | 第12届中国R会议(北京)医疗健康专场

统计之都  · 公众号  ·  · 2019-05-17 10:26

正文

本次会议由统计之都主办,中国人民大学统计学院、中国人民大学应用统计科学研究中心、狗熊会协办,并得到 RStudio、人民邮电出版社、图灵教育、中国人民大学出版社的赞助支持以及 IT 大咖说独家视频支持。本届会议涵盖了多个学科领域,我们真诚地期待您的到来,一同感受数据科学为这个时代带来的惊喜与挑战。


参会报名正在进行,欢迎点击文末“ 阅读原文 ”报名参会!


下面为您奉上本次R会 医疗健康 专场 演讲介绍:

医疗健康专场


第一场


01

刘跃伟

基于简单空间插值和病例-交叉设计探讨大气污染对哮喘死亡的急性影响


个人简介

刘跃伟,博士,中山大学公共卫生学院流行病学系副教授。2001-2011年间在华中科技大学获得预防医学本科、劳动卫生与环境卫生学硕士和博士学位。曾在湖北省疾病预防控制中心、美国疾病预防控制中心从事环境与健康相关科研和项目工作,入选湖北省青年科技晨光计划、湖北省青年英才开发计划,主持/参与十余项国家、省部级科研项目,以第一/通讯作者在Am J Respir Crit Care Med、Environ Sci Tech、Am J Epidemiol、Epidemiology、Hum Reprod、Environ Int等杂志发表学术论文20余篇。目前是湖北省预防医学会环境卫生专业委员会副主任委员、BMC Public Health副主编。

报告摘要

我国是世界上大气污染最为严重的国家之一,大气污染对健康的危害已受到政府、公众和学者的广泛关注。研究发现,大气污染暴露可引发哮喘症状,导致哮喘加重和就医行为增加,但其是否增加因哮喘死亡的风险尚不清楚。本研究通过收集湖北省空气质量和死因监测数据,采用病例-交叉研究设计,基于研究对象(N=4454)家庭住址和简单空间插值进行暴露评估,利用条件Logistic回归模型等定量评估PM2.5、PM10、SO2、NO2、CO和O3等大气污染物短期暴露对哮喘死亡的影响,同时分析性别、年龄、季节等因素的效应修饰作用。数据处理和分析均通过R实现,使用的软件包主要包括:data.table, doParallel, baidumap, geoChina, sp, raster, rgeos, survival, ggplot2等。

02

郑德强

基于高维miRNAs表达谱数据的疾病诊断标记物筛选研究


个人简介

郑德强,博士,首都医科大学公共卫生学院流行病与卫生统计学系讲师,研究方向包括医学高维变量筛选、 交互作用分析、 慢性病生存分析与风险评估、 孟德尔随机化分析、 统计学习。2016年7月获北京大学数理统计专业博士学位, 获省部级科技进步二等奖1项, 发表学术论文30余篇,其中在JCEM、 Environmental Pollution、 JAHA等期刊发表SCI论文10余篇, 现主持国家自然科学基金项目1项。

报告摘要

食管癌是我国高发恶性肿瘤之一,90%以上病例为食管鳞癌。目前,许多食管癌患者确诊时已进展至中晚期,晚期食管癌总体5年生存率不足15%,食管癌的早期诊断尤为重要。内镜下食管活检为我国现阶段食管癌的有效筛查方法,但是只有在患者有明显症状和组织有明显病变后诊断效能最高。新的无创性标记物筛选对于食管癌的早期诊断尤为重要。本研究基于一个食管鳞癌的病例对照高维microRNAs表达谱数据,使用多种特征选取和统计学习的联合方法,筛选出3个诊断性能最高的miRNAs,利用随机交叉验证方法对3个miRNAs的组合诊断性能进行了评价,AUC和预测准确率超过0.80及0.79,对于不同期别食管癌与正常人的诊断AUC超过0.76,研究结果为确定食管鳞癌诊断的新型生物标记物提供了基础,研究中的统计方法为其他癌症、疾病利用高维基因数据筛选生物标记物提供了参考。本研究的高维特征选取和统计学习主要基于R软件多个Package实现,本报告将展示如何在在R中实现相关统计分析和研究结果。

03

张兵

An R package to explore the effects of environmental factors on infectious diseases


个人简介

本科和研究生毕业于华中科技大学同济医学院,现博士就读于中山大学公共卫生学院(深圳)。先后参加多次R语言大会并做报告。研究兴趣为传染病传播规律。个人主页为www.spatial-r.com.

报告摘要

环境因素是影响传染病季节性特征最为重要的因素之一。相比于慢性疾病,传染病的非独立性(t时点感染病例数会影响t+1时点人群的感染风险)以及隐性感染性(监测系统所观测到病例只是全部病例的一部分),使得传统方法在探究环境因素与传染病发病关系时候存在众多悖论。环境因素可作用于病原体和影响宿主的易感性,也会在一定程度上影响宿主感染后出现的临床表现,进而影响其就诊行为。本研究以流行性腮腺炎为例,通过传染病动力学方法,分别将环境因素(温度、相对湿度和绝对湿度)作用靶点嵌套在传播过程(transmission process)和报告过程(reporting process),并依托iterated filtering算法求解各自参数值及其可能得阈值范围。此方法可在一定程度上区分环境因素可能的作用靶点(传播过程还是报告过程)及解释环境因素对于传染病季节性影响存在区域异质性的原因。整个分析方法及结果展示都集成在EFRID程序包中(https://github.com/Spatial-R/EFRID)。

04

夏昌发

传染病动态传播模型的R实现


个人简介

2015年毕业于河北医科大学,获医学学士学位;2018年毕业于北京协和医学院,获流行病与卫生统计学硕士学位;现于北京协和医学院攻读博士学位。先后获得北京市优秀毕业生、北京协和医学院优秀研究生等称号。发表学术论文20余篇,其中作为第一作者发表论文6篇,包括Lancet Global Health、Cancer Letters、Tobacco Control等国际知名杂志。曾为Cancer、Cancer Medicine等国际杂志的担任审稿专家。先后参与《中国癌症地图集》编制项目、肿瘤登记随访项目、上消化道癌筛查项目、宫颈癌卫生经济学项目等,在项目中熟练使用R语言分析数据。

报告摘要

通过数学模型模拟传染病的动态传播过程能有效地预测疾病的流行状态、并评价医疗卫生干预的效果。传染病动态传播模型是一种基于疾病传播动力学的模型体系,常用于模拟传染病动态流行趋势,并可扩展用于社会人口学特征的动态模拟等。该模型体系主要包括确定性房室模型、随机个体化模型和随机网络模型。确定性房室模型将人群划分为离散的疾病状态,并进一步细分影响疾病传播的人口统计学、生物学和行为等特征,通过在连续时间内求解传染病微分方程获得疾病在各个时点的流行状况。确定性模型中疾病和人口的转移参数在模拟过程中没有随机变异,而随机模型则通过个体的离散化来估计模拟传播过程的潜在变异。随机个体化模型在个体测量水平上模拟人群中疾病传播的过程,个体转移参数则通过在参数分布中随机抽样来获得。随机网络模型动态细化了传染源与易感个体的接触时间和次数,因此该模型具有了网络模型的特征。借助R语言,我们可以方便地刻画固定队列或动态人口各种疾病的传播类型,如SI、SIR和SIS等,并可根据需要自主扩展模型结构,更为贴切地模拟任意复杂传染病的流行过程。

05

李昂

基于混合效应模型的人群代谢组学差异性标志物筛选研究


个人简介

中国医学科学院,北京协和医学院基础学院流行病与卫生统计学系硕博连读研究生,目前的研究方向主要包括:空气污染人群流行病学、代谢组学数据挖掘、证据权重分析等。参与编写《空气污染人群健康风险评估方法及应用》。曾获2017年“挑战杯”大学生课外学术科技作品竞赛省级特等奖、国家级三等奖。

报告摘要

大量人群流行病学研究证实,暴露于高水平的空气污染物可导致一系列的心血管和代谢结局,但其潜在的生物学机制尚不明确。代谢组学技术可有效地从生物样品中定性和定量大量化合物,从而鉴定受环境或疾病影响的代谢物和代谢通路。我们在传统代谢组学PCA分析、OPLS-DA分析的基础上,结合线性混合效应模型,筛选出与细颗粒物暴露有关的差异性代谢产物。该方法能够考虑个体的多种混杂因素及其变化,并能同时在模型中控制组间变异和组内变异对结局变量的影响。分析主要应用R软件lme4、splines包等。


第二场


01

李国星

大气污染与人群健康的关系


个人简介

李国星,博士,北京大学公共卫生学院,副教授。主要研究领域:环境流行病学,特别是大气污染和气候变化的健康影响和疾病负担。作为项目负责人,先后主持国家自然科学基金面上项目1项、省部级课题子课题1项和中华医学会课题1项,并参与多项国际自然科学基金和环保部公益项目课题。作为第一或通讯作者累计发表英文论文24篇,包括在lancet planetary health, environmental international, stroke,environmental pollution, environmental research,science of the total environment等期刊的发表;参编专著教材4部,包括《现代环境卫生学》,《空气颗粒物与健康》等。目前担任中华预防医学会卫生工程分会青年委员;北京环境诱变剂学会青年专业委员会常务委员。

报告摘要

近年来,大气污染的不良效应已经引起了学术界和公众的广泛关注。本研究拟全方位的介绍大气污染对我国公众的健康影响。在对大气污染物不良效应评估的基础上,利用我国大气污染防治行动计划推出的契机,在国际上率先对该计划对大气污染进行干预所带来健康效应进行了评估,该结果为评价和推动我国大气污染的治理提供了可靠证据,另外,结合本人使用R软件的经验,分享心得。

02

陈善恩

利用改进的高斯过程模型预测季节性流感的传播


个人简介

北京大学工业工程与管理系2016级博士研究生,主要从事基于医疗大数据的慢性病预诊、传染性疾病时空传播和复杂系统的可靠性建模。目前以第一作者身份发表4篇SCI论文,申请国家发明专利1项、国家计算机软件著作权2项。曾获北京大学研究生国家奖学金、波音二等奖学金、三好学生标兵、三好学生等荣誉。

报告摘要

季节性流感的传播预测对预防流感爆发、保护公众健康至关重要。目前的研究大多集中在流感的时空传播机理建模,尚未有研究将气象因子纳入流感传播的预测建模中。本研究建立了一个基于改进高斯过程回归模型的非参数流感预测模型,将气象因子纳入考虑,以捕捉流感时间序列中隐藏的相关性。为了确定最具解释性的气象因子,我们首先采用L1正则化方法识别最优气象因子子集。基于高斯过程回归模型,我们设计了三种协方差函数来描述流感活动的非平稳和周期性,利用设计的交叉协方差函数对流感与气象的相关性进行了建模。最后,我们利用深圳CDC所采集的2011-2015年的流感数据对改进高斯过程回归模型进行了验证,并与现有的流感预测多变量统计模型进行了比较。结果表明,特定气象因子对流感传播有显著影响,将气象因子纳入建模过程能显著提高流感预测的准确性。

03

王钒

Selection of mixed copulas for data with ties via penalized likelihood


个人简介

王钒,中国人民大学博士研究生。本科毕业于加拿大滑铁卢大学统计学专业,研究生毕业于美国密歇根大学安娜堡分校应用统计专业,曾在美国制药业从事临床研究及健康数据分析4年。目前的研究兴趣主要集中在健康大数据,基因数据与疾病的相关分析,函数型回归模型等。

报告摘要

The link between Obesity and Hypertension is one of the most popular topics which have seen much discussion in recent decades but still difficult to be captured comprehensively and accurately. However, the distribution of BMI and blood pressure is usually fat tailed and severely tied. This paper adopts the ideas from Cai and Wang 1 by using data-driven copula selection approach with penalized likelihood to measure fat tailed correlation, and from Li et al.2 by employing Interval Censoring method to address tied data issue. Minimax Concave Penalty (MCP) is borrowed to perform the unbiased selection of Mixed copula model instead of Smoothly Clipped Absolute Deviation (SCAD), which was used in Cai and Wang1, for MCP is faster to get un-penalized solution. Interval Censoring method, inspired from survival analysis, is applied by considering ranks as intervals with upper and lower limits, and maximizing pseudo- likelihood to get point estimates. This paper describes the model and corresponding iteration algorithm. Also, a simulation to compare the proposed model (Mixed copula model via MCP with Interval Censoring method) versus existing model (Mixed copula model via SCAD with “Jitter” from R package applied to address tied data issue) in different conditions is presented. Additionally, the model is also applied to health data collected from China Health and Nutrition Survey (CHNS). Both numerical studies and real data analysis show positive results.







请到「今天看啥」查看全文