DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

Datathon一等奖专访,北理工辛怡教授:过程比结果更重要

image.png

“本次2019医疗大数据Datathon,一等奖的获得者是:7队!”

随着主持人激动人心的话语,来自北京理工大学的辛怡教授带领她的团队走上了2019医疗大数据Datathon的领奖台。

三年参赛交流经验,持续打磨前沿课题

“我是北京理工大学生物医学工程系的老师,我们的专业是用工程手段去解决医学问题和临床技术问题,这是我带着团队第三次参加Datathon活动了。”辛怡教授的眼神里洋溢着喜悦和激动,仿佛还是第一次参加到活动中。

辛怡是北京理工大学生命学院生物医学工程系副教授,中华医学会医学信息学分会医学大数据与人工智能学组委员,她的研究方向主要是生物医学信号的时频联合多尺度病态识别、基于医学数据的疾病关联因素分析与智能利用。

由于Datathon比赛时间有限,还需要衡量每项子任务的工作量,快速根据方案调整算法和思路,所以无论是对队长还是队员,都是一场考验。同时,Datathon在参与课题选择上的难度ue很大,既要提出有创新性并且有临床价值的问题,又要在数据处理时能得到mimic和EICU数据的支持,所以赛前出题阶段需要阅读大量文献,并且不断向临床医生求教。

“Datathon最吸引人的地方在于,它不仅是一个竞赛和交流,更是一个学术平台,从出题开始就可以得到组委会国际顶级专家的建议和指导。我们第一年参加Datathon时,是抱着尝试的态度加入了其他人的队伍,但在过程中发现这个活动非常有趣,能从中学会很多知识,并结识不同学科的朋友。所以第二年我们团队就鼓起勇气自己做成一个队伍参加进来了,虽然这次的表现不是非常完美,但我们的选题受到了来自现场很多教授评委的鼓励和支持,也在他们的帮助下制定了优化课题的方向。”

“所以今年我们又来了,把之前的选题做了深入改进,在翻阅许多文献并查询了很多数据库后,课题的深度广度都得到了提升,问题变得更复杂,研究难度也有所加大,但相较之前有了更强的实用意义。获得现在的结果,只能说我们团队没有白熬这么多夜。”

image.png

在Datathon比赛当天,主会场晚上10点已经关闭,但随处可见参赛队伍在走廊和酒店大堂熬夜讨论课题,钻研成果。

临床人员加入课题,组成复合背景团队

今年的Datathon活动以临床医疗为主题,所以很多课题的队长都是来自行业前线的临床医师,他们招募的对象以算法工程师、数据科学家为主,具备医疗和数据科学双重背景的人才在团队成员招募环节显得格外紧俏。

与在场大多数团队不同的是,辛怡所在团队成员基本是算法出身,是现场为数不多的算法团队,所以他们招募对象是经验丰富的临床医生和来自医院的医学工程人员。

很幸运的是,他们在现场招募到了一位思维活力热衷科研的年轻临床医生,将丰富的经验应用到课题中,将课题方向在医生的指导下得到了深入和细化极大程度上推进了团队对这血清钠课题的研究。还招募了一名来自医院医工处的工程师,让团队在两天的比赛中将所设计的算法以安卓app的形式得以呈现,为成展现增色不少。

两位成员的加入让团队如虎添翼,也充分体现了处理医学数据问题的真谛:“从临床中来,再回到临床中去”。

国外专家教授助力,进一步细化研究方法

辛怡教授的团队研究的课题是“根据ICU患者的生命体征和治疗方式预测血清钠水平”,大家都知道纳离子是细胞外液的主要阳离子,而血清钠对维持体内电解质平衡、酸碱平衡和渗透压平衡起到关键作用,血清钠异常易发生于ICU中的危重患者,而且很可能会导致更高的死亡率和更长的ICU滞留时间,可以说血清钠的水平与ICU患者的生命密切相关。

然而通过现有的医学技术,只能检测血清钠水平而无法达到预测的程度,如果能根据患者的生命体征和治疗方式来预测血清钠水平,那么医源性高钠血症的预测因子也将更加明确,能够在临床治疗过程中通过治疗方式的选择来减少高钠血症发生概率。

但是这一课题目前的研究进展到如何程度?在课题具体展开的时候还需要考虑哪些因素?也给团队带来了一些研究上的困难,这时候现场专家教授的辅导带来了很大帮助。

每届Datathon活动都会有来自MIT,哈佛医学院的国外专家亲临现场,他们代表着各自领域的领先水平。组队完成的第二天早上,专家们在开完会后迅速深入每个小组,辛怡教授的团队也得到了一位该领域专家的指导,帮助他们把研究课题和研究方法进一步细化,让他们在短时间内得到高质量的成果。

借助数据科学协作平台,让观赛者深度参与

image.png

不同以往的是,在今年Datathon的组队报名及协作阶段还引入了数据科学协同平台K-Lab,云原生的平台提供了开箱即用的统一环境,云端挂载了比赛中要用到的数据库,无需下载即可直接使用,让团队中不同背景的成员可以在科研项目上迅速达成协作。

“K-Lab是一个很新颖的数据科学工具,在这次活动中它提供了很好的编程环境,作为一个Notebook,不管大家是观赛还是参赛,都能够深度参与进来,而且里面有很多现成的代码片段,对于医生来说使用很方便。甚至在比赛结束后,我们还可以拿出研究成果与更多人分享交流。”

校内难得的学习交流,探索开放式科研实践

在这次比赛中,她很重视Datathon的学习环节,也一直在探索以赛促学的教学模式,探索对于学生“新型竞赛+知识储备+拔尖适应力+工程训练+职业素养+心理建设”的综合能力培养路径。这次比赛过程中,围绕在辛怡教授身边的“参赛团队”人数远比其他队要多,但是再一看才发现,原来很多名成员是她从学校带来观摩这次比赛的本科生,虽然他们还没有掌握数据分析技能,但是这次活动一定会给他们带来思维的指引。

以竞赛为牵引,引导学生提升知识整合能力和实践动手能力,了解国内外主流技术需求,学以致用,同时也是检验学习成效、促使学生提升自主持续学习能力的契机。而K-Lab作为一款数据科学协同平台,能够承载起观赛和参赛的双重需求,给观赛者带来深度参与的体验。

“即使是观摩也一定得来,在学校的学习阶段中,学生们很难接触到Datathon这样的机会,从提出问题、团队协作,到最后解决问题的过程,用短时间去跑完一整个项目。”辛怡教授认为Datathon的意义完全不仅限于参加比赛,得奖只是结果而不是目的,参加这次活动更大的意义在于与各个领域的人才交流,向同专业内的专家学习。

把Datathon的交流学习意义进一步放大,让这场盛大的医学科研实践不止作为研究课题开始,而是让活动的精神影响到更多人,包括很多学生、初学者和从业多年的临床医疗人员,促成更医疗数据行业的深层融合。

“参加Datathon是会上瘾的,每个人都在边熬夜喊累,同时又很努力地往结果推狂奔。这是医学大数据研究的最好课堂,从赛前出题、赛场提取数据、数据统计分析、机器学习、软件应用,每一个参赛队伍的课题都可以看作医学数据研究模式的缩影,无论是研究意义或算法设计,还是细到提取数据的策略和纳入考虑的字段,“医生”“算法工程师”“前端工程师”都需要充分沟通交流和协作,两天的头脑风暴加快速的数据处理,无论最终呈现的效果如何,我相信每个参与其中的player都大有收获。无论名次是怎么样,明年我还会继续来到这里。”

未经允许不得转载:DOIT » Datathon一等奖专访,北理工辛怡教授:过程比结果更重要