新闻动态

您当前的位置: 首页 > 学术活动 > 新闻动态
四川大学华西医院疾病系统遗传研究院沈百荣团队联合乔治梅森大学闵华团队:构建前列腺癌大数据标准,整合基因型、表型和生活方式数据
发布时间:2025-01-15     来源:链接   


四川大学华西医院疾病系统遗传研究院沈百荣团队联合乔治梅森大学闵华团队于2024年4月在Briefings in Bioinformatics发表文章“PCAO2: an ontology for integration of prostate cancer associated genotypic, phenotypic and lifestyle data”(点击二维码阅读原文)。本研究利用本体论(ontology)围绕前列腺癌领域的生物医学知识和注释资源进行整合,实现了统一的数据访问、解释和分析,促进知识发现和可解释的人工智能建模。PCAO2为海量异构前列腺癌大数据整合提供了国际上首个标准化、系统化的语义知识框架。


640.webp


前列腺癌是全球男性第二常见的恶性肿瘤,其发病率在全球范围内持续升高。前列腺癌的风险因素众多,包括遗传因素、环境因素、生活习惯等。关于前列腺癌的数据来源多样、知识庞大复杂,亟需进行标准化和结构化。精准医学依赖于全面的基因型、表型和生活方式等数据进行个性化建模和应用。近年来,人工智能在医学中的应用越来越多,但在临床实际应用中仍然面临挑战。首先,人工智能模型需要大量的领域知识和标注数据,为此临床医生和科研人员需要系统性地收集疾病特定概念及其相关数据,这些数据之间关系错综复杂,极具多样性。其次,当前的人工智能模型大多缺乏临床可解释性,难以取得临床医生和患者的信任。

在生物医学领域,目前已经建立了许多著名本体,包括基因本体(gene ontology,GO)和疾病本体(disease ontology,DO)等。这些本体作为上层本体优势在于覆盖面广,但针对特定疾病的多来源知识仍缺乏深入且全面的标准化和结构化表示,本研究针对前列腺癌建立了国际上第一个癌症专病本体标准。

在这项研究中,我们开发了前列腺癌本体标准PCAO2。主要过程包括知识获取和概念化、层级结构和关系建立、知识表示和本体评估、系统开发和应用。PCAO2整合了多源化知识,包括已发表本体、临床指南、医学书籍、科学文献、在线资源等。每个概念都标注了其名称、同义词、缩写、参考代码、URL、PMID。该标准基于OWL语言构建,并由来自于临床、信息和人工智能等交叉领域的专家进行了一致性、准确性、完整性评估(图1)。      

PCAO2集成前列腺癌相关的基因型、表型和生活方式知识,并提供标准化和系统化的语义框架,包含633个类、2386个同义词,最大深度为7,子类最大为53,并按照诊断、治疗和流行病学等三个方面进行知识表示。PCAO2本体的建立不仅有助于标准化和共享大量积累的研究成果和临床数据,还为知识图谱、深度表型挖掘和可解释人工智能的发展提供了重要的知识基础,以促进精准诊断和健康管理。PCAO2提供在线信息检索系统,可以通过浏览器免费访问,支持智能手机、平板等移动终端功能,提供中文和英文版本,开放数据接口以实现与其他程序的集成(图2)。




640-1.webp

图1 PCAO2中的上层类、注释以及类间关系




图片

图2 PCAO2信息检索系统




参考文献

1 Haendel MA, Chute CG, Robinson PN, et al. Classification, ontology, and precision medicine. N Engl J Med. 2018;379(15):1452-1462. DOI: 10.1056/NEJMra1615014

2 Yu C, Zong H, Chen Y, et al. PCAO2: an ontology for integration of prostate cancer associated genotypic, phenotypic and lifestyle data. Brief Bioinform. 2024;25(3):bbae136. DOI: 10.1093/bib/bbae136

3 Chen Y, Yu C, Liu X, et al. PCLiON: An Ontology for Data Standardization and Sharing of Prostate Cancer Associated Lifestyles. Int J Med Inform. 2021;145:104332. DOI: 10.1016/j.ijmedinf.2020.104332

4 Min H, Manion FJ, Goralczyk E, et al. Integration of prostate cancer clinical data using an ontology. J Biomed Inform. 2009;42: 1035–45. DOI: 10.1016/j.jbi.2009.05.007





640-1.webp

扫二维码查看

相关研究成果




专家点评


刘甘强教授:该研究通过广泛整合多个来源的知识,包括已发表本体、临床指南、医学书籍、科学文献和在线资源等,构建了具有标准化和系统化语义框架的前列腺癌本体标准PCAO2,并提供了可进一步编辑的开放性框架。PCAO2的建立不仅加深了对前列腺癌多源知识标准化和结构化的理解,也为前列腺癌的基础研究和临床实践提供了全面、可解释的知识表示方式。此外,该工作也有助于对其他复杂疾病大量积累的研究成果和临床数据进行共享和标准化,为知识图谱、深度表型和可解释性医学人工智能模型的发展提供了新的思路。

640.webp

刘甘强,教授,博士生导师,中山大学医学院医学信息学系副主任;国家重大人才工程(青年项目)、广东省“珠江人才计划”青年拔尖人才等项目入选者。中国生物信息学学会(筹)转化信息学与数据共享安全专委会常务委员,广东省神经科学学会第七届理事。本科毕业于同济大学,获昆士兰大学生物信息学博士,曾于哈佛大学医学院/布莱根妇女医院帕金森病高级研究中心从事博士后研究并担任讲师/助理科学家。刘甘强教授课题组主要从事组学大数据整合的生物信息学和神经病学精准医学交叉研究,近年来针对帕金森病认知障碍进展异质性研究取得了一系列成果,并以第一/通讯作者发表在Lancet Neurol、Nature Genet、Brain、Ann NeurolMov Disord等国际知名学术期刊。

作者心得


在生命科学与医疗健康领域,数据的爆炸性增长以及知识的深度和广度不断扩展,对人工智能技术的应用提出了更高的要求,尤其是智能化知识体系标准的构建。我们以前期的多项研究成果为基础,围绕前列腺癌,进一步提出并构建了前列腺癌全景本体,融合了基因型、表型和生活方式数据,为精准医学和健康管理提供了知识基础。本研究属于生物医学、信息科学和人工智能交叉领域,因此我们选择Briefings in Bioinformatics期刊投稿。该期刊围绕生物医学问题,专注于数学、统计学、计算机科学、人工智能等技术的应用。其发表的论文在生物医学信息学、计算机科学和人工智能等相关领域具有广泛的学术影响力,是该领域的国际权威期刊之一。论文于2023年10月投稿,12月收到来自两位审稿人的修改意见。审稿专家对研究工作给予了积极评价,提出的修改意见包括数据收集、与临床指南的融合、本体评估和本体应用等。我们组织了多次讨论,根据审稿意见补充数据并进行了详细修改,最终论文于2024年3月接收。从投稿到出版历时近6个月。

通信作者

图片

沈百荣,教授,博士生导师,四川大学华西医院疾病系统遗传研究院执行院长。兼任西雅图系统生物学研究所教授、中国生物信息学学会筹建核心组成员、四川省生物信息学学会理事长、四川省医学信息专委会主任委员、教育部“101计划”医学数据收集与分析教研室带头人、四川省“十四五”规划“数字健康”专家组组长、基金委和科技部专家等。2012年以来在国际上倡导转化信息学,是国际转化信息学高峰论坛(ICTBI)的创始主席。主持国家项目10多项,发表论文200余篇,主编英文著作和规划教材等10部。

通信作者

图片

闵华,博士,美国乔治梅森大学健康管理与政策系副教授。闵博士是医学本体论及其在健康和临床信息学中应用方面的领先专家,研究兴趣包括基于本体论的数据集成、基于本体论的机器学习方法,以及从各种电子病历系统中提取和分析数据。闵博士主持和参与NIH R01、AHRQ、caBIG等基金项目。在JAMIA、J Biomed Inform、JMIR Med Inf、IEEE ICHI等期刊和会议上发表论文多篇。

第一作者

图片

宗辉,助理研究员,四川大学华西医院疾病系统遗传研究院博士后。任四川省生物信息学学会青年委员会常务委员兼秘书长。主要研究方向为生物医学信息学、数字健康与人工智能。目前已发表论文20余篇,参编外文著作2本,并在生物医学信息学领域多本国内外学术期刊担任审稿人。




团队简介

沈百荣教授团队研究方向为生物医学与人工智能,主要开展复杂疾病的生物信息学、转化医学信息学、智能医学、健康管理、医学聊天机器人、生物样本库理论等交叉领域研究。团队依托四川大学华西医院疾病系统遗传研究院,成员来自临床医学、生命科学、计算机科学、管理学等跨学科领域。团队与四川大学华西医院泌尿外科、重症医学科、眼科、乳腺疾病中心、麻醉手术中心、呼吸与危重症医学科、全科医学中心、护理部、临床研究管理部等多个科室开展合作,针对具体临床问题开展标准制定、技术攻关和转化应用等研究。国际研究合作对象包括美国乔治梅森大学、德国明斯克大学、巴西北里奥格兰德联邦大学、西班牙巴斯克大学、芬兰坦佩雷大学、日本产业研究院、香港城市大学等机构。团队承担国家级项目10余项,出版英文著作和规划教材10余部,累计发表论文200余篇。