当前关注:桐树精准医学知识图谱AIMedGraph登顶牛津大学出版社专业顶刊
01
(相关资料图)
包括二代测序技术在内的分子检测技术的发展揭示了大量基因变异对疾病发生发展、药物使用影响的信息,促进了精准医疗的发展和应用。
但是这些信息分散在不同的数据库和海量文献、指南中。现有的一些大型数据库,如OMIM、Orphanet、HGMD等侧重于遗传病相关胚系变异信息收集,COSMIC收集肿瘤体细胞突变信息,ClinVar作为一个开放平台,收集研究者上传的疾病相关变异和致病性评级;一些专病数据库如CIVic, OncoKB, OncoTree,KGBC,PharmGKB,则收集与药物或预后相关的基因变异信息。
这些数据库采用传统的关系型数据库技术,相关信息以表格形式存储,常用于实体/事务的相关属性信息存储和查询,对实体间关系难以直观展示。
02
精准医学知识的核心是不同组学层面的基因、变异、疾病、药物等实体间的相互影响关系,AI领域的知识图谱技术通过语义富集步骤可以全面展示这些实体和他们的关系。基于专业知识图谱可以准确解析用户问题,快速进行相关答案查询和筛选,是智能知识问答的基础。以图为基础的数据结构也可以有效进行知识推理,挖掘未知的潜在关系。
DisGeNet基于GWAS等研究数据,构建了包含基因与疾病、变异与疾病关联关系的知识图谱,但包含基因变异对药物选择和使用影响的循证精准医学知识图谱仍然缺位。
03
基于此,桐深智能构建了一个多关系精准医学知识图谱,以2万6千多个基因,18万+变异为中心,基于近80万篇文献,链接3万+疾病,2000+种药物,和15000+临床试验,可视化变异的致病性、药物敏感性、药物基因组学影响、药物相互作用、变异对预后的影响等重要关系。目前已发布的版本包括共计106万实体、357万三元组。
AIMedGraph技术架构
AIMedGraph隐藏关系推理示例
AIMedGraph与其他数据库对比 AIMedGraph与其他数据库对比
AIMedGraph的获取方式
X 关闭
- 太阳能