稿件来源:肿瘤防治中心 | 作者:肿瘤防治中心 | 编辑: | 发布日期:2018-11-12 | 阅读次数:
近年来,肿瘤的研究与诊疗进入大数据时代,相关大数据库的开发和应用为揭示肿瘤发生发展的分子机理、探索新的诊疗手段和实现数据资源的开放共享提供了坚实的基础。
我校肿瘤防治中心徐瑞华教授团队近年来着力于建设消化系统肿瘤的大数据平台,通过整合肿瘤临床信息、影像数据、生物样本库数据、高通量生物多组学的数据,系统地构建消化系统肿瘤大数据,并结合人工智能平台进行大数据的挖掘与分析。该团队基于肿瘤大数据平台开展肿瘤临床诊疗的真实世界研究,探索肿瘤的精准诊断、预后预测和耐药分子机制,取得了一系列的研究成果,相关论文发表在Nature Materials,Gut等一系列国际权威学术期刊上。
最近,徐瑞华教授团队构建了蛋白质磷酸化定量数据库qPhos(网址:http://qphos.cancerbio.info)。作为肿瘤大数据平台的一部分,qPhos数据库的建立将为肿瘤精准诊疗研究提供重要的数据资源。
蛋白芯片
蛋白质的动态磷酸化修饰是细胞重要的信号转导分子机制,调控着广泛的生物学过程,在肿瘤的发生发展过程中发挥着重要的作用。作为调控磷酸化动态水平的关键因子,蛋白激酶和磷酸酶已成为肿瘤精准诊疗的分子标志物和靶向治疗的重要靶点。随着高通量蛋白质组学技术的发展,既往的研究工作积累了大量的磷酸化组学数据。虽然有数据库整合了磷酸化位点的信息,但是其动态定量数据却散落在文献中而难以被查询、获取和利用。因此,收集已发表的定量磷酸化组数据并整合为一个综合的蛋白磷酸化定量数据库将为肿瘤和其他疾病相关的磷酸化信号通路研究提供极大的帮助。
自2016年开始,肿瘤防治中心徐瑞华教授团队开始着手构建磷酸化定量数据库qPhos。通过收集已发表的定量磷酸化组数据,共整合了199071个磷酸化位点上的3537533个定量磷酸化信息,其中86%的数据来自肿瘤组织样本及相关细胞系。有关定量实验的详细信息,包括实验条件、实验所用的细胞系或样本等数据也纳入了数据库中。对每个磷酸化位点,都注释了实验验证的或潜在的上游激酶,以便理解其分子调控机制。同时,通过整合UniProt,ExPASy和DrugBank等数据库中的信息,对磷酸化位点所在蛋白质的生化特征、上游激酶的靶向药物情况进行了详细的注释,方便查询和使用。
此外,数据库中还开发了qKinAct分析模块,研究人员可以基于自己的定量磷酸化组数据分析得到相应的激酶活性相关磷酸化位点信息,进而分析异常的磷酸化信号通路。因此,qPhos是首个全面涵盖肿瘤和疾病相关重要磷酸化修饰动态水平的数据库,为研究蛋白磷酸化修饰及其动态调控提供了一站式服务。
该项研究结果于北京时间2018年11月1日以题为“qPhos:一个人类蛋白质磷酸化动态修饰的数据库”的文章发表于生物信息学领域国际顶级学术期刊核酸研究(Nucleic Acid Research,影响因子11.561)上(文章链接请点击文末阅读原文)。徐瑞华教授和刘泽先副研究员为文章的通讯作者,余凯、张青峰、刘泽坤三位硕士研究生和赵齐博士为共同第一作者。
论文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gky1052/5150235