1 of 33

肿瘤多组学分析工具UCSCXenaShiny

王诗翔

中南大学生物医学信息系|Oncoharmony协作组

wangshx@csu.edu.cn

2024.11.8

王诗翔

中南大学生物医学信息系|Oncoharmony协作组

wangshx@csu.edu.cn

2024.11.8

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

2 of 33

目 录

CONTENTS

背景与开发历史

分析功能

使用方法

帮助与教程

背景与开发历史

分析功能

使用方法

帮助与教程

01

02

03

04

61536760

61536760

千图:Blue Dragonfly

�DESIGN

3 of 33

01

背景与开发历史

  • UCSC Xena
  • UCSCXenaTools
  • UCSCXenaShiny

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

4 of 33

UCSC Xena

https://xenabrowser.net/datapages/

> 1k

~45

159

11

Goldman, Mary J., et al.

Nature biotechnology. 2020

统计数字可能因UCSC Xena更新而变动

An online exploration tool for public and private, multi-omic and clinical/phenotype data

61536760

61536760

千图:Blue Dragonfly

�DESIGN

5 of 33

01

03

05

02

04

Openbiox创建与UCSCXenaShiny项目组成立(2019.5)

UCSCXenaShiny的开发与发表(2019-2021, Bioinformatics

UCSCXenaTools第一次代码记录(2018.7)

Openbiox开源之夏项目UCSCXenaShiny v2的开发与发表(2023-2024, Communications Biology

UCSCXenaTools被rOpenSCI收录和发表(2019.8, JOSS

xenaR第一次代码记录(2015.5)by Martin Morgan

2015.7停止开发

UCSCXena系列工具开发历史

从简单的需求和锻炼自己出发

到指导学生深化自己的想法和工作

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

6 of 33

UCSCXenaTools

  • 文章发表
  • 引用情况(截止2024.11.6)

Wang S, Liu X. The UCSCXenaTools R package: a toolkit for accessing genomics data from UCSC Xena platform, from cancer multi-omics to single-cell RNA-seq[J]. Journal of Open Source Software, 2019, 4(40): 1627.

https://github.com/ropensci/UCSCXenaTools

61536760

61536760

千图:Blue Dragonfly

�DESIGN

7 of 33

UCSCXenaShiny

  • 文章发表
  • 引用情况(截止2024.11.6)

Wang S, Xiong Y, Zhao L, Gu K, Li Y, Zhao F, et al. UCSCXenaShiny: an R/CRAN package for interactive analysis of UCSC Xena data.

Bioinformatics. 2022;38 2:527-9. doi:10.1093/bioinformatics/btab561.

https://github.com/openbiox/UCSCXenaShiny

61536760

61536760

千图:Blue Dragonfly

�DESIGN

8 of 33

UCSCXenaShiny V2

  • 在V1基础上,提出并实现更加通用全面个性化的分析流程

Li, S., Peng, Y., Chen, M., Zhao, Y., Xiong, Y., Li, J., ... & Wang, S. (2024). Facilitating integrative and personalized oncology omics analysis with UCSCXenaShiny. Communications Biology, 7(1), 1200.

61536760

61536760

千图:Blue Dragonfly

�DESIGN

9 of 33

02

分析功能

  • TPC Analysis Modules
  • TPC Analysis Pipelines
  • General Dataset Analysis
  • Other functions

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

10 of 33

分析功能—TPC Modules

  • TCGA
  • PCAWG
  • CCLE
  • Modules系列
  1. 操作步骤简单,方便;
  2. 分析场景具体,多样;
  3. 适用于特定需求任务的快速分析。

61536760

61536760

千图:Blue Dragonfly

�DESIGN

11 of 33

分析功能—TPC Modules

  • 举例:泛瘤种 Tumor vs. Normal

Left panel:选择数据及分析参数,并执行;

Right panel:可视化结果呈现;

61536760

61536760

千图:Blue Dragonfly

�DESIGN

12 of 33

分析功能—TPC Modules

Right panel:调整可视化参数;下载结果(图/表)

61536760

61536760

千图:Blue Dragonfly

�DESIGN

13 of 33

分析功能—TPC Pipelines

  • TCGA
  • PCAWG
  • CCLE
  • Pipelines系列
  1. 全面的肿瘤数据整合;
  2. 个性化的样本预处理;
  3. 多种目的的分析模式。

61536760

61536760

千图:Blue Dragonfly

�DESIGN

14 of 33

分析功能—TPC Pipelines

  1. 全面的肿瘤数据整合(以TCGA为例):
  • 7类组学数据a
  • 5类肿瘤指标;
  • 7类免疫浸润;
  • 3类通路打分;
  • 4种临床表型;
  • 2类自定义数据b

丰富的联合分析可能

a: 部分组学类型可根据不同标准化等进行灵活地数据集切换;

b: 包括直接上传数据以及在线设置分子签名(Signature)两类。

61536760

61536760

千图:Blue Dragonfly

�DESIGN

15 of 33

分析功能—TPC Pipelines

  1. 个性化的样本预处理:
  • 样本过滤
  1. 根据上述任意一个或多个特征,选取特定的样本亚群;
  2. 针对每种特征的数据类型,可以设置不同的过滤条件。
  • 样本分组
  1. 根据任意一个特征进行(过滤后)样本二分组
  2. 针对每种特征的数据类型,可以设置不同的分组条件。

61536760

61536760

千图:Blue Dragonfly

�DESIGN

16 of 33

分析功能—TPC Pipelines

  1. 多种目的的分析模式:
  • Individual模式
  • 最基本的针对性分析模式;
  • 特定肿瘤类型的特定分析
  • Pan-cancer模式
  • 观察在不同肿瘤的表现差异;
  • 多种肿瘤类型的特定分析
  • Batch Screen模式
  • 筛选最显著的特征集合;
  • 特定肿瘤类型的批量分析

61536760

61536760

千图:Blue Dragonfly

�DESIGN

17 of 33

分析功能—TPC Pipelines

  • UI介绍

S1 Panel:

  • 设置可选的数据集;
  • 选择肿瘤范围;
  • 过滤样本(2类);
  • 添加自定义数据

61536760

61536760

千图:Blue Dragonfly

�DESIGN

18 of 33

分析功能—TPC Pipelines

S2 Panel:

  • 选择特征数据;
  • 设置样本分组*

*:适用于Comparison/Survival分析

61536760

61536760

千图:Blue Dragonfly

�DESIGN

19 of 33

分析功能—TPC Pipelines

S3 Panel:

  • 设置分析参数与可视化参数;
  • 执行分析并呈现结果;
  • 下载数据(图/表)

61536760

61536760

千图:Blue Dragonfly

�DESIGN

20 of 33

分析功能—基因/通路多组学整合

  • 支持基因和通路
  • 目前只支持TCGA

61536760

61536760

千图:Blue Dragonfly

�DESIGN

21 of 33

分析功能—General Dataset Analysis

Dataset(s)

  • Scatter-Correlation
  • Matrix-Correlation
  • Group-Comparison
  • Survival-Analysis
  • Dimension-Reduction
  1. 几乎适用于任一UCSC Xena数据集的通用分析*

*:TPC系列分析本质上是选择了UCSC Xena中常用的TCGA等泛癌数据集展开分析;而在有的队列中数据集按肿瘤类型相互独立的。

61536760

61536760

千图:Blue Dragonfly

�DESIGN

22 of 33

分析功能—General Dataset Analysis

Step1:在Repository页面,查找并选择一个Genomic matrix类型的数据集

61536760

61536760

千图:Blue Dragonfly

�DESIGN

23 of 33

分析功能—General Dataset Analysis

Step2:在General Dataset Analysis页面,执行特定类型的分析

61536760

61536760

千图:Blue Dragonfly

�DESIGN

24 of 33

分析功能—Other functions

(UCSCXenaShiny v2 Homepage)

  • Daily Gene:每日更新一个基因在一种肿瘤的差异表达情况;
  • Pan-Cancer Query:快速查看一个多组学分子在泛癌中的差异表达,并支持生成更详细的网页分析报告(详见下页)。
  • 基于多个药物敏感度与细胞系组学数据的整合分析。
  • 精确数据下载
  • TPC与Datasets两个角度
  • 帮助文档链接
  • 特征ID查询
  • V1版本
  • 引用信息

61536760

61536760

千图:Blue Dragonfly

�DESIGN

25 of 33

分析功能—Other functions

报告涉及的5个方面分析

TP53 mRNA分析的示例报告

  • 在线生成TCGA多组学分子的泛癌分析报告,帮助快速发现分子的关联特征

61536760

61536760

千图:Blue Dragonfly

�DESIGN

26 of 33

03

使用方法

  • Server端
  • Client端

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

27 of 33

使用方法1

  1. http://shiny.zhoulab.ac.cn/UCSCXenaShiny
  2. https://shiny.hiplot.cn/ucsc-xena-shiny
  • Server端:团队已在两个服务器上部署,可供用户直接访问使用Web应用

Note: 受限于Shiny的性能,目前APP的完全启动时间较长

用户可以自己按 Server 模式安装部署

61536760

61536760

千图:Blue Dragonfly

�DESIGN

28 of 33

使用方法2

  • Client端:适合有R语言基础及环境的用户,本地部署相对更加稳定

install.packages("UCSCXenaShiny")

library("UCSCXenaShiny")

app_run()

Step1: 安装包

Step2: 加载包

Step3: 启动Shiny程序

Tips: R包也支持Github、r-universe下载,Conda下载,以及Docker容器等。

R包本身也提供了一系列数据下载、分析、可视化的函数,适合有编程基础的用户在R命令行操作。

在初次启动、使用时,会自动下载必要的补充数据。

https://github.com/openbiox/UCSCXenaShiny

61536760

61536760

千图:Blue Dragonfly

�DESIGN

29 of 33

04

输入标题

输入标题文本输入标题文本输入标题文本输入标题文本

04

帮助与教程

  • GitHub
  • 教程

61536760

61536760

61536760

千图:Blue Dragonfly

�DESIGN

30 of 33

GitHub

  • GitHub readme & package site & function/datasets references

    • https://openbiox.github.io/UCSCXenaShiny/
  • Github issue
  • 如果您在使用过程中遇到意外的报错,而且参考教程无法解决时,欢迎在Github issue区留下尽可能详细的报错信息与描述,开发团队将会及时、尽快地处理并回复您的问题。
  • https://github.com/openbiox/UCSCXenaShiny/issues

61536760

61536760

千图:Blue Dragonfly

�DESIGN

31 of 33

教程

  • Tutorial book
  • 主要分为R packag与Shiny App两个部分,全面地介绍并演示了操作方法与注意事项;
  • 如果您对前面的介绍有相关疑问,基本可以在此教程中找到详细地说明;
  • https://lishensuo.github.io/UCSCXenaShiny_Book/
  • B站
  • https://space.bilibili.com/11553374/channel/collectiondetail?sid=3686475

61536760

61536760

千图:Blue Dragonfly

�DESIGN

32 of 33

  • 面向泛瘤种、个性化的肿瘤多组学工具及平台
  • R包、Shiny应用的有机结合
  • 软件工程化实现
    • 模块化
    • 单元测试
    • 集成测试
    • 容器构建
  • 持续维护与更新

功能与特点

总结

  • 许多功能的拓展有待实现
    • 如有些功能仅在TCGA中实现

  • V2版本引入的Shiny功能业务逻辑与UI逻辑分离不足

  • 性能较低
    • 如因Shiny框架限制导致启动慢

问题与不足

61536760

61536760

千图:Blue Dragonfly

�DESIGN

33 of 33

致谢

  • 李剑峰(上海交大)
  • 周建国(遵义医科大)
  • 罗鹏(南方医科大)
  • 刘雪松(上科大)
  • 余光创(南方医科大)
  • 赵齐(中山大学)
  • 刘泽先(中山大学)
  • 王海涛(NIH)
  • 。。。

老师

  • 李申锁(四川大学)
  • 熊逸(中南大学)
  • 赵龙飞(上海交大)
  • 彭宇中
  • 顾凯
  • 赵飞
  • 。。。

学生/朋友

  • Openbiox
  • 生信技能树
  • 国自然青年基金
  • 博士后基金
  • 开源之夏
  • 。。。

组织/基金

感谢许多同学、朋友、老师的贡献、支持、帮助、指导和点评!

61536760

61536760

千图:Blue Dragonfly

�DESIGN