放疗知识文章-{下拉词
大家好,今天小编关注到一个比较有意思的话题,就是关于放疗知识文章的问题,于是小编就整理了1个相关介绍放疗知识文章的解答,让我们一起...
扫一扫用手机浏览
大家好,今天小编关注到一个比较有意思的话题,就是关于tcga数据分析的问题,于是小编就整理了4个相关介绍tcga数据分析的解答,让我们一起看看吧。
TCGA收录的基因组测序数据涉及到的癌症达33种,包含的组织类型达26种:
ACC、BLCA、BRCA、CESC、CHOL、COAD、DLBC、ESCA、GBM、HNSC、KICH、KIRC、KIRP、LAML、LGG、LIHC、LUAD、LUSC、MESO、OV、PAAD、PCPG、PRAD、READ、SARC、SKCM、STAD、TGCT、THCA、THYM、UCEC、UCS、UVM。
TCGA是美国国家癌症研究所(National Cancer Institute)和美国人类基因组研究所(National Human Genome Research Institute)共同监督的一个项目,旨在应用高通量的基因组分析技术,以帮助人们对癌症有个更好的认知,从而提高对于癌症的预防、诊断和治疗能力。
作为目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上(覆盖33种癌症类型,超过30000例肿瘤样本,超过20000个基因的表达信息),还体现在多组学数据(包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP等)。
TCGA作为肿瘤研究中***最丰富,数据最权威的数据库,自然受到广大科研工作者的深入挖掘。无数的文章脱胎于通过挖掘TCGA数据,同时也促使了不计其数的衍生的数据库用于挖掘可视化TCGA这个巨大的***。
DataTable dt = new DataTable()
;dt.Columns.Add(new DataColumn("PreRevDate0", typeof(decimal)))
;DataColumn col = new DataColumn()
;col.ColumnName = "PreRevDate1"
;col.Expression = "ABS(Convert.ToInt32(PreRevDate0))"
;col.DataType = typeof(decimal)
;dt.Columns.Add(col)
;DataRow dr = dt.NewRow()
;dr["PreRevDate0"] = -1;dt.Rows.Add(dr);
GEPIA数据库具有84种癌症亚型,从基因水平扩展到转录本水平将基因表达量化,支持对特定癌症亚型的分析和亚型之间的比较。
此外,GEPIA***用了受单细胞测序研究启发的新的基因特征量化分析技术,提供定制分析,用户可以上传自己的RNA-seq数据,并与TCGA和GTEx样本进行比较。还提供了一个用于批量处理的API,以及容易检索分析结果。
患者信息表格这么做
1.TCGA临床数据下载 首先,使用TCGAbiolinks包下载TCGA-LIHC患者的相关临床信息。 将下载结果保存为rda文件。可以看到,在当前目录下多了一个.rda文件,后续在使用时直接使用load()函数进行读取即可。在结果中,其中包含415个患者的82个不同的临床信息。 将临床信息的第一列列名修改为“TumorSampleBarcode”,便于后续分析处理;同时将其保存为csv文件。
2.病人分组筛选 接下来,读取保存好的临床信息,用于后续的临床数据整理和分组筛选。在这里,为了演示方便,我们通过存活和死亡的方法来对所有患者进行分组作为演示。 简单解释一下:分别根据临床信息数据框中“vital_status”的信息,筛选“Alive”的患者作为存活组别,筛选“Dead”的患者作为死亡组别,同时去除其中缺失的患者后,作为纳入的所有。
到此,以上就是小编对于tcga数据分析的问题就介绍到这了,希望介绍关于tcga数据分析的4点解答对大家有用。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。