cytoscape使用方法 如何下载cytoscape
如何使用cytoscape做相互作用图
就是一个txt文件就可以,一共三列,列和第三列是互作的点,第二列是互作的方式,如果只有一种互作方式可以不要第二列,如果想标出不同种类的点再导入点属性文件,两列,列是点,第二列是点的类别,一般用1,2,3表示,只想画图的话不需要
cytoscape使用方法 如何下载cytoscape
cytoscape使用方法 如何下载cytoscape
cytoscape字体模糊
字体模糊可能是电脑分辨率的问题。解决方法如下:
1.首先桌面→右键→个性化→选择显示。
2.显示出来之后选择自定义大小选项。
3.在文字框里写121(字体可以在121-124之间试试,适合自己的就是的),之后点击确定。
4.选择应用,点击立即注销。
5.等待电脑重启之后,cytoscape字体就处在一个比较平衡的位置了。
如何利用cytoscape画ceRNA互作网络图?
说起互作网络图,大家都不陌生。看文献的时候,经常看见相互作用网络图展示了circRNA-miRNA的靶向关系或者ceRNA竞争性网络关系。我们先来看几个图:
CircRNA-miRNA network maps the interaction relationship between circRNAs and miRNAs [1]
miRNA-ceRNA network. Upregulated circRNAs/miRNAs ceRNA network. [2]
网络图把他们之间的联系进行可视化的展现,为文章增加了几分高大上。这些漂亮而又明了的网络图都是由cytoscape这个神奇的软件绘制而成。大家不要以为网络图看着这么复杂,软件使用也会很复杂,下面就给大家简单介绍一下,如何使用cytoscape把分析数据变成网络图。
步骤如下:
,安装cytoscape软件。 软件安装比较简单,这里就不展开赘述了。
第二,把要画图的数据进行整理。 设,我在吉赛生物做了circRNA测序,筛选到了一些表达异的circRNA分子,想要把要研究的circRNA及其靶向miRNA,挑选出来做网络图。
我们会拿到2个表格,circRNA-miRNA线属性(netedges)和点(nodes)属性的表:
netedges表格示例图
nodes表格示例图
第三,先把靶向关系netedges表格导入cytoscape:
再把设为miRNA源(sourse),circRNA设为靶(target):
然后点击OK,导入数据,生成初步的网络图:
接下来,大家就可以对它进行美化了。一般是通过设置点的不同颜色和形状、大小等来标注circRNA的表达情况,和与哪些miRNA结合。
第四,先把nodes表格作为Table导入,把各个点的属性导入:
然后,在Style选项卡设置想要的风格,如把表达上调的circRNA标为红色,表达下调的标为绿色,miRNA是预测的,用蓝色标识;则在Fill Color按照attribute进行调整。或者是可以点选某个点进行调整。
经过一番上色、整形,网络图就变成了这样:
这样的图看起来也还可以,但是如果想要把图形风格进行调整,弄得跟开篇的图一样的,可以通过Layout选项卡进行改变。
得到一个漂亮的circRNA-miRNA网络图:
上面就给大家简单介绍了Cytoscape的部分基础功能,主要通过Edges连接Nodes构成Network,通过导入Table对Network中的Nodes进行注释,从而得到我们想要的效果。当然miRNA-mRNA网络图,蛋白-蛋白相互作用网络图(PPI),也可以通过该软件进行可视化处理。如果想研究比较热门的circRNA-miRNA-mRNA 竞争性网络的,也可以把预测到的靶向关系画成网络图。再根据ceRNA竞争性网络的原理,miRNA与靶向ceRNA间表达量负相关,以及ceRNA对之间表达量的正相关的关系;结合实验测到的结果,删去不符合ceRNA竞争性网络的原理的关系,完善circRNA-miRNA-mRNA网络。
另外,Cytoscape软件还有一些小插件,可以构建更庞大更明确的网络图,这个软件远远不止本文中介绍的功能。学海无涯,生信无边,期待与您一起探索。
参考文献:
[1] Xingjie Bao , Shuying Zheng , Shuqi Mao , Tianlun Gu , Shike Liu , Jihan Sun , Lina Zhang.A potential risk factor of essential hypertension in case-control study_ Circular RNA hsa_circ_00371. Biochemical and Biophysical Research Communications, March 2018; DOI:10.1016/j.bbrc.2018.03.059.
[2] CHUN FENG, YUXIAO LI, YAN LIN, XIANBAO CAO, DONGDONG LI, HONGLEI ZHANG and XIAOGUANG HE. CircRNA-associated ceRNA network rals ErbB and Hippo signaling pathways in hypopharyngeal cancer. INTERNATIONAL JOURNAL OF MOlecular medicine 43: 127-142, 2019; DOI: 10.3892/ijmm.2018.3942.
如何在cytoscape根据邻接矩阵画图
更改背景颜色,可以使用PS,具体方法是:
1、打开原图,如下图:
2、图层。
3、根据背景所需要的颜色,把背景填充颜色,如绿色。
4、滤镜--Knockout2--载入工作图层,如下图:
5、选择内部对象,载入内部对象;,选择外部对象,载入内部对象,如下图:
6、编辑--处理--文件--应用,如下图,这样,的背景就改变了。
7、抠出的图像,还可以运用有其它上,如:打开其它的背景图像,如下图:
8、把抠好的人像拖到风景中,如下图:
Vue中使用Cytoscape.js
在Vue中使用一些第三方库时,很容易犯的错误是直接把第三方库的对象放在Vue的data属性中。
例如在使用 Cytoscape.js 时,用下面这种声明方式。
这样做的确是方便后面的作,但问题是,这种对象特别大,嵌套层级很深,如下图所示,如果直接放在data里,vue的响应式机制,会cy的每个属性,开销巨大,CPU占用瞬间到。
所以在使用 Cytoscape.js 、 Echarts.js 与vue结合时,要避免直接放在data属性中。一种方法是,在 mounted() 里引入该对象。
另一种方法是用 Object.freeze()
这两个方法,都能避免vue的响应式开销,后面也能够正常作 this.cy 对象。
Enrichment Map User guide用户指南
Enrichment Map User guide
译者:Y大宽
总概
CM可以使GSEA结果以网络化的形式可视化呈现。可以是GSEA的结果,当然也可以是DAVID,BINGO等其他的富集结果。Nodes代表基因集,edge代表每个set间的重叠。这种方式呈现的话,高度冗余的基因被划为一组叫clusters,这样就大大增强了导航和解释富集结果的准确性。基因富集是一种数据分析技术,需要有一下2个输入。
1.一个从基因组实验来的排列的基因列表
2.基因集,依据先验知识来的已经归类的功能基因集(如GO)或实验数据(如共表达模型)。
有了以上的输入,那么会输出一个基因集富集列表。也就是能更好的概况基因列表的基因集。通常gene-set enrichment 指的的功能富集,因为指定的功能基因集(如GO)是基于功能范畴的。如下图。
快速使用手册
生成EM(以下Enrichment Map简称为EM)
有几种选择:
加载GSEA结果
加载Generic 结果
加载Did结果
加载Bingo结果
以上几种模式的区别是富集列表的结构。如果要使用EM,需要以下文件
File.gmt:基因集 to gene ID
File.txt或.gct:表达谱矩阵(可选择)
File.txt或.xls():富集列表(s)
()GSEA以.xsl格式保存富集列表,这不是真正的excel文件,而是修饰过的tab-separated文本文件,EM不能加载真正的EXCEL文件。
如你的富集结果从GSEA产生的,主要从你的结果文件夹选择正确的文件即可,如果是用其他方法产生的富集结果,那你就去看下面的Full user guide,file 格式部分,确保文件格式和EM匹配。
另外,你可以选择参数缺省。如果你想自己设置自己的参数,那还是去Full user guide的参数选择部分。
EM的地图
1.Nodes代表基因集
2.Edge代表相互重叠部分
3.富集显著性(p-value)以node颜色密度代表
4.富集的表型以node的颜色(hub)代表
Node在标准的2分类设计中,2个表型比较(比如处理组和非处理组,颜色hue代表富集表型。比如上调和下调的基因。如果两个表型中的一个作为参考(比如未处理),另外一个表型是感兴趣的。在这样的case中,在感兴趣的表型中富集意味up,在对照表表型中富集意味这down
5.Node size代表这个基因集中基因的数目。
探索EM
1.窗口右边的results panel 的参数tab包含一些说明,比如表型颜色,还展示产生map的参数(比如cut-off值和data files)。
2.control panel面板中的左边network tab列出了当前session中所有可用的网络,底部有一个当前网络的总概,并可以方便的在网络中导航,甚至可以通过拖曳矩形框进行放大(当前窗口)。
3.点击一个node(代表一个基因集的圆圈)会打开data panel的(EM Geneset expression viewer)tab,显示选择基因集的所有基因的表达值的热图。
4.点击边(两个node之间的连线)会打开data panel的(EM overlap expression viewer)会显示被这个边连接的两个基因集有的所有基因的热图(也就是重叠基因)
5.如果同时选择了几个nodes和edges(可以通过拖曳感兴趣的基因集的box),那么EM geneset expression view会显示选中的基因集中的所有基因的union并且,EM overlap expression view会显示所有选中的基因集有的基因(也就是选中的几个基因集重叠基因)。
高级提示
1.对于大的网络和低放大水平的cytoscape会自动的减少这个细节(比如隐藏标签,不显示node边界0.若override(手动作?无视?)这个策略,可以点击view-show graphics details
2.可视化地图和-边属性浏览会打开很多可视化选择,比如把标签大小和富集得分或p-values进行连接。这可以参考cytoscape手册
3.如果你使用的是GSEAs MSigDb,那么你可以为每个基因集获取额外的信息,方法是添加一个额外的属性(edit-preferences-properties-add-enter proterty name:nodelinkout.MSigDb-enter property value: make current cytoscape properties default-OK现在你可以在一个node上右击选择linkout/MSigDb
在浏览器打开这个node代表的基因集。
4.当家长GSEA结果时,无序定义每个file。使用GSEA RPT文件就自动包含了EM界面所有的file。(具体在下面5的下面)
5.你可以在一开始定义更为宽松的p-value,q-value和系数阈值,也可以在网络产生之后来调整他们,这个作在结果面板的右边。
RPT files
1.GSEA结果的一个特殊的trick,在任何的GSEA分析中,会产生一个rpt文件,这个文件定义了所有文件的位置(包括gmt,gct,result文件,phenotype specification,rank files)
2.dataset tab(expression,enrichment results1 or enrichment result 2)下的任何fields都可以识别rpt文件,并且populate(进入)GMT,Expression,enrichment results1,enrichment results2,phenotypes,和ranks the values)。
3.第二个rpt文件可以从dataset2加载。如果定义的GMT文件和dataset1的文件不同,会产生一个,你可以选择使用dataset1的GMT,dataset2的GMT,或放弃第二个rpt的加载。
4.rpt文件是一个text文件,有下面的信息(用”’’”围绕的参数是EM使用的)。
EDB files(GSEAfile类型)
GSEA结果文件夹中有一个edb文件夹。里面有下面几个文件
1.result.edb
2.gene-sets.gmt
3.classfile.cls(只在GSEA分析,不在GSEAPreranked分析)
4.rankfile.rnk
5.如果在dataset tab(expression,enrichmentent results1或enrichment results2)定义了results.edb文件,那么gmt和enrichment 文件区域会自动加载。
6.if你想把表达谱文件加到分析中,那得需要手动加载。
高级设置-额外文件
每个dataset,用户还可以设置额外的参数文件(但不是必须的)
这些高级参数包括
1.ranks files 定义分析中基因的ranks
这个文件有固定的格式,上面也说过了。Gene tab rank(得分)。RNK文件是GSEA文件类型。和GCT,TXT文件完全不同。它只有包含基因名字和rank(或得分)。行包含列文件名(比如,gene name(-tab)rank name
RANK文件的每一行包含name(--tab--)rank (or score)
参数
Node参数
1.node筛选出现在EM中的基因集
2.若在EM中出现,那么基因集许通过p-value和q-value阈值
p-value
所有小于p-value阈值的基因集都会在EM中出现
FDR Q-VALUE
所有在限定的q-value阈值之下的基因集都会在EM中出现。
根据分析类型,FDR Q-value用于EM过滤基因集的标准不一样
GSEA:使用的是gsea-result文件的第八列,名为FDR q-value
Generic:generic结果文件的第四列
Did:dide结果文件的低12列,名为“Benjamini“
Bingo:Bingo结果文件的第三列,名为“core p-value”
Edge参数 (gene集关系)
1.一个边代表存在的两个基因集A和B的基因重叠程度
2.edge定义EM中边的数目Edge specific parameters control the number of edges that are created in the enrichment map
3.过滤边只能选择一种系数type(coefficient type)
参数选择的tips
P-value和FDR阈值
GSEA可以使用两种不同的显著性评估:基因集permutation和phenotype permutation。Gene-set permutation用于GM应用例子
Gene-set permutation
下面是你可以考虑的gene-set permutation的不同设置阈值
Very permissive(p-value<0.05,FDR<0.25)
Moderay permissive(p-value<0.01,FDR<0.1)
Moderay conservative(p-value<0.075,FDR<0.075)
Conservative(p-value<0.001,FDR<0.05)
为了获取更高的质量,高覆盖范围的转录组数据,以非常保守的阈值进行富集的基因集数目通常在100-之间,(使用gene-set permutation)
phenotype permutation
p-value<0.05,FDR<0.25
总体,只有你很难发现富集的基因集,我们才使用permissive 阈值。
Jaccard vs Overlap coefficient
1.选择overlap系数:发生重叠的基因集发生在large size和all size之间,比如GO条目
2.选择Jaccard系数:和上面相反,比如两个基因集含的基因数不多
3. When the gene-sets are about the same size, Jaccard is about the half of the Overlap Coefficient for gene-set pairs with a all intersection, whereas it is about the same as the Overlap Coefficient for gene-sets with large intersections.
4.特殊情况,当使用OC时,如果产生的map有几个大的基因集过分的和很多其他基因集发生连接,这是可以转向JC
Overlap阈值
大多数的分析使用0.5,一个相对moderay conservative阈值
0.3更加permissive,可能会导致一个混乱的map
Jaccard阈值
0.5非常保守
0.25moderay 保守
界面
输入面板
1.分析类型Analysis Type
GSEA: 接受GSEA的结果文件。文件格式对GSEA的文件十分友好。这个类型和generic的区别是富集结果文件的数目和格式。GSEA分析总是有2个富集结果文件,分别是两个相比较的表型文件对应的结果文件,也就是一个表型文件一个。
Generic:接受和GSEA分析结果一样的文件格式,就是富集结果文件不一样。并且,它就一个富集文件。Enrichment Map User guid
DAVID: 没有gmt或表达谱文件,接受DAVIDE来的富集文件
2.基因集
描述基因集的 gmt 格式文件。用户可以通过硬盘上的文件加载
3.Dataset1:用户可以指定表达谱或富集文件,或者一个 rpt 文件,这个rpt文件可以加载所有的genesets,dataset1,2,和高级部分。
4.Aanced:初始状态是隐藏的,这可以通过点击右边的小箭头展开。用户可以修饰表型标签或加载基因rank文件
5.参数:用户可以指定p-value,FDR和OC或JC值。
6Actions:user有三种选择,reset(清除所有输入),close(关闭输入面板),build enrichment map(执行)
Data面板(位于底部)
有2中不同的展示窗口,每一个都是单独的数据面板。EM overlap和EM gene set。这两种表达方式的异仅仅是基因列表的异。
1.EM overlap expression viewer显示所有算则的基因集之间的重叠基因的表达(交集)
2.EM geneset expression viewer显示选择的基因集的所有合并的基因表达情况(并集)
3.标准化
Data as is-代表载入的数据
Row Normalize Data-每一行的表达值的平均值跟随SD
Log Transform Data-每个表达值的log值
4.sorting
Hierarchical cluster-根据整个表达set的皮尔逊相关系数计算
如果rank文件被提供,会显示Dataset 1ranking和dataset 2 ranking,通过选择,用户可以相应的对表达谱排序
如果表达值没有相应的rank,那么热途中不会出现表达值
Add ranking运行用户上传额外的rank文件(格式要正确)对rank文件的大小没有限制。但用户需要对rank文件提供一个名字。
5.se expression set
在展示的窗口,用户可以保存表达值成txt 文件(当前展示的)
6.输出表达set(PDF)
用户可以储存当前展示的表达热图成pdf文件。不幸的是这个PDF文件不完美。列的名字在底部而不是在上部。这个问题希望在以后的cytoscape版本解决。
results面板(位于右边)
参数pane
用户可以通过滑动块调整p值和q值
1.phenotype1
2phenotype2
3.p-value cutoff向左移降低p值,会导致网络中node和相应的边减少;向右移会重新建立新node和相应的边。注意的是,建立网络的时候定义的p值不能增加。
4.Q-value cutoff向左移,降低q值,导致node和相应边在网络中移除;向右移重建。同p值,不能大于建网时的q值。
5.相似性cutoff向右移,增加阈值,导致边被移除,向左移,重建新边。不能小于建网时定义的值。
6.在浏览器加载GSEA结果
7.建立EM时的参数列表
8.热图自动聚焦默认是选中的。当你选中网络中的任何node和edge,EM自动更新表达视图。
9.default sorting order在表达视图gene可以根据等级聚类,rank,columns进行sort或不sort。
10.default distance metric对于等级聚类有三种可选择的distance metrics来计算基因之间的距离。默认是皮尔逊相关系数。如果你想使用其他的方法,重新选择就可以。
cytoscape 怎么做na和lncrna互做图
研究人类miRNA转录因子及靶基因之间的相关关系。方法利用生物信息学方法预测miR-NA的上游转录因子和下游靶基因,并对预测结果做基因本体分析,得到参与各生物学过程及分子功能的比例,用统计学PASW做相关性分析。结果人类382个miRNA参与应激、代谢、发育等10个生物学过程和行使转录调控、翻译调控、催化活性等12个分子功能,miRNA上游转录因子之间、下游靶基因之间以及上下游之间存在着广泛的正负相关关系。结论基因在参与生物学过程及行使分子功能的过程中,通过miRNA实现协同作用或隔离效应。
版权声明:本文仅代表作者观点,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 836084111@qq.com,本站将立刻删除