0%

KEGG API是一个连接KEGG各类数据库的应用程序,主要以URL形式进行访问:

http://rest.kegg.jp/<operation>/<argument>[/<argument2[/<argument3> ...]]
<operation> = info | list | find | get | conv | link | ddi
Read more »

GO.db

GO.db是一个用注释maps来描述Gene Ontology的一个R包,其在很多GO注释及富集的R包中被调用,应用广泛,每半年更新一次。主要用来描述各个Term之间的父子节点联系以及Term的信息。

Read more »

  1. 一般来说我们都是通过install.packages()安装base R包

    通过source("https://bioconductor.org/biocLite.R") biocLite()来安装bioconductor

    Read more »

做个笔记,记录下KEGG的BRITE和PATHWAY

KEGG BRITE is a collection of manually created hierarchical text (htext) files capturing functional hierarchies of various biological objects, especially those represented as KEGG objects.(依据KEGG数据库,通过人工收集,对生物层面进行分级注释的数据,其实也就是一个有层级关系的文件)

Read more »

与One-Liner相关的perl参数

-a 自动分隔模式,用空格分隔$并保存在@F中,也就是@F=split //, $
-F 指定-a的分隔符
-l 对输入的内容进行自动chomp,对输出的内容自动加换行符
-n 相当于while(<>)
-e 执行命令,也就是脚本
-p 自动循环+输出,也就是while(<>){命令(脚本); print;}

记住以上几点参数,几乎可以开始使用perl来编写one line命令了

Read more »

读文献获取数据

文献名称:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors

  1. 查找数据:Data availability
    The RIP-seq an RNA-seq data have been deposited in the Gene Expression Omnibus database, with accession code GSE81916. All other data is available from the author upon reasonable request.

  2. 获得GSE号:GSE81916

    Read more »

Conda是一个开源包管理系统和环境管理系统,可用于安装多个版本的软件包及其依赖关系,在能在它们之间切换。

Read more »

  1. 首先是软件的安装

VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同

VCF文件可以分为两部分看,最上面#号注释的的部分是对一些参数的解释(看英文能懂的话,下面的解释就不用看了),而下面没#号注释的部分则是各个参数对应的具体的值

Read more »

这个KEGG WebLinks简单的说,就是利用url命名规则,直接通过网页访问KEGG数据库

  1. 首先有一个概念需要理清楚

    map00010
    ko00010
    hsa00010

    上述3个通路命名表示的是同一个通路(Glycolysis / Gluconeogenesis),但是从图上也可以看出三者有点细微的区别:

    • map00010:以灰色背景显示通路里的所有的点
    • ko00010:以蓝色显示通路里的所有KO号
    • hsa00010:以绿色显示通路里的所有与人有关的点,并显示(鼠标移到某个点)对应的gene entries
      Read more »

在搞blast2go本地化的时候,发现我ubuntu系统默认将mysql安装在根目录下的,因而mysql的默认数据库路径也就是/var/lib/mysql,在我导入大文件时就出问题了,根目录满了。因此我需要将mysql的默认数据库目录改到我的home目录下

Read more »

最近想学习下使用GATK所介绍的best practice流程来call SNP流程

最开始按照网上的教程,在BWA比对后,准备用picard来压缩排序sam文件为bam文件,并对bam文件进行duplicates marking,这是就需要用到picard软件

Read more »

BWA介绍

BWA 全名 Burrow-Wheeler Aligner

BWA是一款将DNA序列mapping到参考基因组上的软件,例如比对到人类基因组。其由三个算法组成BWA-backtrack,BWA-SW和BWA-MEM。在该软件作者的github上可以看到对三个算法的不同用处的解释https://github.com/lh3/bwa

  1. The first algorithm is designed for Illumina sequence reads up to 100bp, while the rest two for longer sequences ranged from 70bp to a few megabases.
  2. BWA-MEM and BWA-SW share similar features such as the support of long reads and chimeric alignment, but BWA-MEM, which is the latest, is generally recommended as it is faster and more accurate.
  3. BWA-MEM also has better performance than BWA-backtrack for 70-100bp Illumina reads.

并且在BWA命令中可以分别调用这三个算法,如:aln/samse/sampe for BWA-backtrack,bwasw for BWA-SW,mem for the BWA-MEM

Read more »

karyoploteR是一个bioconductor的一个R包,用于定制非环形全基因组数据的可视化。其绘图绘图过程按照R的基本绘图系统,并且不需要其他图形包。karyoploteR旨在给使用者提供一种可以创建任何线性染色体基因组的表征,并在染色体上绘制相关基因组注释和实验数据。

Read more »