-
Notifications
You must be signed in to change notification settings - Fork 0
bacteriaanalysissystemjapanese
BASはバイオインフォマティクスの開発、解析をサポートするPerlモジュールのひとつです。 このチュートリアルはBASを理解し、設定方法を示すものです。
それでは例をみていきましょう。
(1) 環境設定ファイル[BAS.conf]を開く
$ emacs BAS.conf
- 以下は環境設定ファイルの内容になります。
###############################################
# Bacteria Analysis System configuration file>#
###############################################
#$Id: BAS.conf,v 1.6 2001/09/09 11:53:20 s98982km Exp $
#scripted by Koya Mori(mory@g-language.org)
#This is a configuration of Bacteria Analysis System
package G::System::BAS_conf;
use strict("var");
sub BAS{
my $methods;
$methods= <<'CONF';
#####################################
# G instances #
#####################################
gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk
#####################################
# CAI #
#####################################
>cai N
G-instance $gb
-output #[f or stdout] default:"stdout"
-w_output #[f or stdout] default:"stdout"
-w_filename
.
.
.
(略)
.
.
.
G-languageでは10個のクラスと24個のメソッドが実装されています。
- CAI
- cai
- Codon
- codon_counter
- amino_counter
- codon_usage
- Consensus
- base_counter
- base_information_content
- base_z_value
- base_entropy
- base_relative_entropy
- base_individual_information_matrix
- GCskew
- view_cds
- find_ori_ter
- gcskew
- genomicskew
- cum_gcskew
- gcwin
- Free Energy
- foreach_RNAfold
- Markov
- over_lapping_finder
- Over Lapping Gene
- over_lapping_finder
- Pat Search
- palindrome
- Tandem Repeat
- foreach_tandem
- graphical_LTR_search
- Util
- seq2gif
- genome_map
(2) 解析するデータを選択する
Escherichia_coli_K12がデフォルトのデータとして選択されています。もし、他のデータを使用したい場合には、変数[gb1]を書き換える必要があります。また、下の例のように変数(例えば[mgen])を複数用意することも可能です。
- 変更前
#####################################
# G instances #
#####################################
gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk
- 変更後
#####################################
# G instances #
#####################################
gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk
mgen < /pub/dnadb/ncbi/genbank/genomes/bacteria/Mgen/mgen.gbk # add
(3) メソッドを選択する
ここでは、例としてcodonクラスのメソッド[codon_usage]を使用します。まず、メソッドのスイッチをオンにするため[N]を[Y]に変更し、[G-instance]に解析するデータ(ここでは[mgen])を指定します。ファイルへ出力する場合には、[-output]のオプションに[f]を指定し、./mgen/に保存されます。同様に、グラフトとして出力する場合には[g]を指定し、./mgen/graphに保存されます。デフォルトでは[show]が指定されており、グラフを含むすべての結果が出力されます。
-output | f | 解析データをファイルに出力します |
---|---|---|
g | グラフを出力します | |
show | 自動的にすべての解析結果を出力します | |
-filename | free | [-output]オプションをしようすることで、ファイル名を指定できます) |
- 変更前
>codon_usage N
G-instance $gb
-CDSid
-output show #[f or g or show] default:"show"
-filename
- 変更後
>codon_usage Y # switch on
G-instance gb1 # choose data
-CDSid
-output g #[f or g or show] default:"show"
-filename
環境設定ファイルを保存し、BASファイルを実行します。
$./BAS
- 以下が標準的な出力結果になります。
__/__/__/__/__/__/__/__/__/__/__/__/__/
G-language System
Version: 1.0.0 gamma
Copyright (C) 2001 G-language Project
Institute of Advanced Biosciences,
Keio University, JAPAN
http://www.g-language.org/
__/__/__/__/__/__/__/__/__/__/__/__/__/
Length of Sequence : 816394
A Content : 249211 (30.53%)
T Content : 240560 (29.47%)
G Content : 163703 (20.05%)
C Content : 162920 (19.96%)
Others : 0 (0.00%)
AT Content : 59.99%
GC Content : 40.01%
.
.
(Abbreviation)
.
.
1.次に、出力された結果を見ていきましょう。グラフを描画する場合は以下のようにいます。
$ cd mgen/graph
$ gimp codon_table.gif
*解析データをファイルに出力したい場合には *出力オプションを [f] に変更してください。 *そして、ファイルを保存します。 *次に、BASを実行します。 *すると、ファイルが出力されます。
$ cd mgen
$ emacs codon_usage.csv
- 以下が標準的な出力結果になります。
/,taa,348,0.725
/,tag,132,0.275
A,gca,3759,0.386
A,gcc,730,0.075
A,gcg,462,0.047
A,gct,4799,0.492
C,tgc,295,0.203
C,tgt,1160,0.797
D,gac,1196,0.139
D,gat,7388,0.861
.
.
.
(略)
.
.
.
[Essential]と[option]には違いがあります。[option]には名称の前に[-]がつきます(例えば-CDSid)が、[Essential]にはつきません。また、[Essential]には変数を指定しますが、[option]にはしません。
codon_usage Y
G-instance gb1 ## Essential ## -CDSid # option # -output f #[f or g or show] default:"show" # option # -filename # option #
[G-instance]は[Essential]になり、[-CDSid]、[-output]、[-output]、[-filename]は[option]になります。
-
G-language Maps
- Institute for Advanced Biosciences
- E-Cell Simulation Environment
- E.coli multi-omics database
- Database of bacterial replication terminus
Kazuharu Arakawa, Ph.D.
G-language Project Leader Associate Professor
Institute for Advanced Biosciences Keio University
997-0017 Japan Tel/Fax: +81-235-29-0800 gaou@sfc.keio.ac.jp