Skip to content

bacteriaanalysissystemjapanese

gaou edited this page Oct 26, 2020 · 2 revisions

1. はじめに

BASはバイオインフォマティクスの開発、解析をサポートするPerlモジュールのひとつです。 このチュートリアルはBASを理解し、設定方法を示すものです。

2. BASの設定方法

それでは例をみていきましょう。

(1) 環境設定ファイル[BAS.conf]を開く

  $ emacs BAS.conf
  • 以下は環境設定ファイルの内容になります。
  ###############################################
  # Bacteria Analysis System configuration file>#
  ###############################################
  #$Id: BAS.conf,v 1.6 2001/09/09 11:53:20 s98982km Exp $
  #scripted by Koya Mori(mory@g-language.org)
  #This is a configuration of Bacteria Analysis System
   
  package G::System::BAS_conf; 
   
  use strict("var"); 
   
  sub BAS{ 
    my $methods; 
   
    $methods= <<'CONF'; 
  
  ##################################### 
  #  G instances                      # 
  ##################################### 
  
  gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 
     
  ##################################### 
  #  CAI                              # 
  ##################################### 
    
  >cai            N
    
  G-instance      $gb
  
  -output                 #[f or stdout] default:"stdout"
  
  -w_output               #[f or stdout] default:"stdout"
  
  -w_filename 
     . 
     . 
     . 
    (略) 
     . 
     . 
     .

G-languageでは10個のクラスと24個のメソッドが実装されています。

  • CAI
    • cai
  • Codon
    • codon_counter
    • amino_counter
    • codon_usage
  • Consensus
    • base_counter
    • base_information_content
    • base_z_value
    • base_entropy
    • base_relative_entropy
    • base_individual_information_matrix
  • GCskew
    • view_cds
    • find_ori_ter
    • gcskew
    • genomicskew
    • cum_gcskew
    • gcwin
  • Free Energy
    • foreach_RNAfold
  • Markov
    • over_lapping_finder
  • Over Lapping Gene
    • over_lapping_finder
  • Pat Search
    • palindrome
  • Tandem Repeat
    • foreach_tandem
    • graphical_LTR_search
  • Util
    • seq2gif
    • genome_map

(2) 解析するデータを選択する

Escherichia_coli_K12がデフォルトのデータとして選択されています。もし、他のデータを使用したい場合には、変数[gb1]を書き換える必要があります。また、下の例のように変数(例えば[mgen])を複数用意することも可能です。

  • 変更前
    ##################################### 
    #  G instances                      # 
    #####################################   
    gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 
  • 変更後
    ##################################### 
    #  G instances                      #
    ##################################### 
  gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 
  mgen < /pub/dnadb/ncbi/genbank/genomes/bacteria/Mgen/mgen.gbk    # add 

(3) メソッドを選択する

ここでは、例としてcodonクラスのメソッド[codon_usage]を使用します。まず、メソッドのスイッチをオンにするため[N]を[Y]に変更し、[G-instance]に解析するデータ(ここでは[mgen])を指定します。ファイルへ出力する場合には、[-output]のオプションに[f]を指定し、./mgen/に保存されます。同様に、グラフトとして出力する場合には[g]を指定し、./mgen/graphに保存されます。デフォルトでは[show]が指定されており、グラフを含むすべての結果が出力されます。

-output f 解析データをファイルに出力します
g グラフを出力します
show 自動的にすべての解析結果を出力します
-filename free [-output]オプションをしようすることで、ファイル名を指定できます)
  • 変更前
  >codon_usage    N 
  G-instance      $gb 
  -CDSid 
  -output         show    #[f or g or show] default:"show" 
  -filename 
  • 変更後
  >codon_usage    Y       # switch on 
  G-instance      gb1     # choose data 
  -CDSid 
  -output         g       #[f or g or show] default:"show" 
  -filename 

環境設定ファイルを保存し、BASファイルを実行します。

  $./BAS 
  • 以下が標準的な出力結果になります。

                 __/__/__/__/__/__/__/__/__/__/__/__/__/ 
     
                         G-language System 
     
                  Version: 1.0.0 gamma 
     
                  Copyright (C) 2001 G-language Project 
                  Institute of Advanced Biosciences, 
                  Keio University, JAPAN 
     
                     http://www.g-language.org/ 
     
                 __/__/__/__/__/__/__/__/__/__/__/__/__/ 
     
      Length of Sequence :    816394 
               A Content :    249211 (30.53%) 
               T Content :    240560 (29.47%) 
               G Content :    163703 (20.05%) 
               C Content :    162920 (19.96%) 
                  Others :         0 (0.00%) 
              AT Content :    59.99% 
              GC Content :    40.01% 
                               . 
                               . 
                           (Abbreviation) 
                               . 
                               . 

1.次に、出力された結果を見ていきましょう。グラフを描画する場合は以下のようにいます。

  $ cd mgen/graph 
  $ gimp codon_table.gif 

*解析データをファイルに出力したい場合には *出力オプションを [f] に変更してください。 *そして、ファイルを保存します。 *次に、BASを実行します。 *すると、ファイルが出力されます。

  $ cd mgen
  $ emacs codon_usage.csv 
  • 以下が標準的な出力結果になります。
  /,taa,348,0.725 
  /,tag,132,0.275 
  A,gca,3759,0.386 
  A,gcc,730,0.075 
  A,gcg,462,0.047 
  A,gct,4799,0.492 
  C,tgc,295,0.203 
  C,tgt,1160,0.797 
  D,gac,1196,0.139 
  D,gat,7388,0.861 
      . 
      . 
      . 
    (略) 
      . 
      . 
      . 

3. 注意点

[Essential]と[option]には違いがあります。[option]には名称の前に[-]がつきます(例えば-CDSid)が、[Essential]にはつきません。また、[Essential]には変数を指定しますが、[option]にはしません。

codon_usage Y

G-instance gb1 ## Essential ## -CDSid # option # -output f #[f or g or show] default:"show" # option # -filename # option #

[G-instance]は[Essential]になり、[-CDSid]、[-output]、[-output]、[-filename]は[option]になります。

Clone this wiki locally