バイオインフォマティクス

園芸学部園芸学科専門科目「バイオインフォマティックス」の情報ページです。

最新情報

2012年7月30日

試験の正解と解説

問題正解解説
1機械制御プログラムはバイオインフォマティクスの範疇ではありません。
2ウでも動かなくはありませんが、下から3行目の処理で塩基配列を70文字ごとに切り分けて出力する時に、70文字以外のところに改行が入り、出力がおかしくなります。イ、エでは取り出した塩基配列10文字ごとにseqを新しくしてしまうので、うまく行きません。
3
4
5
6Acer[organism] chloroplastでは2329件がヒットします。目的の長さの配列を絞り込むにはAcer[organism] chloroplast 601:1000[sequence length]とすると446件であることがわかります。
7アは塩基配列の先頭に>が入っているので間違い、イはRubyでデータベースをテキストファイルで表す時によく使われるYAMLという形式、エはPHYLIP形式です。
8アは1行目に配列の数と長さがなく、イとウは配列の長さをギャップで揃えていないので間違いです。
9BとCでクレードを形成していますので、この2つが括弧で囲まれている必要があります。エは括弧の記号が違います。
10距離法では常に一つの系統樹が得られます。

2012年7月23日

Rubyのサンプルプログラム

授業中に紹介したもの、レポート課題の解答例など、いくつかのプログラムを置いておきます。

2012年7月2日

レポート課題

何か興味のある生物のグループ(植物に限らない)や興味のある生命現象に関する遺伝子をDDBJやNCBIのデータベースから検索し、塩基配列をFASTA形式でダウンロードする。このとき、配列の数が50を超えないようにうまく絞り込むこと。Genbank形式でダウンロードした後、プログラムを使ってFASTA形式に変換してもよい。絞り込みがうまく行かない場合は、FASTA形式のファイルの一部を切り取って、50以内にする。これをClustalWでアラインし、結果をxxx.alnのClustal形式のファイルとしてダウンロードし、距離法による系統樹もファイルとしてダウンロードする。Clustal形式のファイルをPHYLIP形式に変換し、dnaparsを用いて最節約法による系統樹を推定する。

メール本文に検索の対象と得られた系統樹に対する考察を書き、Clustal形式のファイル (clustalw_xxxxxxx.aln)、Clustalによる系統樹 (clustalw_xxxxxxx.phb)、PHYLIPのdnaparsによる系統樹 (outtree) を添付ファイルとして送って下さい。系統樹はNewick形式で送って下さい。また、考察用に系統樹を図として表示する方法は来週の授業で改めて説明します。

提出期限: 8月10日(金)

ヒント: 植物の類縁関係を調べるためには葉緑体DNAの遺伝子間領域(trnL-trnFやtrnS-trnG)、trnKイントロン、科のレベルではrbcLやatpB遺伝子、種内変異では核遺伝子のITS領域などがよく使われています。香りや色素など、特定の物質の合成や、生命現象に関する遺伝子は図書館ホームページの「電子資料を探す」から「日本語の雑誌論文」の「CiNii Articles(全分野)」へ行き、適当なキーワードで論文を見つけると、遺伝子の名前が分かります。塩基配列のアクセション番号が書いてある場合もあります。

phylip.rbの解説

先週の授業でphylip.rbの内容を解説しましたが、改めてウェブページで解説します。

phylip.rb

phylip.rbの解説

2012年のレポート課題

レポート課題

授業用のサンプルプログラム・ファイル

phylip.rb

acer-blast.txt

P972-blast.txt

blast_to_fasta.rb

blast_to_phylip.rb

phyre-saintpauliaF35H.txt

Unixの使い方

Unixの使い方

Rubyプログラミング入門

Webテキスト

リンク