1st OUBIC Bioinformatics Training Workshop
第1回OUBICバイオインフォマティクス講習会
- 日時 / Date & Time:2025年6月30日(月曜日) / Monday, June 30, 2025
- 【午前の部 / Morning Session】Colab入門+Python基礎 / Introduction to Colab + Python Basics:10:00–12:00
- 【午後の部 / Afternoon Session】塩基配列操作入門 / Introduction to Sequence Analysis:13:30–16:40
- 形式 / Format:オンライン開催(Zoom) / Online (Zoom)
- 対象 / Audience:学内の学生および教職員 / Students and faculty members
- 言語 / Language:日本語 / Japanese
概要 / Overview
【午前の部】Colab入門+Python基礎
講師:山﨑 将太朗(バイオインフォマティクスセンター 生物情報解析分野RNA情報学グループ 准教授)
内容:プログラミングとは何かという基礎の基礎から、実際にコードを書く実習までをGoogle Colabで体験できます。インストール不要ですぐに始められます。基本的な文法だけで書ける実用的なスクリプトも紹介します。
メッセージ: 初心者向けの内容ですので、プログラミング経験がなくても安心してご参加いただけます。プログラミング経験者は午後からのご参加でも大丈夫です。
事前準備:Google アカウント
【午後の部】塩基配列操作入門
講師:山﨑 将太朗(バイオインフォマティクスセンター 生物情報解析分野RNA情報学グループ 准教授)
内容:DNAやRNAの塩基配列を対象に、配列の取得・保存・簡易解析・可視化の一連の操作を体験できます。繰り返し処理による多数データの自動処理など、プログラミングならではの柔軟で再現性の高い解析手法を学びます。プログラミング未経験にも適した内容です。
メッセージ: PythonとGoogle Colabによる解析の経験者のみ午後の部から参加可能とさせていただきます。 講習会の後半には、質疑応答や操作上のトラブル解決のための時間を十分に確保する予定です。そのため、講習の主要部分は16時40分よりも前に終了する見込みです。
事前準備:Google アカウント
資料・配布物 / Materials
- ポスター
- 【講義資料一式 / Complete set of lecture materials】
- 午前の部の講義資料 / Morning session lecture materials (machine-translated)
- 午後の部の講義資料 / Afternoon session lecture materials (machine-translated)
- 講習で使用した Google Colab ノートブックのリンク集 / Collection of links to the Google Colab notebooks used in the workshop (machine-translated)
- Note: Only the link list itself has been machine-translated. The Google Colab notebooks are available only in Japanese. However, you can use your browser’s translation feature.
※ これらの資料は将来的に削除させていただく可能性があります。予めご了承ください。
Note: These materials may be removed in the future. Thank you for your understanding.
目次 / Table of Contents
【午前の部】Colab入門+Python基礎
- Google Colabの紹介
- 【実習】さっそく解析してみよう!
- Pythonとは
- ChatGPT等のAIの活用のススメ
- 【実習】Python超入門
- 【実習】基本構文だけでできる"便利プログラム"
【午後の部】塩基配列操作入門
- 【実習】文字列と塩基配列(プログラミングの勉強)
- 【実習】塩基配列の取得と保存
- 【実習】基本的な配列解析と可視化
講習内容のサンプル / Sample Contents
注意事項 / Notes
- 一部の処理のみを切り出して掲載しているため、この記載内容だけでは意図通りに動きません。
- 掲載時の内容と、実際の講習会の内容が異なる場合があります。
- 実際の講習会では、これらの内容に先立ち、前提知識や環境設定に関する解説を行っています。
- あくまで記載内容の抜粋の紹介であり、仮に「コードを実行」などと書かれていても、この画面上で実際に実行できるものではありません。
- Since only selected parts of the workflow are shown here, this content will not work as intended on its own.
- The content shown here may differ from what is covered in the actual workshop.
- In the actual workshop, we provide explanations on prerequisite knowledge and environment setup before covering these materials.
- This page is only an excerpt for reference. Even if it says “run the code,” it cannot be executed directly on this page.
【午前の部】Colab入門+Python基礎
プログラムが実行される順番
🧾 基本ルール:上から下に、順番に実行される
プログラムは、上から順番に1行ずつ読まれて、実行されていきます。
x = 5
y = 3
print(x + y)
このときの実行の流れはこうなります。
x = 5→ x という変数に 5 を入れるy = 3→ y という変数に 3 を入れるprint(x + y)→ x と y の合計(8)を表示する
🧪 Google Colab のルール:セルごとに実行できる
Google Colab では、コードを「セル」というかたまりに分けて書きます。
そして、それぞれのセルをバラバラに実行することができます。
# セル1
x = 1 # xに1を代入する
# セル2
x += 1 # xの数値を1増やす
# セル3
print(x) # xの中身を出力(表示)する
- セル1 を先に実行しておけば、セル2 と セル3 はうまく動きます(x = 1 が記憶されている)
- セル1 をスキップするとエラーになります(x の中身がまだ決まっていない)
- セル2 はスキップすることが可能です。セル3 では、スキップしない場合は 2 が、スキップした場合は 1 が出力されます。
- セル2 を複数回実行することが可能です。セル2 を実行した回数だけ、xの値は大きくなります。
- セル2 の後で セル1 を実行すると値が 1 に初期化されます。
基本的に、上から順番に1つずつセルが実行することが前提です。 セルを飛ばしたり、順番を入れ替えた場合、実行した場合、意図しないエラーや、誤った処理が行われる可能性が高いです。
【午後の部】Colab入門+Python基礎
相補鎖と逆相補鎖の取得
DNAは2本鎖構造をとっており、各塩基(A, T, G, C)は特定の相手と結合する相補的な関係にあります:
- A(アデニン) ⇔ T(チミン)
- G(グアニン) ⇔ C(シトシン)
Seq クラスを使うと、この相補鎖(complement)と、逆方向に読んだ相補鎖(逆相補鎖 = reverse complement)を簡単に得ることができます。
complement()は各塩基を対応する塩基に変換reverse_complement()はcomplementした後に逆順に並べる
この操作は、PCRプライマーの設計や転写方向の解析などで頻繁に使われます。
DNAの塩基配列では、通常の A(アデニン)、T(チミン)、G(グアニン)、C(シトシン)以外にも、複数の塩基の可能性を示す「曖昧な塩基記号」が使われることがあります。
BioPython の Seq クラスでは、こうした 曖昧な塩基記号も正しく補完して相補鎖や逆相補鎖を計算することができます。
🔹 各塩基の記号とその意味
| 記号 | 含まれる塩基 | 相補塩基 | 記号の由来・語源補足 |
|---|---|---|---|
| A | A(アデニン) | T | Adenine |
| T | T(チミン) | A | Thymine |
| G | G(グアニン) | C | Guanine |
| C | C(シトシン) | G | Cytosine |
| R | A or G(プリン) | Y | R = puRine(プリン類) |
| Y | C or T(ピリミジン) | R | Y = pYrimidine(ピリミジン類) |
| S | G or C | S | S = Strong(G≡Cは三重結合で強い) |
| W | A or T | W | W = Weak(A=Tは二重結合で弱い) |
| K | G or T | M | K = Keto基を持つ |
| M | A or C | K | M = aMino基を持つ |
| B | C or G or T(非A) | V | B = B comes after A(A以外) |
| D | A or G or T(非C) | H | D = D comes after C(C以外) |
| H | A or C or T(非G) | D | H = H comes after G(G以外) |
| V | A or C or G(非T) | B | V = V comes after T(T以外) |
| N | A or T or G or C | N | N = aNy(任意の塩基) |