ゲノム情報を活用した遺伝子機能に関連する遺伝子群の可視化戦略
Feb 9, 2026: Research_Highlights
論文解説
系統樹と保存されたゲノム近傍解析を用いた標的遺伝子機能に関与する遺伝子群の抽出と可視化
–[NiFe]-ヒドロゲナーゼとコハク酸脱水素酵素の場合–
高坂智之(山口大学)、松谷峰之介(東京農業大学)
発表のポイント
- 成熟化が必要な複合体酵素の機能に関連する遺伝子群を、ゲノム情報を基にして可視化する解析戦略を提案しました。
- 「遺伝子の機能と関連する遺伝子はゲノム近傍に集合すること」「タンパク質の進化系統はその機能と関連すること」「遺伝子を機能化するのに必要な遺伝子がゲノム上に必ず存在すること」という知見を利用しました。
- 我々が構築した解析戦略により、遺伝子の分子系統に沿って特定機能遺伝子がゲノム近傍に保存されていることを、[NiFe]-ヒドロゲナーゼを題材として示しました。
- さらに、構築した手法を自動化することで関連遺伝子や他の酵素(コハク酸脱水素酵素)でも同様の解析を行えることを示しました。
発表概要
ある種の酵素は機能するために複合体の形成と補欠分子族の結合および補酵素の挿入が必要です。酵素を構成するタンパク質がその機能を有していることもありますが、時には補助的なタンパク質、つまりは「成熟化因子」を要求することがあります。
このような酵素を異種発現する際には、同時に機能化に関連する遺伝子群を発現させるか、発現させる宿主において機能を補完する遺伝子が発現している必要があります。これまで異種発現を検討する時には、多くの場合、同時発現させる遺伝子群の報告を基にするか、とにかく手当たり次第に試すことで解決が試みられてきました。
一方で、「遺伝子の機能と関連する遺伝子がゲノム近傍に集合する」「タンパク質の進化系統はその機能と関連する」「遺伝子を機能化するのに必要な遺伝子はゲノム上に必ず存在する」という3つの知見があります。
これらのアイデアを基にゲノム情報解析を行うことで遺伝子の機能化に関連する遺伝子群の可視化が行えるのではないかと考え、それを可能にする解析戦略を検討しました。この際に解析するターゲット酵素として、データベースが充実している [NiFe]-ヒドロゲナーゼを選定し、検討しました。
構築した戦略を基に遺伝子のゲノム近傍に存在している遺伝子を集め分析したところ、機能に関連する遺伝子群は標的遺伝子の分子系統に沿って保存されていることが明らかとなりました。この結果を受けて解析の自動化を目指し、系統樹のクレードに基づいた自動クラスタリング手法を導入しました。その結果、標的遺伝子だけではなく関連遺伝子群でも同様の解析が可能であることが示されました。
加えて、本手法をコハク酸脱水素酵素に適用したところ、以前の解析と同様の再現性ある結果が得られたうえに、恣意性のない解析手法であることが確認されました。これらの結果は、本研究で検討した解析戦略は複合体および成熟化を必要とするような酵素遺伝子の解析において有効であることを示しています。本手法は、異種宿主発現の検討を効率化するだけでなく、標的遺伝子の機能解析を行う上でも有用です。
発表内容
ゲノム情報解析の戦略として、まずは標的酵素[NiFe]-ヒドロゲナーゼ活性サブユニットをコードする遺伝子、およびその機能に関連する12の遺伝子を選定しました。これら計13の遺伝子について、分類に配慮した1,969の原核生物およびアーキアのゲノム配列ライブラリから、blastpを用いてホモログを選抜しました。
選抜した各ホモログ遺伝子のゲノム上の近傍(上流・下流に5つずつ)に存在する遺伝子を収集し、それらをMarkovクラスターアルゴリズムによりクラスタ化しました。次に、各クラスターに含まれる遺伝子数に基づいて番号を付与し、近傍遺伝子の「機能クラスター」を形成させました。
一方で、ヒドロゲナーゼ活性サブユニットの分子系統を分析し、系統樹上のクレードを決定しました。各クレードに属する遺伝子を含むゲノムの数と、そのゲノムに含まれている各機能クラスターに含まれる遺伝子数を比較することで、機能クラスターの保存性を分析しました。
分析の結果、標的遺伝子の分子系統に沿って、近傍遺伝子の機能クラスターの保存性が分布していることが分かりました。なお、ゲノムの生物的系統分類と標的遺伝子の分子系統分類は部分的には異なっており、周辺遺伝子群の構成を理解する上では、標的遺伝子の分子系統解析が非常に重要であることが示されました。
構築した解析手法の自動化を検討し、系統樹の構造からクレード分類を算出するTreeClusterを導入し、系統分類の自動化を検討しました。その結果、系統分類を適切に自動化できることを示しました。我々の検討では、グループ内の全遺伝子間の平均的な進化距離を基準に分類する avg_clade モードが最適なアルゴリズムでした。この手法の自動化によって、多数の関連遺伝子においても機能関連遺伝子の分析を迅速に行うことが可能になり、客観的な解析手法を確立することができました。
加えて、先に解析を進めていたコハク酸脱水素酵素を用いて、異なる複合体酵素でも同様の結果が期待できるか検証しました。コハク酸脱水素酵素は、成熟化においてフラビンアデニンジヌクレオチド(FAD)の共有結合が必要であり、それを助けるシャペロンの存在が示唆されています。構築した解析手法を用いて、コハク酸脱水素酵素の活性サブユニットの分子系統に基づいた近傍遺伝子クラスターの保存性を分析したところ、特定のクレードにおけるシャペロンの保存性を確認することができました。
論文情報
- 雑誌名: Microbes and Environments
- 論文タイトル: Using Phylogeny and a Conserved Genomic Neighborhood Analysis to Extract and Visualize Gene Sets Involved in Target Gene Function: The Case of [NiFe]-hydrogenase and Succinate Dehydrogenase
- 著者: Tomoyuki Kosaka and Minenosuke Matsutani
- DOI:10.1264/jsme2.ME25018
- 発表日: 2025/11/13
研究助成および利用施設
本研究は日本学術振興会科学研究費補助金(21K05343)および公益財団法人発酵研究所(LA-2023-018)の助成を受けるとともに、情報・システム研究機構国立遺伝学研究所が有する遺伝研スーパーコンピュータシステムを利用しました。
用語解説
- [NiFe]-ヒドロゲナーゼ:水素(H2)を電子と水素イオン(H+)に分解する反応と、逆に水素を合成する反応の両方を触媒する酵素です。活性中心にニッケル(Ni)と鉄(Fe)を含む複雑な構造を持ち、次世代エネルギーとして期待される水素代謝の鍵となる酵素です。
- 成熟化因子:酵素本体が正しく折り畳まれたり、金属原子などの「補欠分子族」を活性中心に取り込んだりするのを助けるタンパク質です。これらがないと、酵素本体が機能しません。
- 異種発現:ある生物が持つ遺伝子を大腸菌などの別の生物(宿主)に導入してタンパク質を作らせることです。有用な酵素の大量生産に利用されている技術ですが、特定の酵素では機能しないことや発現しないことがあります。
- コハク酸脱水素酵素:細胞内のエネルギー産生(クエン酸回路など)に関連している酵素です。コハク酸を酸化するにはFADが共有結合する必要があり、本研究ではこれを助けるシャペロンの解析を実証例として用いました。
- ゲノム近傍遺伝子:ゲノム配列上で、特定の遺伝子のすぐ近く(上流や下流)に位置する遺伝子のことです。機能的に関連する遺伝子同士はゲノム上で近くに集まって存在する傾向があるため、これを探ることで関連する遺伝子を分析できます。
- 分子系統解析:タンパク質や遺伝子の「家系図(系統樹)」を作成し、進化の道のりを分析することです。家系図上で枝となりまとまったグループを「クレード」と呼びます。
- Markovクラスターアルゴリズム:(MCL)膨大なデータの中からつながりの強いもの同士を自動的にグループ化(クラスタリング)する数学的な手法です。本研究では多様な遺伝子を機能ごとにまとめるために使用しました。
- TreeCluster:系統樹の形に基づいて、進化的に近いグループを自動で切り分けるソフトウェアです。従来は人の目で行っていた「どこからどこまでを一つのグループとするか」という判断を、客観的な数値基準で行うことができます。