Frontiers in Genetics

Editorial on the Research Topic
RNA-Seq Analysis: Methods, Applications and Challenges

Introduction

RNA-seq は、遺伝子発現研究に対する研究コミュニティのアプローチに革命をもたらした。 実際、この技術はすべての遺伝子の発現レベルを一度に定量化する可能性を開き、特定の研究にとって興味深い候補を(事前ではなく)事後的に選択することができるようになった。 継続的なコストの低下と、ライブラリ作成プロトコルがモデル種から独立していることから、関係者はこの技術への投資を確信し、大規模な疾患特異的データセットを作成できるコンソーシアムを設立し、その結果、集団レベルでのトランスクリプトーム研究を促進させた。 この意味での好例は、がんゲノムアトラスです。 RNA-seq は短期間のうちに、単に遺伝子の発現を定量化する技術から、新しい転写産物の発見(de novo トランスクリプトームアセンブリによる)、代替スプライシングバリアントや新しい細胞タイプの特徴付け(シングルセル RNA シーケンスによる)などを行う強力なツールに進化しています。 RNA-seqを日々の診断活動に活用することは、もはや夢物語ではなく、現実のものとなっています。

確立されたベストプラクティスは存在しますが、RNA-seqデータの管理は容易ではありません。 シーケンスを行う前に、ダウンストリームの解析バイアスを最小限に抑えるため、ライブラリーの調製を慎重に計画することが不可欠です。 また、予算の最適化も重要な要素です。 複数のサンプルをシーケンスすることで、統計的検出力が向上し、ノイズや変動による望ましくない副作用が減少します。 しかし、サンプル数が多ければ多いほど、コストも高くなります。 マルチプレックスは、サンプル数を犠牲にすることなく予算を制限するための効果的なツールであることが証明されています。 DNAバーコーディングは、最大96のサンプルを1つのラインに結合することができ、シーケンスの深さを低くして、シーケンスのサンプル数を多くすることができます。

シーケンスの下流では、Fastqデータを検証し、生のリードを遺伝子発現の定量的な指標に抽出するために処理する必要があります。 バリデーションはある程度標準的な手順であるが、リード数はRNAの種類(マイクロRNAなど)やターゲットアプリケーションに依存する。 通常、リードは、アダプター除去、参照ゲノムとのアラインメント、機能単位(転写物、遺伝子、マイクロRNAなど)でのグループ化、正規化、カウントが行われます。 その後の解析は、アプリケーションによって大きく異なる。 最も単純な設定では、2つの集団間の表現型の違いの原因となる遺伝子のサブセットを発見する必要があります。 また、ある表現型に関連する相互作用遺伝子やパスウェイを見つけるために、共発現(または逆発現)ネットワークを構築したい場合もある。 その他の用途としては、未知の細胞型の発見、均質なファミリーにおける細胞型の組織化、新しい分子の同定(例, このリサーチトピックは3つの主要セクションに分かれており、5つの論文はRNA-seqワークフローについて、4つの論文は単一細胞RNAシーケンスの最新フロンティアについて、最後の4つの論文は腫瘍プロファイリングと植物科学に関連するケーススタディについて報告しています。

第1部では、最先端のワークフローの主要な選択を強調することによって、RNA-seqプロセス(実験デザインから解析、新しい知識の抽出まで)を分析することを試みました。 主に計算機的な側面に焦点を当てたが、このリサーチトピックは、生命科学分野を専門とする読者で、自身のデータの分析において自立し、自律することを目指す人々の興味を引くことができると考えている。 このセクションの2つの論文では、発現量の異なる遺伝子の同定とcircRNAのコーディング能力の予測という新しい手法を紹介している

第2セクションでは、RNA-seqデータ解析の新しい分野であるシングルセルシーケンス(scRNA-seq)を紹介している。 概念的にはバルクの細胞配列決定と似ているが、この技術は単一細胞の分解能のため、多くのノイズが発生し、アドホックな解析方法が必要となる。 このセクションでは、ラボのプロトコルから最も一般的な解析まで、基本的なシングルセルRNAシーケンスのコンセプトの紹介に多くの時間を割いています。 特に、細胞の種類をクラスタリングした結果の評価や、差分発現実験の再現性の問題について議論する。 最後に、シーケンスのカバレッジの低さによる欠損数を推測する新しい方法について説明し、このセクションは終了する。

リサーチトピックの最後の部分は、腫瘍に関する3つのケーススタディと植物科学におけるアプリケーションの1つの4つを取り上げた。 その理由は、異なるタイプの分析を示すためである。 より単純なケースでは、癌の発症を予知する遺伝子パネルを作成することが解析の目的であった。 次に、共発現ネットワークの例を示す。 最後に、異なるタイプのRNA(long non-coding, gene, microRNA)の相互作用の例を報告し、細胞の生命を制御するパスウェイの複雑さを示している

2.1. RNA-Seq解析

Reed et al.では、Multiplexed RNA Sequencingが提供する機会について議論されている。 この研究では、不死化したヒト肺上皮細胞からの実際のデータを使用して、いくつかの方法の比較を提供している。

Peri et al.では、ユーザーフレンドリーな解析ワークフローであるRMTAが提案されている。 RMTAは、標準的な前処理ツール(すなわち、リード品質分析、低発現転写物のフィルタ、および差分発現分析のためのリードカウント)を、拡張可能で導入しやすい環境で提供するように設計されている。

Jimenez-Jacinto et al.では、統合的差分発現分析ウェブサーバ(IDEAMEX)が説明されている。 IDEAMEXの根拠は、標準的な差分発現解析のためのUNIXベースの環境と対話する経験(時にはフラストレーション)から非熟練ユーザーを解放することである。

Gao et al.

SunとLiは、ある円形RNAが翻訳されるかどうかを予測する問題について研究している。 円形RNAは他の種類のRNAと異なり、3末端と5末端が結合した環状に配列しています。 このため、翻訳されるかどうかの判断が難しい。 この論文では、circRNAの翻訳能力を高感度に同定するアルゴリズムを提供している。 Single Cell RNA Sequencing

Chen et al.では、現在利用可能なシングルセルの分離プロトコルとscRNA-seq技術の概要が紹介されている。 さらに、品質管理からネットワーク再構築まで、scRNA-seqデータ解析のためのいくつかの方法が議論されている

Krzak et al.では、細胞の不均一性を研究するためのクラスタリングの使用が解剖されている。 特に、この研究は、scRNAseqクラスタリングの利点と欠点に関する新しい洞察を提供することを目的とし、未解決の課題を強調しています。

Mou et al.では、発現差研究の再現性に関連するいくつかの問題について議論されています。 この種の解析の複雑さは、RNAの少なさと、その結果として生じる低いS/N比にある。 6030>

Mongia et al.では、単一細胞の発現データにおけるドロップアウトをインプットする方法について詳述されている。 実データを用いた実験では、提案したソフトウェアが、リードの本当の欠如とドロップアウトのイベントを識別できることが示されている

2.3. ケーススタディ

Yin et al.では、差分発現解析を用いて、膠芽腫の発症に潜在的に予後をもたらす遺伝子の小さなパネルをピンポイントで特定しています。 この論文の焦点は、遺伝子間の相互作用に関係なく、健康/病気の分類を改善することである。 その後、ネットワークを解析し、軟部組織肉腫に関連するハブ遺伝子を選択した。

Zheng et al.では、肺腺癌における異なる分子間の相互作用のダイナミクスを研究している。 長鎖非コードRNAの制御異常が一連の制御異常を引き起こし、細胞周期停止を引き起こすことが報告されている

Tengkun et al, 6030>

Author Contributions

Research Topic assembly and editing and this editorialに、著者全員が等しく貢献した。

資金

ISは、インド科学技術省からの助成金(DST/INT/POL/P-36/2016)の支援を受けた。

利益相反

著者は、本研究が潜在的利益相反として解釈できるいかなる商業または金融関係もない状態で行われたと宣言している。

コメントを残す

メールアドレスが公開されることはありません。