shRNAベクターの効果的な設計・構築・遺伝子ノックダウンの基準

shRNAプラスミドの設計・調製

shRNA配列とノックダウン効果の相関という疑問に取り組むため、11種類の遺伝子から27種類のshRNAベクターを設計・構築しました (表1). ターゲット配列は各遺伝子のコーディング領域から選択され、siRNAオリゴマーの効果に関する配列の特徴に関する精巧な研究に広く準拠するように設計された。 したがって、配列は低ランで、G/C比が約50%である。 このshRNAは、一塩基多型がない部位を標的とするように設計され、我々のリアルタイムPCRプライマーセットによって増幅されたすべてのスプライスバリアントに対応する。

Table 1 ShRNAベクター本研究で作成した

siRNAが標的外効果を持つことができるので、標的認識部位内に一つ以上の塩基ミスマッチがある特定の変異体をコントロールとして作ることが機能試験には重要である . 時間とコストを節約するために、野生型と変異型のshRNAベクターを同時に作る方法を開発した(方法と図1に詳細)。 4組の野生型/変異型shRNAの遺伝子ノックダウン結果を図2に示す。 これらの結果は、野生型shRNAによる遺伝子ノックダウンに対する機能喪失コントロールとして機能する点変異型shRNAベクターを提供する本方法の有用性を示している。 これまでにもshRNAベクターの構築に関する詳細なプロトコルは発表されているが、野生型と変異型ベクターを同時に作製するプロトコルは今回が初めてであり、shRNAの高度制御システムの実現が容易になると期待される。 野生型ヘアピンの順鎖(青色)は、標的配列のセンスおよびアンチセンスの両方のコピー内に1 bpの変異を含む逆鎖(赤色で示す)と共に合成される。 この二本鎖ハイブリッドは、H1プロモーターの5’にあるレトロウイルスベクターにライゲーションされ、コンピテントなバクテリアに形質転換される。 複製は半保存的であるため、娘菌は二本鎖野生型または二本鎖変異型ベクターを持つ2つの異なる集団となり、個々のコロニーを調製し配列を決定することにより単離することができる。

Figure 2
figure 2

野生型/変異型二本鎖ハイブリッドを使って同時に作製した野生型および変異型shRNAベクターの遺伝子発現解析。 (A)図1に詳述したように同時に調製した4つの野生型および変異型shRNAベクターの標的部位の塩基配列。 (B) shRNAによるノックダウン、および(A)の変異型shRNAベクターによるノックダウンの消失のリアルタイム解析。 値は、非導入THP1細胞における100%に標準化されている。 空ベクター(EV)で形質転換したTHP1細胞における発現を、追加の対照として示す。 値は、二重に実施した少なくとも3つのアッセイの平均+SEMを表す。

ヘアピン構造による正確な配列決定のための戦略

標的配列内の1塩基でもミスマッチするとノックダウンが無効となるので、shRNAヘアピンの配列を確かめることは不可欠である(図2および.shRNAベクターの作製でよく問題になるのは、ヘアピンの二次構造により配列決定が困難なものが多いことである。 この問題を克服するために最近提案された戦略の一つは、ヘアピンのループ/ステム領域内に制限部位を作り、消化によって逆方向の繰り返しを物理的に分離し、センスおよびアンチセンスプライマーを用いて配列を繋ぎ合わせるというものである 。 しかし、ステム/ループの配列を変更することなくshRNAコンストラクトの配列決定を行うことができれば、そのメリットは明らかである。 この可能性に取り組むため、3つのshRNAヘアピンのヘアピン二次構造のリードスルーを改善するために、改良したシークエンス反応を評価した。 DMSO、ベタイン、PCRx Enhancer、ThermoFidelase Iなど、DNA構造を緩和することが知られている薬剤の添加、およびdGTPではなくdITPを含む標準BigDye v1.1 (BD) 化学物質への増量のdGTP BigDye terminator (dGTP) 化学物質の添加などの修正も含まれています

3つのDNA構築物のそれぞれのシーケンス結果は表2に要約されています。 ヘアピン構造のリードスルーは、ヘアピン構造から約300塩基後のピークの高さとヘアピン構造から約50塩基前のシグナルの比として測定された。 比率が1であればシグナルの損失はなく、0であればリードスルーが完全に失われたことを示す。 BDケミストリーに添加物を入れない場合、ヘアピンによって、私たちのあまり密でないヘアピン、pHSPG-shmutTLR4ではピーク高さの比が0.4に低下し、他の2つのプラスミドではリードスルーが完全に失われた。 これは、pHSPG-shTLR4の配列ピークプロファイルの突然の停止として可視化できる(図3A)。

Table 2 3つのDNAヘアピン構築物の配列決定結果の評価。 ヘアピン領域の前と後のピーク高さの平均比を、配列がヘアピン構造をどれだけ読み切れたかを示す指標として決定した。 ピーク高さの比が大きいほど、ヘアピンを通して配列決定する能力が高いことを意味する。 1の値は、ピーク高さの損失がないことを示し、0の値は、ヘアピン領域の後で配列が完全に停止していることを示す。 すべての値は、少なくとも3回の配列決定反応の平均値である。
Figure 3
figure3

修正した反応条件を用いたpHSPG-shTLR4 のDNA配列決定。 DNA配列決定ピークは、各パネルの番号の行で塩基位置を示し、Y軸は信号強度を示すフルスケール表示で示される。 BigDye v1.1 (BD) chemistry (A), 0.83 M Betaine + 1 ×PCRx Enhancer in BD chemistry (B), 10:1 BD:dGTP chemistries (C), 0.83 M Betaine + 1 ×PCRx Enhancer in 10:1 BD:dGTP chemistries (D) and 1 × ThermoFidelase I in 10:1 BD:dGTP chemistries (E) シークエンス反応条件は、BDのケミストリーを示す(A)、 0.83 M Betaineと1 ×PCRx Enhancer in BD chemistry(B)の場合。

DNA緩和剤のうち、5% DMSO, 0.83 M Betaine, 1 × PCRx Enhancerはそれぞれいくつかの構築物で配列読み取りを著しく向上させた。 しかし、BDケミストリーに0.83 M Betaineと1 × PCRx Enhancerを加えたものは、ピーク高さの比率が0.5-0.9と、最も安定した配列となった(表2、図3B)。 10:1 BD:dGTP ケミストリーの添加だけでも、ピークハイトレシオが0.5-0.6となり、リードスルーが多少向上しました(表2および図3C)。 10:1 BD:dGTP のピーク高さ比が最適でないのは、シグナルが減少する二次構造領域の後に、配列ピークプロファイルに目に見えるステップがあるためと考えられます(図 3C、矢印)。 dGTP 化学的含量を 5:1 および 3:1 BD:dGTP に増やすか、またはストレート dGTP 化学的含量を使用すると、ピーク高さの比率が上がり、ステップが多少減少しました (0.6 から 0.8 比)。 しかし、dITPとdGTPの混合導入では、dGTPの使用量が増えるにつれてピーク幅が悪化し、dGTPのみのケミストリーでは配列が著しく圧縮された(データは示していない)。 Betaine plus PCRx と 10:1 BD:dGTP の混合ケミストリーを併用することで、全体として最良の結果が得られた。 この組み合わせでは、ピークの幅が広がることなくステップが減少し、ピーク高さの比率が0.9~1.0に増加しました(表2および図3D)。 ゲノムDNAの配列決定を改善するために頻繁に使用されるDNA不安定化酵素であるサーモフィデラーゼIは、ストレートBDケミストリーでは3つのヘアピンの配列決定を改善せず(データは示されていない)、実際には3つのshRNA構築物すべてについて10:1 BD:dGTPケミストリーでピーク高さの比率が著しく減少し、ヘアピン構造での停止が再表示された(表2および図3E)。

要約すると、10:1 BD:GTP化学物質、0.83 Mベタイン、および1 × PCRx Enhancerの組み合わせは最適な配列決定をもたらし、混合BD:dGTP化学物質、ベタイン、PCRx EnhancerおよびDMSOはそれぞれ単独で何らかのプラスの効果を発揮した。

Correlation between shRNA knockdown efficiency and published algorithms for siRNA design

ShRNA ベクターによるノックダウンの有効性が、有効な siRNA オリゴヌクレオチドの設計に関する公表されたルールと相関しているかどうかを調べるために、shRNA の遺伝子発現ノックダウン能力について評価した。 表3、最初の2列で詳述したように、shRNAをTHP1またはJurkatヒト細胞株のいずれかに安定的に形質導入した。 平均ノックダウンは、3日以上の異なる日に収集したRNAから決定され、各shRNAについて記載されている(Column 3)。 ノックダウンは、独立して形質導入され、選別された細胞株について再現性があることが示され、ノックダウンがウイルス導入の特徴ではなく、shRNA標的配列の機能であることが示唆された。 これらの細胞株では、成長速度が同等で、GFPマーカーが高レベルで長期間発現しているにもかかわらず、構築したshRNAベクターの1/3以上が転写を抑制できなかった(コラム3で<8759>10%)。 さらに、多くの同じ遺伝子(すなわち、CLR16.2、CLR19.3およびTLR4)に対して作られたいくつかのshRNAのノックダウン効果の大きな変動は、これらの遺伝子に対する効果の違いに関するいかなる単純な生物学的理由も否定する。 効果のないshRNAの多くは、負の5’ΔΔG値と高いレイノルズスコアを持っており、これらはそれぞれsiRNAノックダウン効果と相関があると仮定されている(表3、コラム4と5) 。 逆に、遺伝子ノックダウンが可能なshRNAのうち、いくつかのshRNAは5’ΔΔG値が陽性、またはReynolds scoreが低いことがわかった。 これらの知見は、siRNAの5’ΔΔGとレイノルズスコアリングアルゴリズムは、shRNAの設計に正の相関基準を提供しない可能性があることを示す。 平均ノックダウンは、三重サンプルのリアルタイムPCRによって測定されました。 すべての平均は10%SEM以内の精度である。 アスタリスクは、対応するノックダウン効果が低い高崎らアルゴリズムの高いスコアを示す。

siRNAオリゴヌクレオチド設計の他の公開アルゴリズムがshRNAベクターに適用可能かどうかを判断するために、shRNA標的部位それぞれを、追加の4アルゴリズムで評価して、スコアを各shRNAのノックダウン率に対してプロットした(表3、列6-9、および図4)。 各アルゴリズムのプロットに対して最適な直線を引き、R2値を算出し、ノックダウン効果の分散がアルゴリズムのスコアリングで説明できるかどうかの指標とした。 結果は、shRNA の有効性と 5′ ΔΔG (自由エネルギー差) の考慮または Reynolds らのアルゴリズムのいずれとも関連性が低いことを確認し、また Hsieh らのアルゴリズムとの関連性が低いことを示し、それぞれが実際にはデータとの弱い逆相関を示している。 Amarguizoui ら、Ui-Tei ら、および Takasaki ら のアルゴリズムは、shRNA の効能と直接相関しています。 しかし、いずれのアルゴリズムも、ノックダウン効果の分散を有意に説明するものではなかった。 テストしたアルゴリズムの中で、Takasakiらのスコアリングシステムは、0.0251のR2値で、最も高い関連を示す。

Figure 4
figure 4

shRNAノックダウン効力と、siRNAの6公開アルゴリズムに関するスコアの相関性。 表2からの各shRNA標的部位に対するアルゴリズムスコアは、Hsiehら(A)、5’ΔΔG(自由エネルギー差)(B)、Reynoldsら(C)、Amarzguiouiら(D)、Ui-Teiら(E)及びTakasakiら(F)アルゴリズムに対する観察したノックダウン効率に対してプロットされる。 5’ΔΔGスコアは、ノックダウン効果が負の5’ΔΔG値と相関することが予測されるため、逆の横軸にプロットされている。 各プロットのR2値とともに傾向線が示されている。 10%未満のノックダウンはゼロとしてプロットされる。

これらの結果は、線形関係が、6つのアルゴリズムのいずれについてもshRNAノックダウンに強く当てはまらないことを示唆するので、我々は、ROC曲線分析によってアルゴリズムのそれぞれを評価して、いずれかのアルゴリズムが有効なshRNAを識別するのに他より優れているかどうかを判断した。 ROC 曲線は、感度(真陽性率、TPF)対 1 から特異度(偽陽性率、 FPF)をプロットしたもので、アルゴリズムの最小スコアと最大スコア の間で判定閾値を変化させて生成されるものである。 ROCプロットの対角線は,ランダム選択よりも識別力が劣るアルゴリズムに対するROC曲線を表している. 識別能力の低いアルゴリズムは,ROC曲線が対角線に沿って追跡し,ROC曲線下面積(AUC)が対角線のAUC(0.5)と有意な差がないものである. Hsiehらのアルゴリズムは、有効なshRNAと効果のないshRNAの識別において、許容できない感度と特異性を示す凹状のROC曲線(図5A)を有していた。 他のすべてのアルゴリズムのROC曲線(図5B~F)は、ROCプロットの対角線付近に追従し、対角線のAUCと有意差のないAUCを有していた(図5B~F)。 したがって、いずれのアルゴリズムも、有効なshRNAと効果のないshRNAとを識別する統計的に有意な能力を示さなかった。

Figure 5
figure 5

siRNA scoringアルゴリズムのROC曲線分析。 Hsiehら(A)、5’ΔΔG(自由エネルギー差)(B)、Reynoldsら(C)、Amarzguiouiら(D)、Ui-Teiら(E)及び高崎ら(F)アルゴリズムについて、50%ノックダウンの効力閾値を用い、決定閾値を最小から最大スコアまで変化させて(詳細は材料及び方法参照)真陽性割合を偽陽性割合と比較プロットしている。 Amarzguiouiら(G)、Ui-Teiら(H)、Takasakiら(I)アルゴリズムを修正したROC曲線も示している。 38の公表されたshRNAのセット(表5)は、修正されたアルゴリズムの有用性を確認するために、修正されたAmarzguiouiら(J)、Ui-Teiら(K)及び高崎ら(L)アルゴリズムを用いて分析された。 各ROC曲線について、曲線下面積(AUC)とAUCが対角下面積である0.5から有意に異なる確率(p)を示す。

高崎らのアルゴリズム(図5F)は、有効なshRNAと効果のないshRNAの識別器として最も有望であることがわかった。 しかしながら、このアルゴリズムは、ROC曲線の原点付近の対角線からの弱く不規則な偏差によって示されるように、最大スコア付近の決定閾値に対して比較的高い偽陽性率に悩まされていた(図5F)。 これは、アルゴリズムが多くの効果のないshRNAに高いスコアを割り当てていることを示した。 データを調査したところ、高得点を得た3つの効果のないshRNAのうち2つは、他のshRNAで発現がうまくノックダウンされた遺伝子を標的としていたことが明らかになった(表3、アスタリスク)。 したがって、shRNAが効かないのは、遺伝子発現の安定的な抑制に対する選択圧の結果であるとは考えにくい。 高崎らのアルゴリズムが、有効なshRNAの重要な特徴を考慮していない可能性が高い。

各shRNAの中央6塩基の安定性に基づくアルゴリズム修正の適用

高得点の有効でないshRNAの物性を調べたところ、shRNAの中央6塩基によって形成される二重鎖(アンチセンス鎖の塩基9〜14にハイブリッドするセンス鎖6〜11)の平均安定性が高得点の有効shRNA(ΔG = -13.)の平均安定性を上回っことが判明した。1 ± 0.1 対 -11.1 ± 1 kcal/mol)。 この観察に基づいて、中心二重鎖ΔGが-12.9 kcal/molに等しいかそれ以下であるshRNAに最小スコアを割り当てるように、高崎らのアルゴリズムを修正した(表4)。 この修正により、5つのshRNAに最小スコアが割り当てられ、そのうち4つは効果がなかったため、感度を大きく損なうことなくアルゴリズムの特異性を高めることができた。 1つの有効なshRNA(71%ノックダウン)に最小スコアが割り当てられたことは、中心二重鎖の安定性に加えて、他の特性が有効性に影響を与えることを示しています。 それでも、この改良を加えることで、高い判定閾値に対するROC曲線の対角線からの弱い不規則な偏差がなくなり、AUCが0.79に増加しました(Fig. 5I)。 AmarzguiouiらとUi-Teiらのアルゴリズムにも同様の修正が施され、ROC曲線のAUCが上昇した(Fig.5Gと5H)。 この修正により、3つの修正されたアルゴリズムのROC曲線のAUCは、対角線のAUCと有意に異なり(Fig.5G-I)、統計的に有意な予測能力を示すようになった。 修正アルゴリズムに対するROC曲線のAUC間の差は有意ではなかったので、統計的根拠に基づいて、3つの修正アルゴリズムのすべてが等しい有用性を有していた。 5′ ΔΔG、Reynoldsら、およびHsiehらのアルゴリズムは、中心二重のΔG修正を適用することによって、統計的に有意な予測能力に改善されなかった(データは示されていない)。

Table 4 shRNA中心二重鎖ΔGに基づくアルゴリズムスコアの修正。 ノックダウン率データは、表3に示すように平均ノックダウンを表す。中心ΔGが-12.9 kcal/molと同じかそれ以下のshRNAには下線が引かれる。 これらは、アルゴリズムの修正により、最小スコアを割り当てた。 最小スコアは Amarzguiouiらアルゴリズム、-4;Ui-Teiらアルゴリズム、-2;Takasakiらアルゴリズム、-13.26。 元のTakasakiらのアルゴリズムで高得点を得たが、ノックダウン効果が低い3つのshRNAにはアスタリスクが付けられている。 修正により、これらのshRNAのスコアが最小化され、その結果、アルゴリズムの特異性が増加した。

Amarzguiouiら、Ui-Teiら、およびTakasakiらのアルゴリズムの修正により達成した改善が、我々のshRNAのセットを過剰適合させた結果であるという可能性に取り組むために、以前の出版物からプールした38個のshRNAの独立したセット(;表5)が分析に供された。 3つの非修正アルゴリズムのROC曲線はいずれも対角線のAUCと有意に異なっていなかったが(Amarzguiouiら、p = 0.174; Ui-Teiら、p = 0.09; Takasakiら、p = 0.26) 、すべての修正アルゴリズムは、対角線のAUCと有意に異なるAUCのROC曲線を得た(p = 0.0001-0.009; 図5J-L)。 統計学的根拠では、修正アルゴリズムのROC曲線のAUCはすべて対角線のAUCと有意に異なるが、互いに有意な差はないため、3つの修正アルゴリズムはすべて同等の有用性を持っていた。 独立したshRNAのセットのこの分析は、アルゴリズムの修正が一般的に有効であることを示唆している。

Table 5 この研究で分析した既出のshRNA配列

偽陽性率の最小化はshRNAデザインにおける最大の関心事であるので、我々は修正Ui-Teiら(1)を用いることを推奨する。 アルゴリズムは、ROC曲線の原点付近の対角線からの強い偏差によって示されるように、最大スコアに近い決定閾値において最も低い高偽陽性率を有した(図5H及び5K)。 3 の決定しきい値を使用すると、感度が許容範囲(0.28~0.33)であり、特異性が非常に良好(1.0)である ROC 曲線の領域に shRNA の選択が制限されます。 この決定閾値を設定することで、偽陽性率を最小化し、有効なshRNAの28~33%が、我々のshRNAと公開されたshRNAのセットからそれぞれ同定されました。 感度を上げる必要がある場合は、判定閾値を 2 にすることを推奨します。この閾値の感度は 0.54 – 0.55 で、特異度は 0.88 – 0.9 でした。 判定閾値をさらに0に緩和した場合、感度は0.86 – 0.9に上昇するが、特異度は0.55 – 0.54に低下する。 3235>

統計的には小規模ではありますが、この研究は、現在までに発表された19-merベースのshRNAのセットとしては最大であるという我々の知る限りの利点を有しています。 さらに、有効なshRNAに必然的に偏っている他のshRNA研究とは異なり、本研究では、機能的および非機能的なshRNAの両方を含んでいます。 Ui-Teiら、Amarzguiouiら、Takasakiらのアルゴリズムを修正したものは、有効なshRNAとそうでないものを区別する、まあまあ良い予測ツールであることが示されました。 しかし、修正されたアルゴリズムにはまだ大きな欠点が存在します。 各オリジナルおよび修正アルゴリズムに従って設計されたshRNAを使用して、アルゴリズムの修正を直接評価すれば、これらの発見を裏付けることになるでしょう。 これらのアルゴリズムは、選択された偽陽性shRNAの数を減らすことを目的としており、完全に排除するわけではありません。したがって、偽陽性率に統計的に有意な差を得るためには、多数のshRNAが必要となります。 より大規模なshRNAデータセットが利用可能になれば、感度と特異性が改善されたアルゴリズムの開発がサポートされるはずです。 さらに、この研究では検討されなかったが、siRNAオリゴヌクレオチド設計のためのいくつかのソフトウェアアプリケーションは、shRNAの設計に使用できるかもしれません。 機能的なsiRNAオリゴヌクレオチドを設計するための基準は、siRNA設計のためにまだ考案されている多くの研究によって証明されているように、依然として論争の的となっており、我々はこれらの配列をsiRNAとしてテストしなかったので、これらのアルゴリズムの修正がsiRNAオリゴヌクレオチドの文脈でも適用できるかどうかは確立できません。shRNAには、ヘアピンがRISC複合体に入る前に細胞内で処理する必要があるのでsiRNAオリゴヌクレオチドの複雑さが一層加わっているのです。 さらに、細胞増殖に有害なshRNAの安定発現に対する選択圧が、特定のshRNAの安定発現にさらなる制約を与えることも予想されます。 これらの複雑な問題にもかかわらず、私たちの発見は、機能的なshRNAの設計にsiRNAアルゴリズムを適用する能力についての洞察をもたらし始めています。

コメントを残す

メールアドレスが公開されることはありません。