Kriterien für effektives Design, Konstruktion und Gen-Knockdown durch shRNA-Vektoren

Design und Vorbereitung von shRNA-Plasmiden

Um der Frage nachzugehen, wie die shRNA-Sequenz mit der Knockdown-Wirksamkeit korreliert, wurden 27 shRNA-Vektoren aus 11 verschiedenen Genen entworfen und konstruiert (Tabelle 1). Die Zielsequenzen wurden in der kodierenden Region jedes Gens ausgewählt und so konzipiert, dass sie weitgehend mit den grundlegenden Studien über Sequenzmerkmale für die Wirksamkeit von siRNA-Oligomeren übereinstimmen. Dementsprechend sind die Sequenzen niedrig und haben ein G/C-Verhältnis von etwa 50 %. Die shRNAs wurden so konzipiert, dass sie auf Stellen abzielen, die keine Einzelnukleotid-Polymorphismen aufweisen, und entsprechen allen Spleißvarianten, die von unseren Echtzeit-PCR-Primersätzen amplifiziert werden.

Tabelle 1 ShRNA-Vektoren, die für diese Studie vorbereitet wurden

Da siRNAs Off-Target-Effekte haben können, ist es für funktionelle Assays wichtig, eine spezifische Mutante mit einer oder mehreren Basenfehlanpassungen innerhalb der Zielerkennungsstelle als Kontrolle herzustellen. Um Zeit und Kosten zu sparen, haben wir eine Methode zur gleichzeitigen Herstellung von Wildtyp- und mutierten shRNA-Vektoren entwickelt (siehe Methoden und Abbildung 1). Die Ergebnisse des Gen-Knockdowns für vier Wildtyp/Mutant-shRNA-Paare sind in Abbildung 2 dargestellt. Diese Ergebnisse zeigen den Nutzen dieser Methode für die Bereitstellung eines punktmutierten shRNA-Vektors, der als Loss-of-Function-Kontrolle für den Genknockdown durch Wildtyp-shRNAs dienen kann. Obwohl detaillierte Protokolle für die Konstruktion von shRNA-Vektoren veröffentlicht wurden, ist dies das erste Protokoll für die gleichzeitige Herstellung von Wildtyp- und Mutanten-Vektoren und sollte die Implementierung eines hochgradig kontrollierten Systems für shRNA erleichtern.

Abbildung 1
Abbildung1

Design für die gleichzeitige Herstellung von Wildtyp- und Mutanten-shRNA-Vektoren. Ein Vorwärtsstrang der Wildtyp-Haarnadel (blau) wird zusammen mit einem Rückwärtsstrang synthetisiert, der eine 1 bp-Mutation sowohl in der Sense- als auch in der Antisense-Kopie der Zielsequenz (rot dargestellt) enthält. Das doppelsträngige Hybrid wird in den retroviralen Vektor 5′ eines H1-Promotors ligiert und in kompetente Bakterien transformiert. Da die Replikation semikonservativ ist, werden die Tochterbakterien aus zwei verschiedenen Populationen bestehen, die entweder einen doppelsträngigen Wildtyp- oder einen doppelsträngigen Mutantenvektor tragen und durch Präparation und Sequenzierung einzelner Kolonien isoliert werden können.

Abbildung 2
Abbildung2

Genexpressionsanalyse für Wildtyp- und mutierte shRNA-Vektoren, die gleichzeitig unter Verwendung von Wildtyp/Mutant-Doppelstrang-Hybriden hergestellt wurden. (A) Sequenzen der Zielorte für vier Wildtyp- und mutierte shRNA-Vektoren, die wie in Abbildung 1 beschrieben gleichzeitig hergestellt wurden. (B) Echtzeitanalyse des shRNA-Knockdowns und Verlust des Knockdowns durch mutierte shRNA-Vektoren aus (A). Die Werte sind auf 100 % in nicht-transduzierten THP1-Zellen standardisiert. Die Expression in THP1-Zellen, die mit einem leeren Vektor (EV) transduziert wurden, ist als zusätzliche Kontrolle dargestellt. Die Werte stellen den Durchschnitt +SEM für mindestens drei in zweifacher Ausführung durchgeführte Tests dar.

Strategie für die genaue Sequenzierung durch Haarnadelstrukturen

Die Überprüfung der Sequenz einer shRNA-Haarnadel ist von entscheidender Bedeutung, da eine Fehlanpassung von auch nur einem Nukleotid innerhalb der Zielsequenz den Knockdown zunichte machen kann (Abbildung 2 und .Ein Problem, auf das man bei der Herstellung von shRNA-Vektoren häufig stößt, ist die Tatsache, dass viele von ihnen aufgrund der intrinsischen Sekundärstruktur der Haarnadel schwer zu sequenzieren sind. Eine kürzlich vorgeschlagene Strategie zur Überwindung dieses Problems beinhaltet die Entwicklung einer Restriktionsstelle in der Schleifen-/Stammregion der Haarnadel, um die invertierten Wiederholungen durch Verdauung physisch zu trennen und dann die Sequenz mit Hilfe von Sense- und Antisense-Primern zusammenzusetzen. Die Möglichkeit, shRNA-Konstrukte zu sequenzieren, ohne die Stamm/Schleifen-Sequenz zu verändern, wäre jedoch von großem Vorteil. Um diese Möglichkeit anzugehen, haben wir modifizierte Sequenzierungsreaktionen zur Verbesserung des Durchlesens der Hairpin-Sekundärstruktur in drei shRNA-Hairpins untersucht. Zu den Modifikationen gehören die Zugabe von Wirkstoffen, von denen bekannt ist, dass sie die DNA-Struktur lockern, darunter DMSO, Betain, PCRx Enhancer und ThermoFidelase I, sowie die Zugabe zunehmender Mengen an dGTP BigDye-Terminator (dGTP)-Chemie zur Standard-BigDye v1.1 (BD)-Chemie, die eher dITP als dGTP enthält.

Die Sequenzierungsergebnisse für jedes der drei DNA-Konstrukte sind in Tabelle 2 zusammengefasst. Das Durchlesen der Haarnadelstruktur wurde als das Verhältnis der Peakhöhe etwa 300 Basen nach der Haarnadelstruktur zu dem Signal etwa 50 Basen vor der Haarnadelstruktur gemessen. Ein Verhältnis von 1 bedeutet keinen Verlust des Signals und 0 bedeutet einen vollständigen Verlust des Durchlesens. Ohne jeglichen Zusatz zur BD-Chemie verursachte die Haarnadel eine Verringerung des Peakhöhenverhältnisses für unsere weniger eng strukturierte Haarnadel, pHSPG-shmutTLR4, auf 0,4 und einen vollständigen Verlust des Durchlesens für die beiden anderen Plasmide. Dies lässt sich als abrupter Stopp im Sequenzpeakprofil für pHSPG-shTLR4 erkennen (Abbildung 3A).

Tabelle 2 Auswertung der Sequenzierergebnisse von drei DNA-Haarnadelkonstrukten. Das durchschnittliche Verhältnis der Peakhöhe nach und vor der Haarnadelregion wurde als Maß dafür bestimmt, wie gut die Sequenz durch die Haarnadelstruktur gelesen wurde. Je größer das Peakhöhenverhältnis ist, desto größer ist die Fähigkeit, durch die Haarnadel zu sequenzieren. Ein Wert von 1 bedeutet keinen Verlust an Peakhöhe, und ein Wert von Null bedeutet einen vollständigen Stopp der Sequenz nach der Haarnadelregion. Alle Werte sind Durchschnittswerte von mindestens drei Sequenzierungsreaktionen.
Abbildung 3
Abbildung3

DNA-Sequenzierung von pHSPG-shTLR4 unter modifizierten Reaktionsbedingungen. Die DNA-Sequenzierungspeaks sind in einer Gesamtansicht dargestellt, wobei die Basenpositionen durch die Zahlenreihe in jedem Feld und die Y-Achse durch die Signalintensität angegeben sind. Bei den gezeigten Sequenzierreaktionsbedingungen handelt es sich um BigDye v1.1 (BD)-Chemie (A), 0,83 M Betain + 1 ×PCRx Enhancer in BD-Chemie (B), 10:1 BD:dGTP-Chemie (C), 0,83 M Betaine + 1 ×PCRx Enhancer in 10:1 BD:dGTP-Chemie (D) und 1 × ThermoFidelase I in 10:1 BD:dGTP-Chemie (E). Der Signalabfall (Peakhöhenabfall) an der Haarnadel ist durch einen Pfeil in der 10:1 BD:dGTP-Chemie hervorgehoben.

Unter den DNA-Entspannungsmitteln verbesserten 5% DMSO, 0,83 M Betain und 1 × PCRx Enhancer die Sequenzlesung für einige Konstrukte erheblich. Die Zugabe von 0,83 M Betain plus 1 × PCRx Enhancer zur BD-Chemie führte jedoch zu einer konsistenten Sequenzierung mit Peakhöhenverhältnissen von 0,5-0,9 (Tabelle 2 und Abbildung 3B). Die Zugabe von 10:1 BD:dGTP-Chemikalien allein verbesserte das Read Through ebenfalls etwas, mit Peakhöhenverhältnissen von 0,5-0,6 (Tabelle 2 und Abbildung 3C). Das suboptimale Peakhöhenverhältnis für 10:1 BD:dGTP kann auf eine sichtbare Stufe im Sequenzpeakprofil nach der Sekundärstrukturregion zurückgeführt werden, in der das Signal reduziert ist (Abbildung 3C, Pfeil). Eine Erhöhung des dGTP-Gehalts auf 5:1 und 3:1 BD:dGTP oder die Verwendung reiner dGTP-Chemie erhöhte das Peakhöhenverhältnis und verringerte die Stufe etwas (Verhältnis 0,6 bis 0,8). Die gemischte Inkorporation von dITP und dGTP führte jedoch zu einer stärkeren Peakverbreiterung, je mehr dGTP verwendet wurde, und die reine dGTP-Chemie verursachte starke Sequenzkompressionen (Daten nicht gezeigt). Die besten Gesamtergebnisse wurden durch die Kombination von Betain plus PCRx und einer 10:1 BD:dGTP-Mischchemie erzielt. Diese Kombination reduzierte den Schritt mit weniger Peakverbreiterung und erhöhte das Peakhöhenverhältnis auf 0,9-1,0 (Tabelle 2 und Abbildung 3D). ThermoFidelase I, ein DNA-destabilisierendes Enzym, das häufig verwendet wird, um die Sequenzierung genomischer DNA zu verbessern, verbesserte die Sequenzierung von keinem der drei Hairpins in reiner BD-Chemie (Daten nicht gezeigt) und verringerte das Peakhöhenverhältnis in 10:1 BD:dGTP-Chemien für alle drei shRNA-Konstrukte erheblich, was das Wiederauftreten eines Stopps an der Hairpin-Struktur verursachte (Tabelle 2 und Abbildung 3E).

Zusammenfassend lässt sich sagen, dass die Kombination von 10:1 BD:GTP-Chemien, 0,83 M Betain und 1 × PCRx Enhancer eine optimale Sequenzierung ermöglichte, und dass gemischte BD:dGTP-Chemien, Betain, PCRx Enhancer und DMSO jeweils für sich genommen einige positive Auswirkungen hatten. ThermoFidelase I sollte jedoch wahrscheinlich für shRNA-Vektoren mit schwieriger intrinsischer Sekundärstruktur vermieden werden.

Korrelation zwischen shRNA-Knockdown-Effizienz und veröffentlichten Algorithmen für das siRNA-Design

Um festzustellen, ob die Wirksamkeit des Knockdowns durch shRNA-Vektoren mit veröffentlichten Regeln für das Design effektiver siRNA-Oligonukleotide korreliert, wurden shRNAs auf ihre Fähigkeit zum Knockdown der Genexpression untersucht. Die shRNAs wurden entweder in THP1- oder Jurkat-Zelllinien stabil transduziert, wie in Tabelle 3, erste zwei Spalten, angegeben. Der durchschnittliche Knockdown wurde anhand der an drei oder mehr verschiedenen Tagen gesammelten RNA bestimmt und ist für jede shRNA aufgeführt (Spalte 3). Es zeigte sich, dass der Knockdown bei Zelllinien, die unabhängig voneinander transduziert und sortiert wurden, reproduzierbar ist, was darauf hindeutet, dass der Knockdown eher von der shRNA-Zielsequenz als von Merkmalen der viralen Transduktion abhängig ist. Mehr als ein Drittel der konstruierten shRNA-Vektoren waren nicht in der Lage, die Transkription zu unterdrücken (<10 % in Spalte 3), trotz vergleichbarer Wachstumsraten und langfristiger Expression des GFP-Markers auf hohem Niveau in diesen Zelllinien. Darüber hinaus sprechen die großen Unterschiede in der Knockdown-Wirksamkeit mehrerer shRNAs, die gegen viele der gleichen Gene hergestellt wurden (z. B. CLR16.2, CLR19.3 und TLR4), gegen einfache biologische Gründe für die Unterschiede in der Wirksamkeit dieser Gene. Viele der unwirksamen shRNAs haben negative 5′-ΔΔG-Werte und hohe Reynolds-Werte, von denen angenommen wurde, dass sie mit der Wirksamkeit von siRNA-Knockdowns korrelieren (Tabelle 3, Spalten 4 und 5). Umgekehrt hatten einige der shRNAs, die in der Lage waren, einen Gen-Knockdown zu bewirken, entweder positive 5’ΔΔG-Werte oder niedrige Reynolds-Scores. Diese Ergebnisse deuten darauf hin, dass der 5’ΔΔG- und der Reynolds-Scoring-Algorithmus für siRNA möglicherweise keine positiven korrelativen Kriterien für das shRNA-Design liefern.

Tabelle 3 Vergleich der Knockdown-Wirksamkeit und des siRNA-Design-Algorithmus. Der durchschnittliche Knockdown wurde durch Echtzeit-PCR von dreifachen Proben gemessen. Alle Durchschnittswerte sind innerhalb von 10 % SEM genau. Sternchen zeigen an, dass der Algorithmus von Takasaki et al. eine hohe Punktzahl erreicht hat und die entsprechende Knockdown-Wirksamkeit gering ist.

Um festzustellen, ob andere veröffentlichte Algorithmen für das Design von siRNA-Oligonukleotiden auf shRNA-Vektoren angewendet werden können, wurde jede der shRNA-Zielstellen von vier weiteren Algorithmen bewertet, und die Punktzahlen wurden gegen den prozentualen Knockdown für jede shRNA aufgetragen (Tabelle 3, Spalten 6-9 und Abb. 4). Für jeden Algorithmus wurde eine Best-Fit-Linie gezeichnet und der R2-Wert berechnet, um festzustellen, ob die Varianz in der Knockdown-Wirksamkeit durch die Algorithmus-Bewertung erklärt werden kann. Die Ergebnisse bestätigen einen schwachen Zusammenhang zwischen der shRNA-Wirksamkeit und den Überlegungen zu 5′ ΔΔG (freie Energie-Differenz) oder dem Algorithmus von Reynolds et al. und zeigen auch einen schwachen Zusammenhang mit dem Algorithmus von Hsieh et al. auf, wobei beide eine schwache umgekehrte Korrelation mit den Daten aufweisen. Die Algorithmen von Amarguizoui et al. , Ui-Tei et al. und Takasaki et al. korrelieren direkt mit der shRNA-Wirksamkeit. Allerdings erklärt keiner der Algorithmen einen signifikanten Prozentsatz der Varianz in der Knockdown-Wirksamkeit. Unter den getesteten Algorithmen zeigt das Scoring-System von Takasaki et al. mit einem R2-Wert von 0,0251 den höchsten Zusammenhang.

Abbildung 4
Abbildung 4

Korrelation zwischen shRNA-Knockdown-Wirksamkeit und Scoring für sechs veröffentlichte Algorithmen für siRNA. Die Algorithmus-Scores für jede shRNA-Zielstelle aus Tabelle 2 sind gegen die beobachtete Knockdown-Effizienz für die Algorithmen von Hsieh et al. (A), 5′ ΔΔG (freie Energie-Differenz) (B), Reynolds et al. (C), Amarzguioui et al. (D), Ui-Tei et al. (E) und Takasaki et al. (F) aufgetragen. Der 5′-ΔΔG-Wert ist auf einer umgekehrten horizontalen Achse aufgetragen, da die Knockdown-Wirksamkeit mit einem negativen 5′-ΔΔG-Wert korreliert. Eine Trendlinie wird zusammen mit dem R2-Wert für jedes Diagramm angezeigt. Ein Knockdown von weniger als 10 % wird als Null dargestellt.

Da diese Ergebnisse darauf hindeuten, dass für keinen der sechs Algorithmen eine lineare Beziehung zum shRNA-Knockdown besteht, haben wir jeden der Algorithmen anhand einer ROC-Kurvenanalyse bewertet, um festzustellen, ob ein Algorithmus den anderen bei der Identifizierung wirksamer shRNAs überlegen ist. Die ROC-Kurve ist ein Diagramm der Sensitivität (der wahr-positive Anteil, TPF) gegen 1 minus der Spezifität (der falsch-positive Anteil, FPF), das durch Variation der Entscheidungsschwelle zwischen dem minimalen und dem maximalen Algorithmus-Score erstellt wird. Die Diagonale des ROC-Diagramms stellt die ROC-Kurve für einen Algorithmus dar, der bei der Unterscheidung nicht besser ist als die Zufallsauswahl. Algorithmen, die schlechte Diskriminatoren sind, haben ROC-Kurven, die entlang der Diagonale verlaufen und eine Fläche unter der ROC-Kurve (AUC) haben, die sich nicht signifikant von der AUC der Diagonale (0,5) unterscheidet. Algorithmen, die gute Unterscheidungsmerkmale aufweisen, haben ROC-Kurven mit einer starken konvexen Abweichung von der Diagonalen und AUCs, die sich 1 nähern und sich signifikant von der AUC der Diagonalen unterscheiden.

Der Algorithmus von Hsieh et al. hatte eine konkave ROC-Kurve (Abb. 5A), was auf eine inakzeptable Sensitivität und Spezifität bei der Unterscheidung von effektiven von ineffektiven shRNAs hinweist. Die ROC-Kurven für alle anderen Algorithmen (Abb. 5B-F) verliefen in der Nähe der Diagonale des ROC-Plots und hatten AUCs, die sich nicht signifikant von der AUC der Diagonale unterschieden (Abb. 5B-F). Somit zeigte keiner der Algorithmen eine statistisch signifikante Fähigkeit zur Unterscheidung zwischen effektiven und ineffektiven shRNAs.

Abbildung 5
Abbildung5

ROC-Kurvenanalyse der siRNA-Scoring-Algorithmen. Für die Algorithmen von Hsieh et al. (A), 5′ ΔΔG (Freie-Energie-Differential) (B), Reynolds et al. (C), Amarzguioui et al. (D), Ui-Tei et al. (E) und Takasaki et al. (F) wurde der Anteil der wahr-positiven Ergebnisse gegen den Anteil der falsch-positiven Ergebnisse aufgetragen, während der Entscheidungsschwellenwert von der minimalen bis zur maximalen Punktzahl variiert wurde (Einzelheiten siehe Material und Methoden), wobei eine Wirksamkeitsschwelle von 50 % Knockdown verwendet wurde. ROC-Kurven für modifizierte Algorithmen von Amarzguioui et al. (G), Ui-Tei et al. (H) und Takasaki et al. (I) sind ebenfalls dargestellt. Ein Satz von 38 veröffentlichten shRNAs (Tabelle 5) wurde mit den modifizierten Algorithmen von Amarzguioui et al. (J), Ui-Tei et al. (K) und Takasaki et al. (L) analysiert, um den Nutzen der modifizierten Algorithmen zu bestätigen. Die Fläche unter der Kurve (AUC) und die Wahrscheinlichkeit (p), dass die AUC signifikant von 0,5 abweicht, die Fläche unter der Diagonale, ist für jede ROC-Kurve angegeben.

Der Algorithmus von Takasaki et al. (Abb. 5F) war am vielversprechendsten als Unterscheidungsmerkmal zwischen wirksamen und unwirksamen shRNAs. Allerdings litt dieser Algorithmus unter einem relativ hohen Falsch-Positiv-Anteil für Entscheidungsschwellen in der Nähe der maximalen Punktzahl, wie die schwache, unregelmäßige Abweichung von der Diagonale in der Nähe des Ursprungs der ROC-Kurve zeigt (Abb. 5F). Dies deutet darauf hin, dass der Algorithmus einer Reihe von unwirksamen shRNAs eine hohe Punktzahl zugewiesen hat. Eine Überprüfung der Daten ergab, dass zwei der drei unwirksamen shRNAs mit hoher Punktzahl auf Gene abzielten, deren Expression durch andere shRNAs erfolgreich unterdrückt wurde (Tabelle 3, Sternchen). Es ist daher unwahrscheinlich, dass die Unwirksamkeit der shRNAs eine Folge des Selektionsdrucks gegen die stabile Unterdrückung der Genexpression ist. Es ist wahrscheinlicher, dass der Algorithmus von Takasaki et al. ein entscheidendes Merkmal effektiver shRNAs nicht berücksichtigt.

Anwendung einer Algorithmusmodifikation auf der Grundlage der Stabilität der 6 zentralen Basen jeder shRNA

Die Untersuchung der physikalischen Eigenschaften der hoch bewerteten ineffektiven shRNAs ergab, dass die durchschnittliche Stabilität des von den 6 zentralen Basen der shRNAs gebildeten Duplex (Basen 6-11 des Sense-Strangs hybridisiert mit Basen 9-14 des Antisense-Strangs) größer war als die durchschnittliche Stabilität der hoch bewerteten effektiven shRNAs (ΔG = -13.1 ± 0,1 gegenüber -11,1 ± 1 kcal/mol). Auf der Grundlage dieser Beobachtung wurde der Algorithmus von Takasaki et al. dahingehend modifiziert, dass shRNAs mit einem zentralen Duplex-ΔG gleich oder weniger als -12,9 kcal/mol eine Mindestpunktzahl zugewiesen wurde (Tabelle 4). Durch diese Änderung wurden fünf shRNAs Mindestpunktzahlen zugewiesen, von denen vier unwirksam waren, wodurch die Spezifität des Algorithmus ohne signifikanten Verlust an Sensitivität erhöht wurde. Eine Mindestpunktzahl, die einer wirksamen shRNA (71 % Knockdown) zugewiesen wurde, deutet darauf hin, dass neben der zentralen Duplexstabilität auch andere Eigenschaften die Wirksamkeit beeinflussen. Nichtsdestotrotz wurde durch diese Modifikation die schwache erratische Abweichung der ROC-Kurve von der Diagonalen für hohe Entscheidungsschwellen beseitigt und die AUC auf 0,79 erhöht (Abb. 5I). Eine ähnliche Modifikation der Algorithmen von Amarzguioui et al. und Ui-Tei et al. erhöhte ebenfalls die AUCs ihrer ROC-Kurven (Abb. 5G und 5H). Mit dieser Modifikation unterschieden sich die AUCs der ROC-Kurven für alle drei modifizierten Algorithmen signifikant von der AUC der Diagonalen (Abb. 5G-I), was auf eine statistisch signifikante Vorhersagefähigkeit hinweist. Die Unterschiede zwischen den AUCs der ROC-Kurven für die modifizierten Algorithmen waren nicht signifikant, so dass aus statistischen Gründen alle drei modifizierten Algorithmen von gleichem Nutzen waren. Der 5′-ΔΔG-Algorithmus, der Algorithmus von Reynolds et al. und der Algorithmus von Hsieh et al. wurden durch die Anwendung der zentralen Duplex-ΔG-Modifikation nicht auf eine statistisch signifikante Vorhersagefähigkeit verbessert (Daten nicht gezeigt).

Tabelle 4 Modifikation der Algorithmus-Scores auf der Grundlage des zentralen Duplex-ΔG der shRNA. Die prozentualen Knockdown-Daten stellen den durchschnittlichen Knockdown gemäß Tabelle 3 dar. shRNAs mit einem zentralen ΔG gleich oder kleiner als -12,9 kcal/mol sind unterstrichen. Diesen wurde gemäß der Algorithmusänderung eine Mindestpunktzahl zugewiesen. Mindestpunktzahlen sind: Algorithmus von Amarzguioui et al., -4; Algorithmus von Ui-Tei et al., -2; Algorithmus von Takasaki et al., -13,26. Die drei shRNAs, die im ursprünglichen Algorithmus von Takasaki et al. eine hohe Punktzahl erreichten, aber eine geringe Knockdown-Wirksamkeit aufwiesen, sind mit Sternchen markiert. Durch die Modifikation wurde die Punktzahl für diese shRNAs minimiert, wodurch die Spezifität des Algorithmus erhöht wurde.

Um die Möglichkeit auszuschließen, dass die durch die Modifikation der Algorithmen von Amarzguioui et al., Ui-Tei et al. und Takasaki et al. erzielte Verbesserung eine Folge der Überanpassung unseres Satzes von shRNAs ist, wurde ein unabhängiger Satz von 38 shRNAs aus früheren Veröffentlichungen (; Tabelle 5) einer Analyse unterzogen. Während keine der ROC-Kurven für die drei nicht modifizierten Algorithmen eine AUC aufwies, die sich signifikant von der der Diagonalen unterschied (Amarzguioui et al., p = 0,174; Ui-Tei et al. p = 0,09; Takasaki et al., p = 0,26), ergaben alle modifizierten Algorithmen ROC-Kurven mit AUCs, die sich signifikant von der AUC der Diagonalen unterschieden (p = 0,0001-0,009; Abb. 5J-L). Statistisch gesehen waren alle drei modifizierten Algorithmen von gleichem Nutzen, da sich die AUCs der ROC-Kurven für die modifizierten Algorithmen alle signifikant von der AUC der Diagonale unterschieden, jedoch nicht signifikant voneinander. Diese Analyse eines unabhängigen Satzes von shRNAs deutet darauf hin, dass die Modifikation der Algorithmen von allgemeiner Gültigkeit ist.

Tabelle 5 Zuvor veröffentlichte shRNA-Sequenzen, die in dieser Studie analysiert wurden

Da die Minimierung der Falsch-Positiv-Rate das Hauptanliegen beim shRNA-Design ist, empfehlen wir die Verwendung des modifizierten Ui-Tei et al. Algorithmus zu verwenden, der die geringste Falsch-Positiv-Rate bei Entscheidungsschwellen in der Nähe der maximalen Punktzahl aufweist, wie die starke Abweichung von der Diagonale in der Nähe des Ursprungs der ROC-Kurve zeigt (Abb. 5H und 5K). Die Verwendung einer Entscheidungsschwelle von 3 begrenzt die Auswahl der shRNAs auf einen Bereich der ROC-Kurve, in dem die Sensitivität akzeptabel war (0,28-.33), während die Spezifität sehr gut war (1,0). Durch die Festlegung dieser Entscheidungsschwelle wurde der Anteil der Falsch-Positiven minimiert, während 28 bis 33 % der wirksamen shRNAs aus unseren shRNAs bzw. dem veröffentlichten Satz von shRNAs identifiziert wurden. Sollte die Sensitivität erhöht werden müssen, empfehlen wir die Verwendung einer Entscheidungsschwelle von 2. Diese Schwelle hatte eine Sensitivität von 0,54 – 0,55 und eine Spezifität von 0,88 – 0,9. Wenn die Entscheidungsschwelle weiter auf 0 gesenkt wird, steigt die Sensitivität auf 0,86 – 0,9, aber die Spezifität sinkt auf 0,55 – 0,54. Wir empfehlen, die höchstmögliche dieser Entscheidungsschwellen zu verwenden.

Obwohl diese Studie statistisch gesehen klein ist, hat sie den Vorteil, dass sie unseres Wissens nach die größte bisher veröffentlichte Gruppe von 19-mer-basierten shRNAs ist. Darüber hinaus umfasst unsere Studie im Gegensatz zu anderen shRNA-Studien, die zwangsläufig auf effektive shRNAs ausgerichtet sind, sowohl funktionale als auch nicht-funktionale shRNAs. Wir haben gezeigt, dass die modifizierten Algorithmen von Ui-Tei et al., Amarzguioui et al. und Takasaki et al. gute bis sehr gute Vorhersagewerkzeuge sind, die effektive von ineffektiven shRNAs unterscheiden. Allerdings weisen die modifizierten Algorithmen noch erhebliche Mängel auf. Eine direkte Bewertung der Algorithmusänderungen anhand von shRNAs, die nach dem ursprünglichen und dem modifizierten Algorithmus entwickelt wurden, würde diese Erkenntnisse untermauern. Diese Algorithmen sollen die Anzahl der ausgewählten falsch-positiven shRNAs reduzieren, aber nicht vollständig eliminieren, so dass eine große Anzahl von shRNAs erforderlich wäre, um einen statistisch signifikanten Unterschied in der falsch-positiven Rate zu erzielen. Die Verfügbarkeit größerer shRNA-Datensätze sollte die Entwicklung von Algorithmen mit verbesserter Empfindlichkeit und Spezifität unterstützen. Darüber hinaus könnten mehrere Softwareanwendungen für das Design von siRNA-Oligonukleotiden, die in dieser Studie nicht berücksichtigt wurden, für das Design von shRNAs von Nutzen sein. Die Kriterien für den Entwurf funktioneller siRNA-Oligonukleotide sind nach wie vor umstritten, wie die große Zahl von Studien zeigt, die noch für den siRNA-Entwurf erstellt werden. Da wir diese Sequenzen nicht als siRNAs getestet haben, kann nicht festgestellt werden, ob die Modifizierung dieser Algorithmen auch im Zusammenhang mit siRNA-Oligonukleotiden gilt. shRNA ist im Vergleich zu siRNA-Oligonukleotiden noch komplexer, da die Haarnadel innerhalb der Zelle verarbeitet werden muss, bevor sie in den RISC-Komplex gelangt. Darüber hinaus ist zu erwarten, dass der Selektionsdruck gegen die stabile Expression von shRNAs, die für das Zellwachstum schädlich sind, eine zusätzliche Einschränkung für die stabile Expression bestimmter shRNAs darstellt. Trotz dieser Komplexität geben unsere Ergebnisse erste Einblicke in die Fähigkeit, siRNA-Algorithmen für das Design funktioneller shRNAs anzuwenden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.