- Progettazione e preparazione di plasmidi shRNA
- Strategia per il sequenziamento accurato attraverso strutture hairpin
- Correlazione tra l’efficienza di knockdown degli shRNA e gli algoritmi pubblicati per la progettazione di siRNA
- Applicazione di una modifica dell’algoritmo basata sulla stabilità delle 6 basi centrali di ogni shRNA
Progettazione e preparazione di plasmidi shRNA
Per affrontare la questione di come la sequenza shRNA sia correlata all’efficacia di abbattimento, sono stati progettati e costruiti 27 vettori shRNA di 11 geni diversi (Tabella 1). Le sequenze target sono state selezionate nella regione codificante di ogni gene e sono state progettate per essere ampiamente conformi agli studi seminali sulle caratteristiche della sequenza per l’efficacia degli oligomeri siRNA. Di conseguenza, le sequenze sono basse in corse e hanno un rapporto G/C di circa il 50%. Gli shRNA sono stati progettati per puntare a siti che sono privi di polimorfismi a singolo nucleotide, e corrispondono a tutte le varianti di splice amplificate dai nostri set di primer PCR in tempo reale.
Siccome siRNA può avere effetti off-target, è importante per saggi funzionali per fare un mutante specifico con uno o più mismatch di base all’interno del sito di riconoscimento bersaglio come un controllo . Per risparmiare tempo e costi, abbiamo sviluppato un metodo per fare vettori shRNA wild-type e mutante contemporaneamente (dettagliato in Metodi e Figura 1). I risultati di knockdown del gene per quattro coppie shRNA wild-type/mutante sono mostrati nella Figura 2. Questi risultati dimostrano l’utilità di questo metodo nel fornire un vettore shRNA punto mutante che può servire come una perdita di funzione di controllo per il gene knockdown da shRNA di tipo selvatico. Sebbene siano stati pubblicati protocolli dettagliati per la costruzione di vettori shRNA, questo è il primo protocollo per la produzione di vettori wild-type e mutanti simultaneamente e dovrebbe facilitare l’implementazione di un sistema altamente controllato per shRNA.
Strategia per il sequenziamento accurato attraverso strutture hairpin
Verificare la sequenza di un hairpin shRNA è essenziale poiché il mismatch anche di un solo nucleotide all’interno della sequenza target può annullare il knockdown (Figura 2 e .Un problema che si incontra spesso nella preparazione di vettori shRNA è che molti sono difficili da sequenziare a causa della struttura secondaria intrinseca della forcina. Una strategia recentemente proposta per superare questo problema comporta l’ingegneria di un sito di restrizione all’interno del loop / stelo regione della forcina per separare fisicamente le ripetizioni invertite da digestione, e poi mettere insieme sequenza utilizzando primer senso e antisenso. Tuttavia, la capacità di ottenere il sequenziamento dei costrutti shRNA senza modificare la sequenza stem/loop sarebbe di chiaro vantaggio. Per affrontare questa possibilità, abbiamo valutato le reazioni di sequenziamento modificate per il miglioramento della lettura della struttura secondaria della forcina in tre forcine shRNA. Le modifiche includono l’aggiunta di agenti noti per rilassare la struttura del DNA tra cui DMSO, Betaina, PCRx Enhancer e ThermoFidelase I; e l’aggiunta di quantità crescenti di dGTP BigDye terminatore (dGTP) chimica alla chimica standard BigDye v1.1 (BD) che contiene dITP piuttosto che dGTP.
I risultati di sequenziamento per ciascuno dei tre costrutti di DNA sono riassunti nella tabella 2. Read-through della struttura a forcina è stato misurato come il rapporto tra l’altezza del picco circa 300 basi dopo la struttura a forcina al segnale circa 50 basi prima della struttura a forcina. Un rapporto di 1 indica nessuna perdita di segnale e 0 indica la perdita completa di lettura. In assenza di qualsiasi additivo alla chimica BD, la forcina ha causato una riduzione del rapporto di altezza del picco per la nostra forcina meno strettamente strutturato, pHSPG-shmutTLR4, a 0,4, e una perdita completa in lettura attraverso per gli altri due plasmidi. Questo può essere visualizzato come un brusco arresto nel profilo del picco di sequenza per pHSPG-shTLR4 (Figura 3A).
Tra gli agenti di rilassamento del DNA, 5% DMSO, 0,83 M Betaina e 1 × PCRx Enhancer ciascuno migliorato la sequenza letto significativamente per alcuni costrutti. Tuttavia, l’aggiunta di 0,83 M Betaina più 1 × PCRx Enhancer alla chimica BD è stato trovato per sequenza più coerente, con rapporti di altezza del picco di 0,5-0,9 (Tabella 2 e Figura 3B). L’aggiunta di 10:1 BD: dGTP chimica da solo anche migliorato leggere attraverso un po ‘, con rapporti di altezza del picco di 0.5-0.6 (Tabella 2 e Figura 3C). Il rapporto di altezza del picco sub-ottimale per 10:1 BD: dGTP può essere attribuito a un passo visibile nel profilo del picco sequenza dopo la regione struttura secondaria dove il segnale è ridotto (Figura 3C, freccia). Aumentando il contenuto della chimica dGTP a 5:1 e 3:1 BD: dGTP o utilizzando la chimica dGTP dritto aumentato il rapporto di altezza del picco e ridotto il passo un po ‘(0,6 a 0,8 rapporto). Tuttavia, l’incorporazione mista di dITP e dGTP ha portato a peggiore allargamento del picco come la quantità di dGTP utilizzato aumentato, e dGTP solo chimica causato gravi compressioni sequenza (dati non mostrati). I migliori risultati complessivi sono stati osservati combinando Betaine più PCRx e 10:1 BD: dGTP chimica mista insieme. Questa combinazione ha ridotto il passo con meno allargamento del picco e aumentato i rapporti di altezza del picco a 0,9-1,0 (Tabella 2 e Figura 3D). ThermoFidelase I, un enzima destabilizzante del DNA che viene spesso utilizzato per migliorare il sequenziamento del DNA genomico, non ha migliorato il sequenziamento di una qualsiasi delle tre forcine in chimica BD dritto (dati non mostrati), e in realtà ridotto il rapporto di altezza del picco in 10:1 BD: dGTP chimiche per tutti e tre i costrutti shRNA, causando la ricomparsa di un arresto alla struttura forcina (Tabella 2 e Figura 3E).
In sintesi, la combinazione di 10:1 BD:GTP chimici, 0,83 M Betaina, e 1 × PCRx Enhancer fornito sequenziamento ottimale, e BD misto: dGTP chimici, Betaina, PCRx Enhancer, e DMSO ciascuno ha avuto alcuni effetti positivi da soli. ThermoFidelase I, tuttavia, probabilmente dovrebbe essere evitato per i vettori shRNA con struttura secondaria intrinseca difficile.
Correlazione tra l’efficienza di knockdown degli shRNA e gli algoritmi pubblicati per la progettazione di siRNA
Per determinare se l’efficacia di knockdown da parte dei vettori shRNA è correlata alle regole pubblicate per la progettazione di oligonucleotidi siRNA efficaci, gli shRNA sono stati valutati per la loro capacità di knockdown dell’espressione genica. Gli shRNA sono stati trasdotti in modo stabile in linee cellulari umane THP1 o Jurkat come dettagliato nella tabella 3, prime due colonne. L’abbattimento medio è stato determinato dall’RNA raccolto in tre o più giorni diversi ed è elencato per ogni shRNA (colonna 3). Knockdown è stato dimostrato di essere riproducibile per le linee cellulari che sono stati indipendentemente trasdotti e ordinati, suggerendo che knockdown è una funzione della sequenza di destinazione shRNA piuttosto che le caratteristiche della trasduzione virale. Più di un terzo dei vettori shRNA costruiti non sono stati in grado di sopprimere la trascrizione (<10% nella colonna 3), nonostante i tassi di crescita comparabili e l’espressione a lungo termine del marcatore GFP ad alti livelli in queste linee cellulari. Inoltre, grandi variazioni di efficacia knockdown per diversi shRNA fatti contro molti degli stessi geni (cioè, CLR16.2, CLR19.3 e TLR4) sostengono contro qualsiasi semplice ragioni biologiche per le differenze di efficacia per questi geni. Molti degli shRNA inefficaci hanno valori negativi 5′ ΔΔG e alti punteggi Reynolds, ognuno dei quali è stato ipotizzato per correlare con l’efficacia del knockdown del siRNA (Tabella 3, Colonne 4 e 5). Al contrario, tra gli shRNA che erano in grado di conferire il knockdown del gene, molti avevano valori 5’ΔΔG positivi o bassi punteggi Reynolds. Questi risultati indicano che 5’ΔΔG e Reynolds algoritmo di punteggio per siRNA non può fornire criteri correlativi positivi per shRNA design.
Per determinare se altri algoritmi pubblicati per la progettazione di oligonucleotidi siRNA può essere applicato a vettori shRNA, ciascuno dei siti bersaglio shRNA è stato valutato da quattro algoritmi aggiuntivi, e punteggi sono stati tracciati contro il knockdown percentuale per ogni shRNA (Tabella 3, colonne 6-9 e Fig. 4). Per ogni algoritmo trama una linea di best fit è stato disegnato e il valore R2 calcolato come indicazione di se la varianza in efficacia knockdown può essere spiegato dal punteggio algoritmo. I risultati confermano una scarsa associazione tra l’efficacia shRNA e 5 ‘ΔΔG (differenziale di energia libera) considerazioni o il Reynolds et al. algoritmo, e anche dimostrare una scarsa associazione con l’algoritmo Hsieh et al. Gli algoritmi di Amarguizoui et al. , Ui-Tei et al. , e Takasaki et al. , correlano direttamente con l’efficacia shRNA. Tuttavia, nessuno dei punteggi degli algoritmi spiega una percentuale significativa della varianza nell’efficacia di abbattimento. Tra gli algoritmi testati, il sistema di punteggio Takasaki et al. mostra la più alta associazione, con un valore R2 di 0,0251.
Perché questi risultati suggeriscono che una relazione lineare non si applica fortemente a shRNA knockdown per uno qualsiasi dei sei algoritmi, abbiamo valutato ciascuno degli algoritmi da analisi della curva ROC per determinare se qualsiasi algoritmo è superiore agli altri a identificare shRNA efficaci. La curva ROC è un grafico della sensibilità (la frazione di vero positivo, TPF) rispetto a 1 meno la specificità (la frazione di falso positivo, FPF) che viene generata variando la soglia di decisione tra il punteggio minimo e massimo dell’algoritmo. La diagonale del diagramma ROC rappresenta la curva ROC per un algoritmo che non è migliore nella discriminazione rispetto alla selezione casuale. Gli algoritmi che sono scarsi discriminatori hanno curve ROC che seguono la diagonale e hanno un’area sotto la curva ROC (AUC) che non è significativamente diversa dall’AUC della diagonale (0,5). Gli algoritmi che sono buoni discriminatori hanno curve ROC con forte deviazione convessa dalla diagonale e AUC che si avvicinano a 1 e sono significativamente diversi dall’AUC della diagonale.
L’algoritmo di Hsieh et al. aveva una curva ROC concava (Fig. 5A) che indica una sensibilità e specificità inaccettabile nel discriminare shRNA efficaci da quelli inefficaci. Le curve ROC per tutti gli altri algoritmi (Figg. 5B-F) hanno tracciato vicino alla diagonale del diagramma ROC e avevano AUC che non erano significativamente diverse dall’AUC della diagonale (Figg. 5B-F). Pertanto, nessuno degli algoritmi ha mostrato una capacità statisticamente significativa di discriminare tra shRNA efficaci e inefficaci.
L’algoritmo Takasaki et al. (Fig. 5F) ha mostrato la maggior promessa come discriminatore di shRNA efficaci da quelli inefficaci. Tuttavia, questo algoritmo ha sofferto di una frazione relativamente alta di falsi positivi per le soglie di decisione vicino al punteggio massimo, come indicato dalla debole, erratica deviazione dalla diagonale vicino all’origine della curva ROC (Fig. 5F). Ciò indica che l’algoritmo ha assegnato un punteggio elevato a un certo numero di shRNA inefficaci. L’ispezione dei dati ha rivelato che due dei tre shRNA inefficaci ad alto punteggio hanno mirato a geni la cui espressione è stata abbattuta con successo da altri shRNA (Tabella 3, asterischi). Quindi è improbabile che l’inefficacia degli shRNA sia una conseguenza della pressione selettiva contro la soppressione stabile dell’espressione genica. È più probabile che l’algoritmo di Takasaki et al. non tenga conto di una caratteristica critica degli shRNA efficaci.
Applicazione di una modifica dell’algoritmo basata sulla stabilità delle 6 basi centrali di ogni shRNA
L’ispezione delle proprietà fisiche degli shRNA inefficaci ad alto punteggio ha rivelato che la stabilità media del duplex formato dalle 6 basi centrali degli shRNA (basi 6-11 del filamento senso ibridate alle basi 9-14 del filamento antisenso) era maggiore della stabilità media degli shRNA efficaci ad alto punteggio (ΔG = -13.1 ± 0,1 contro -11,1 ± 1 kcal/mol rispettivamente). Sulla base di questa osservazione, l’algoritmo di Takasaki et al. è stato modificato in modo che gli shRNA con un duplex centrale ΔG uguale o inferiore a -12,9 kcal/mol sono stati assegnati un punteggio minimo (Tabella 4). Questa modifica ha assegnato punteggi minimi a cinque shRNA, quattro dei quali erano inefficaci, aumentando così la specificità dell’algoritmo senza una significativa perdita di sensibilità. Un punteggio minimo assegnato a un shRNA efficace (71% knockdown), indica che altre proprietà oltre alla stabilità del duplex centrale influenzano l’efficacia. Tuttavia, l’aggiunta di questa modifica ha eliminato la debole deviazione erratica della curva ROC dalla diagonale per alte soglie di decisione e ha aumentato l’AUC a 0,79 (Fig. 5I). Una modifica simile degli algoritmi di Amarzguioui et al. e Ui-Tei et al. ha anche aumentato gli AUC delle loro curve ROC (Figg. 5G e 5H). Con questa modifica, le AUC delle curve ROC per tutti e tre gli algoritmi modificati erano significativamente diverse dalle AUC della diagonale (Figg. 5G-I), indicando una capacità predittiva statisticamente significativa. Le differenze tra le AUC delle curve ROC per gli algoritmi modificati non erano significative, quindi su basi statistiche tutti e tre gli algoritmi modificati erano di uguale utilità. Gli algoritmi 5′ ΔΔG, Reynolds et al, e Hsieh et al. non sono stati migliorati ad una capacità predittiva statisticamente significativa applicando la modifica del duplex centrale ΔG (dati non mostrati).
Per affrontare la possibilità che il miglioramento ottenuto dalla modifica del Amarzguioui et al, Ui-Tei et al, e Takasaki et al. algoritmi è una conseguenza di overfitting nostro set di shRNAs, un set indipendente di 38 shRNAs pooled da pubblicazioni precedenti (; Tabella 5) sono stati sottoposti ad analisi. Mentre nessuna delle curve ROC per i tre algoritmi non modificati aveva un AUC significativamente diverso da quello della diagonale (Amarzguioui et al., p = 0.174; Ui-Tei et al. p = 0.09; Takasaki et al., p = 0.26), tutti gli algoritmi modificati prodotto curve ROC con AUCs significativamente diverso dal AUC della diagonale (p = 0.0001-0.009; Figs. 5J-L). Su basi statistiche, tutti e tre gli algoritmi modificati erano di uguale utilità, dato che gli AUC delle curve ROC per gli algoritmi modificati erano tutti significativamente diversi dall’AUC della diagonale, ma non significativamente diversi gli uni dagli altri. Questa analisi di un set indipendente di shRNA suggerisce che la modifica degli algoritmi è di validità generale.
Perché minimizzare il tasso di falsi positivi è la preoccupazione principale nella progettazione di shRNA, si consiglia di utilizzare l’algoritmo modificato di Ui-Tei et al. Algoritmo modificato di Ui-Tei et al., che ha avuto la più bassa frazione di falsi positivi alle soglie di decisione vicino al punteggio massimo, come indicato dalla forte deviazione dalla diagonale vicino all’origine della curva ROC (Figg. 5H e 5K). Utilizzando una soglia di decisione di 3 limita la selezione di shRNA a una regione della curva ROC dove la sensibilità era accettabile (0,28-.33), mentre la specificità era molto buona (1,0). Impostando questa soglia decisionale, la frazione di falsi positivi è stata minimizzata, mentre il 28 – 33% degli shRNA efficaci sono stati identificati rispettivamente dai nostri shRNA e dal set pubblicato di shRNA. Se la sensibilità dovesse essere aumentata, raccomandiamo di usare una soglia di decisione di 2. Questa soglia aveva una sensibilità di 0,54 – 0,55 e una specificità di 0,88 – 0,9. Se la soglia decisionale è stata ulteriormente abbassata a 0, la sensibilità è aumentata a 0,86 – 0,9, ma la specificità è scesa a 0,55 – 0,54. Raccomandiamo di usare la più alta di queste soglie di decisione possibile.
Anche se statisticamente piccolo, questo studio ha il vantaggio, a nostra conoscenza, di essere il più grande insieme pubblicato di shRNA basati su 19-mer fino ad oggi. Inoltre, a differenza di altri studi shRNA che sono necessariamente skewed verso shRNA efficaci, il nostro studio include sia shRNA funzionali che non funzionali. Abbiamo dimostrato che gli algoritmi modificati di Ui-Tei et al., Amarzguioui et al. e Takasaki et al. sono strumenti predittivi da discreti a buoni che distinguono gli shRNA efficaci da quelli inefficaci. Tuttavia, carenze significative esistono ancora negli algoritmi modificati. Una valutazione diretta delle modifiche dell’algoritmo utilizzando shRNA progettati secondo ogni algoritmo originale e modificato darebbe sostegno a questi risultati. Questi algoritmi hanno lo scopo di ridurre il numero di shRNA falsi positivi selezionati, non di eliminarli completamente, e quindi questo richiederebbe un gran numero di shRNA per ottenere una differenza statisticamente significativa nel tasso di falsi positivi. La disponibilità di set di dati shRNA più grandi dovrebbe sostenere lo sviluppo di algoritmi con una migliore sensibilità e specificità. Inoltre, diverse applicazioni software per la progettazione di oligonucleotidi siRNA che non sono stati considerati in questo studio può essere utile nella progettazione di shRNA. I criteri per la progettazione di oligonucleotidi siRNA funzionali rimangono controversi come evidenziato dal gran numero di studi ancora in fase di elaborazione per la progettazione di siRNA, e poiché non abbiamo testato queste sequenze come siRNA non si può stabilire se la modifica di questi algoritmi si applica anche nel contesto degli oligonucleotidi siRNA. shRNA ha un ulteriore livello di complessità rispetto agli oligonucleotidi siRNA poiché la forcina deve essere elaborata all’interno della cellula prima di entrare nel complesso RISC. Inoltre, la pressione selettiva contro l’espressione stabile di shRNA che sono deleteri per la crescita cellulare dovrebbe prestare un ulteriore vincolo all’espressione stabile di alcuni shRNA. Nonostante queste complessità, i nostri risultati iniziano a portare intuizioni sulla capacità di applicare algoritmi siRNA per la progettazione di shRNA funzionali.