- Proiectarea și prepararea plasmidelor ARNc
- Strategia pentru o secvențiere precisă prin intermediul structurilor de tip hairpin
- Corelația dintre eficiența knockdown a ARNhc și algoritmii publicați pentru proiectarea ARNi
- Aplicarea unei modificări a algoritmului pe baza stabilității celor 6 baze centrale ale fiecărui ARNhc
Proiectarea și prepararea plasmidelor ARNc
Pentru a răspunde la întrebarea referitoare la modul în care secvența ARNc se corelează cu eficacitatea distrugerii, au fost proiectați și construiți 27 de vectori ARNc din 11 gene diferite (tabelul 1). Secvențele țintă au fost selectate în regiunea de codificare a fiecărei gene și au fost concepute pentru a fi în mare parte conforme cu studiile seminale privind caracteristicile secvenței pentru eficacitatea oligomerilor de siARN . În consecință, secvențele au un număr redus de execuții și au un raport G/C de aproximativ 50 %. ARNhc au fost concepute pentru a viza situsuri care sunt lipsite de polimorfisme de un singur nucleotid și corespund tuturor variantelor de îmbinare amplificate de seturile noastre de amorsă PCR în timp real.
Din moment ce ARNc pot avea efecte în afara țintei, este important pentru testele funcționale să se realizeze un mutant specific cu una sau mai multe dezacorduri de baze în cadrul situsului de recunoaștere a țintei ca un control . Pentru a economisi timp și costuri, am dezvoltat o metodă de realizare simultană a vectorilor shRNA de tip sălbatic și mutant (detaliată în Metode și Figura 1). Rezultatele eliminării genelor pentru patru perechi de ARNhc de tip sălbatic/mutant sunt prezentate în figura 2. Aceste rezultate demonstrează utilitatea acestei metode în furnizarea unui vector de ARNhc mutant punctual care poate servi drept control de pierdere a funcției pentru distrugerea genelor prin ARNhc de tip sălbatic. Deși au fost publicate protocoale detaliate pentru construcția vectorilor de ARNhc , acesta este primul protocol pentru producerea simultană a vectorilor de tip sălbatic și mutant și ar trebui să faciliteze implementarea unui sistem foarte controlat pentru ARNhc.
Strategia pentru o secvențiere precisă prin intermediul structurilor de tip hairpin
Verificarea secvenței unui hairpin ARNhc este esențială, deoarece nepotrivirea chiar și a unui singur nucleotid în cadrul secvenței țintă poate anula knockdown-ul (Figura 2 și .) O problemă frecvent întâlnită la prepararea vectorilor de ARNhc este aceea că mulți dintre ei sunt dificil de secvențiat din cauza structurii secundare intrinseci a acului de păr. O strategie propusă recent pentru a depăși această problemă implică ingineria unui situs de restricție în regiunea de buclă/stâlp a acului de păr pentru a separa fizic repetările inversate prin digestie și apoi pentru a pune cap la cap secvența cu ajutorul unor amorse cu sens și antisens. Cu toate acestea, capacitatea de a realiza secvențierea construcțiilor ARNhc fără a modifica secvența tulpină/buclă ar fi un avantaj clar. Pentru a aborda această posibilitate, am evaluat reacțiile de secvențiere modificate în vederea îmbunătățirii citirii structurii secundare de tip ac de păr în trei ac de păr ARNhc. Modificările includ adăugarea de agenți cunoscuți pentru a relaxa structura ADN, inclusiv DMSO, Betaine, PCRx Enhancer și ThermoFidelase I; și adăugarea unor cantități din ce în ce mai mari de dGTP BigDye terminator (dGTP) la chimia standard BigDye v1.1 (BD) care conține dITP mai degrabă decât dGTP.
Rezultatele de secvențiere pentru fiecare dintre cele trei construcții de ADN sunt rezumate în tabelul 2. Read-through-ul structurii în ac de păr a fost măsurat ca raport între înălțimea vârfului la aproximativ 300 de baze după structura în ac de păr și semnalul la aproximativ 50 de baze înainte de structura în ac de păr. Un raport de 1 indică lipsa de pierdere a semnalului, iar 0 indică pierderea completă a citirii. În absența oricărui aditiv în chimia BD, hairpin-ul a provocat o reducere a raportului înălțimii vârfului pentru hairpin-ul nostru cu structură mai puțin strânsă, pHSPG-shmutTLR4, la 0,4, și o pierdere completă a citirii pentru celelalte două plasmide. Acest lucru poate fi vizualizat ca o oprire bruscă în profilul vârfului de secvență pentru pHSPG-shTLR4 (Figura 3A).
Printre agenții de relaxare a ADN-ului, 5% DMSO, 0,83 M Betaina și 1 × PCRx Enhancer au îmbunătățit fiecare semnificativ citirea secvenței pentru unele construcții. Cu toate acestea, s-a constatat că adăugarea de 0,83 M Betaine plus 1 × PCRx Enhancer la chimia BD a avut cea mai consistentă secvențiere, cu rapoarte de înălțime a vârfurilor de 0,5-0,9 (tabelul 2 și figura 3B). Adăugarea de produse chimice BD:dGTP 10:1 numai pentru chimia BD:dGTP a îmbunătățit, de asemenea, într-o oarecare măsură citirea, cu rapoarte de înălțime a vârfurilor de 0,5-0,6 (tabelul 2 și figura 3C). Raportul suboptimal al înălțimii vârfului pentru 10:1 BD:dGTP poate fi atribuit unei trepte vizibile în profilul vârfului secvenței după regiunea structurii secundare, unde semnalul este redus (figura 3C, săgeată). Creșterea conținutului de chimie dGTP la 5:1 și 3:1 BD:dGTP sau utilizarea chimiei dGTP simple a crescut raportul înălțimii vârfului și a redus oarecum pasul (raport de 0,6 până la 0,8). Cu toate acestea, încorporarea mixtă de dITP și dGTP a dus la o lărgire mai gravă a vârfului pe măsură ce cantitatea de dGTP utilizată a crescut , iar chimia dGTP numai a cauzat comprimări severe ale secvenței (date nearătate). Cele mai bune rezultate generale au fost observate prin combinarea chimiei Betaine plus PCRx și a chimiei mixte BD:dGTP 10:1. Această combinație a redus pasul cu mai puțină lărgire a vârfurilor și a crescut raportul înălțimii vârfurilor la 0,9-1,0 (tabelul 2 și figura 3D). ThermoFidelase I, o enzimă de destabilizare a ADN-ului care este frecvent utilizată pentru a îmbunătăți secvențierea ADN-ului genomic , nu a îmbunătățit secvențierea niciunuia dintre cei trei hairpins în chimia BD simplă (datele nu sunt prezentate) și, de fapt, a redus semnificativ raportul înălțimii vârfurilor în chimia 10:1 BD:dGTP pentru toate cele trei construcții shRNA, provocând reapariția unei opriri la structura hairpin (tabelul 2 și figura 3E).
În concluzie, combinația de chimicale BD:GTP 10:1, Betaine 0,83 M și 1 × PCRx Enhancer a oferit o secvențiere optimă, iar chimicale mixte BD:dGTP, Betaine, PCRx Enhancer și DMSO au avut fiecare în parte efecte pozitive pe cont propriu. Cu toate acestea, ThermoFidelase I, probabil, ar trebui evitată pentru vectorii ARNhc cu structură secundară intrinsecă dificilă.
Corelația dintre eficiența knockdown a ARNhc și algoritmii publicați pentru proiectarea ARNi
Pentru a determina dacă eficacitatea knockdown prin vectori ARNhc se corelează cu regulile publicate pentru proiectarea oligonucleotidelor ARNi eficiente, ARNhc au fost evaluate pentru capacitatea lor de a reduce expresia genelor. ARNhc au fost transduși în mod stabil în linii de celule umane THP1 sau Jurkat, după cum se detaliază în tabelul 3, primele două coloane. Reducerea medie a fost determinată din ARN colectat în trei sau mai multe zile diferite și este listată pentru fiecare ARNhc (coloana 3). S-a demonstrat că reducerea este reproductibilă în cazul liniilor celulare care au fost transduși și sortați în mod independent, ceea ce sugerează că reducerea este mai degrabă o funcție a secvenței țintă a ARNhc decât o caracteristică a transducției virale. Mai mult de o treime din vectorii shRNA construiți nu au fost capabili să suprime transcripția (<10% în coloana 3), în ciuda unor rate de creștere comparabile și a exprimării pe termen lung a markerului GFP la niveluri ridicate în aceste linii celulare. Mai mult decât atât, variațiile mari în ceea ce privește eficacitatea knockdown pentru mai multe ARNhc realizate împotriva multora dintre aceleași gene (de exemplu, CLR16.2, CLR19.3 și TLR4) contrazic orice motive biologice simple pentru diferențele de eficacitate pentru aceste gene. Multe dintre ARNhc ineficiente au valori negative ale ΔΔG 5′ și un scor Reynolds ridicat, fiecare dintre acestea fiind presupus a fi corelat cu eficacitatea de knockdown a ARNsi (tabelul 3, coloanele 4 și 5) . Dimpotrivă, printre ARNhc care au fost capabili să confere knockdown-ul genelor, mai mulți au avut fie valori 5’ΔΔG pozitive, fie scoruri Reynolds scăzute. Aceste constatări indică faptul că algoritmul 5’ΔΔG și scorul Reynolds pentru siARN ar putea să nu ofere criterii corelative pozitive pentru proiectarea ARNhc.
Pentru a determina dacă alți algoritmi publicați pentru proiectarea oligonucleotidelor siARN pot fi aplicați vectorilor ARNhc, fiecare dintre situsurile țintă ale ARNc a fost evaluat de patru algoritmi suplimentari, iar scorurile au fost reprezentate grafic față de procentul de knockdown pentru fiecare ARNc (tabelul 3, coloanele 6-9 și figura 4). Pentru fiecare algoritm a fost trasată o linie de cea mai bună potrivire, iar valoarea R2 a fost calculată pentru a indica dacă variația eficacității knockdown poate fi explicată prin scorul algoritmului. Rezultatele confirmă o asociere slabă între eficacitatea ARNhc și considerațiile 5′ ΔΔG (diferența de energie liberă) sau algoritmul Reynolds et al. și demonstrează, de asemenea, o asociere slabă cu algoritmul Hsieh et al., fiecare dintre acestea prezentând, de fapt, o corelație inversă slabă cu datele. Algoritmii lui Amarguizoui și colab. , Ui-Tei și colab. și Takasaki și colab. se corelează direct cu eficacitatea ARNhc. Cu toate acestea, niciunul dintre scorurile algoritmilor nu explică un procent semnificativ din variația eficacității knockdown. Dintre algoritmii testați, sistemul de punctaj Takasaki et al. prezintă cea mai mare asociere, cu o valoare R2 de 0,0251.
Pentru că aceste rezultate sugerează că o relație liniară nu se aplică puternic la knockdown-ul ARNhc pentru niciunul dintre cei șase algoritmi, am evaluat fiecare dintre algoritmi prin analiza curbei ROC pentru a determina dacă vreun algoritm este superior celorlalți în identificarea ARNhc eficace. Curba ROC este o diagramă a sensibilității (fracțiunea pozitivă adevărată, TPF) versus 1 minus specificitatea (fracțiunea fals pozitivă, FPF) care este generată prin variația pragului de decizie între scorul minim și cel maxim al algoritmului. Diagonala graficului ROC reprezintă curba ROC pentru un algoritm care nu este mai bun la discriminare decât selecția aleatorie. Algoritmii care discriminează slab au curbe ROC care urmăresc diagonala și au o arie sub curba ROC (AUC) care nu este semnificativ diferită de AUC de pe diagonală (0,5). Algoritmii care sunt buni discriminatori au curbe ROC cu o abatere convexă puternică de la diagonală și AUC-uri care se apropie de 1 și sunt semnificativ diferite de AUC a diagonalei.
Algoritmul lui Hsieh et al. a avut o curbă ROC concavă (Fig. 5A), indicând o sensibilitate și o specificitate inacceptabilă în discriminarea ARNmilor shRNA eficienți de cei ineficienți. Curbele ROC pentru toți ceilalți algoritmi (Fig. 5B-F) au urmărit aproape de diagonala graficului ROC și au avut AUC-uri care nu au fost semnificativ diferite de AUC-ul diagonalei (Fig. 5B-F). Astfel, niciunul dintre algoritmi nu a arătat o capacitate semnificativă din punct de vedere statistic de a discrimina între ARNhc eficienți și ineficienți.
Algoritmul Takasaki et al. (Fig. 5F) s-a dovedit a fi cel mai promițător ca discriminator al ARNhc-urilor eficiente față de cele ineficiente. Cu toate acestea, acest algoritm a suferit de o fracțiune fals pozitivă relativ ridicată pentru pragurile de decizie apropiate de scorul maxim, după cum indică abaterea slabă și neregulată de la diagonală în apropierea originii curbei ROC (Fig. 5F). Acest lucru indică faptul că algoritmul a atribuit un scor ridicat unui număr de ARNhc ineficienți. Inspecția datelor a arătat că două dintre cele trei ARNhc ineficiente cu punctaj ridicat au vizat gene a căror expresie a fost eliminată cu succes de alte ARNhc (tabelul 3, asteriscuri). Astfel, este puțin probabil ca ineficiența ARNhc să fie o consecință a presiunii selective împotriva suprimării stabile a expresiei genelor. Este mai probabil ca algoritmul Takasaki et al. să nu ia în considerare o caracteristică esențială a ARNhc eficace.
Aplicarea unei modificări a algoritmului pe baza stabilității celor 6 baze centrale ale fiecărui ARNhc
Inspectarea proprietăților fizice ale ARNc-urilor sh eficace cu punctaj ridicat a relevat faptul că stabilitatea medie a duplexului format de cele 6 baze centrale ale ARNc-urilor (bazele 6-11 ale catenei de sens hibridizate cu bazele 9-14 ale catenei antisens) a fost mai mare decât stabilitatea medie a ARNc-urilor sh eficace cu punctaj ridicat (ΔG = -13.1 ± 0,1 față de -11,1 ± 1 kcal/mol, respectiv -11,1 ± 1 kcal/mol). Pe baza acestei observații, algoritmul Takasaki et al. a fost modificat astfel încât ARNmurilor shRNA cu un ΔG al duplexului central egal sau mai mic de -12,9 kcal/mol le-a fost atribuit un scor minim (tabelul 4). Această modificare a atribuit scoruri minime la cinci ARNhc, dintre care patru au fost ineficiente, crescând astfel specificitatea algoritmului fără o pierdere semnificativă a sensibilității. Un scor minim atribuit unui singur ARNhc eficient (71 % knockdown), indică faptul că alte proprietăți, în plus față de stabilitatea duplexului central, influențează eficacitatea. Cu toate acestea, adăugarea acestei modificări a eliminat abaterea slabă și neregulată a curbei ROC de la diagonală pentru pragurile de decizie ridicate și a crescut AUC la 0,79 (Fig. 5I). O modificare similară a algoritmilor Amarzguioui et al. și Ui-Tei et al. a crescut, de asemenea, AUC-urile curbelor ROC ale acestora (Fig. 5G și 5H). Cu această modificare, AUC-urile curbelor ROC pentru toți cei trei algoritmi modificați au fost semnificativ diferite de AUC-ul diagonalei (Fig. 5G-I), ceea ce indică o capacitate de predicție semnificativă din punct de vedere statistic. Diferențele dintre AUC-urile curbelor ROC pentru algoritmii modificați nu au fost semnificative, astfel încât, din punct de vedere statistic, toți cei trei algoritmi modificați au fost de aceeași utilitate. Algoritmii 5′ ΔΔG, Reynolds et al. și Hsieh et al. nu au fost îmbunătățiți la o capacitate de predicție semnificativă din punct de vedere statistic prin aplicarea modificării ΔG a duplexului central (datele nu sunt prezentate).
Pentru a aborda posibilitatea ca îmbunătățirea obținută prin modificarea algoritmilor Amarzguioui et al, Ui-Tei et al și Takasaki et al. să fie o consecință a supraadaptării setului nostru de ARNhc, un set independent de 38 de ARNhc grupate din publicații anterioare (; Tabelul 5) a fost supus analizei. În timp ce niciuna dintre curbele ROC pentru cei trei algoritmi nemodificați nu a avut un AUC semnificativ diferit de cel al diagonalei (Amarzguioui et al., p = 0,174; Ui-Tei et al. p = 0,09; Takasaki et al., p = 0,26), toți algoritmii modificați au produs curbe ROC cu AUC-uri semnificativ diferite de AUC-ul diagonalei (p = 0,0001-0,009; Fig. 5J-L). Din punct de vedere statistic, toți cei trei algoritmi modificați au fost de aceeași utilitate, deoarece AUC-urile curbelor ROC pentru algoritmii modificați au fost toate semnificativ diferite de AUC-ul diagonalei, dar nu semnificativ diferite între ele. Această analiză a unui set independent de ARNhc sugerează că modificarea algoritmilor are o valabilitate generală.
Pentru că minimizarea ratei fals pozitive este principala preocupare în proiectarea ARNhc, recomandăm utilizarea algoritmului modificat Ui-Tei et al. algoritm, care a avut cea mai mică fracțiune fals pozitivă ridicată la pragurile de decizie apropiate de scorul maxim, după cum indică abaterea puternică de la diagonală în apropierea originii curbei ROC (Fig. 5H și 5K). Utilizarea unui prag de decizie de 3 limitează selecția ARNhc la o regiune a curbei ROC în care sensibilitatea a fost acceptabilă (0,28-,33), în timp ce specificitatea a fost foarte bună (1,0). Prin stabilirea acestui prag de decizie, fracțiunea fals pozitivă a fost redusă la minimum, în timp ce 28 – 33 % dintre ARNhc eficiente au fost identificate din ARNhc-urile noastre și, respectiv, din setul de ARNhc publicat. În cazul în care sensibilitatea trebuie să fie crescută, recomandăm utilizarea unui prag de decizie de 2. Acest prag a avut o sensibilitate de 0,54 – 0,55 și o specificitate de 0,88 – 0,9. Dacă pragul de decizie a fost relaxat în continuare la 0, sensibilitatea a crescut la 0,86 – 0,9, dar specificitatea a scăzut la 0,55 – 0,54. Recomandăm utilizarea celui mai mare dintre aceste praguri de decizie posibile.
Deși mic din punct de vedere statistic, acest studiu are avantajul, după cunoștințele noastre, de a fi cel mai mare set publicat până în prezent de ARNhc pe bază de 19 polimeri. În plus, spre deosebire de alte studii privind ARNhc care sunt în mod necesar înclinate spre ARNhc eficiente, studiul nostru include atât ARNhc funcționale, cât și nefuncționale. Am demonstrat că algoritmii modificați de Ui-Tei et al., Amarzguioui et al. și Takasaki et al. modificați sunt instrumente de predicție corecte sau bune, care disting ARNhc eficace de ARNhc ineficace. Cu toate acestea, există încă deficiențe semnificative în algoritmii modificați. O evaluare directă a modificărilor aduse algoritmilor folosind ARNhc concepute în conformitate cu fiecare algoritm original și modificat ar veni în sprijinul acestor constatări. Acești algoritmi sunt meniți să reducă numărul de ARNhc fals pozitive selectate, nu să le elimine complet și, prin urmare, acest lucru ar necesita un număr mare de ARNhc pentru a obține o diferență semnificativă din punct de vedere statistic în ceea ce privește rata falselor pozitive. Disponibilitatea unor seturi de date mai mari de ARNhc ar trebui să sprijine dezvoltarea unor algoritmi cu sensibilitate și specificitate îmbunătățite. În plus, mai multe aplicații software pentru proiectarea oligonucleotidelor siARN care nu au fost luate în considerare în acest studiu pot fi utile pentru proiectarea ARNhc . Criteriile pentru proiectarea oligonucleotidelor funcționale de siARN rămân controversate, după cum reiese din numărul mare de studii încă în curs de elaborare pentru proiectarea siARN și, deoarece nu am testat aceste secvențe ca siARN-uri, nu se poate stabili dacă modificarea acestor algoritmi se aplică și în contextul oligonucleotidelor de siARN. shRNA are un nivel suplimentar de complexitate față de oligonucleotidele de siARN, deoarece pinul capilar trebuie să fie procesat în interiorul celulei înainte de a intra în complexul RISC. În plus, se așteaptă ca presiunea selectivă împotriva exprimării stabile a ARNhc care dăunează creșterii celulare să impună o constrângere suplimentară la exprimarea stabilă a anumitor ARNhc. În ciuda acestor complexități, constatările noastre încep să aducă o perspectivă asupra capacității de aplicare a algoritmilor siRNA pentru proiectarea de ARNhc funcționale.