- Projektowanie i przygotowanie plazmidów shRNA
- Strategia dokładnego sekwencjonowania poprzez struktury szpilki do włosów
- Korelacja pomiędzy wydajnością shRNA knockdown a opublikowanymi algorytmami projektowania siRNA
- Zastosowanie modyfikacji algorytmu w oparciu o stabilność 6 centralnych zasad każdego shRNA
Projektowanie i przygotowanie plazmidów shRNA
Aby odpowiedzieć na pytanie, jak sekwencja shRNA koreluje z efektywnością knockdownu, zaprojektowano i skonstruowano 27 wektorów shRNA z 11 różnych genów (Tabela 1). Sekwencje docelowe zostały wybrane w regionie kodującym każdego genu i zostały zaprojektowane tak, aby w szerokim zakresie odpowiadały badaniom seminalnym cech sekwencji dla skuteczności oligomerów siRNA. Odpowiednio, sekwencje mają niską liczbę powtórzeń i stosunek G/C wynoszący około 50%. Sekwencje shRNA zostały zaprojektowane tak, aby celować w miejsca pozbawione polimorfizmów pojedynczych nukleotydów i odpowiadają wszystkim wariantom splice amplifikowanym przez nasze zestawy primerów PCR w czasie rzeczywistym.
Ponieważ siRNA mogą mieć efekty pozatargetowe, ważne jest, aby w testach funkcjonalnych wykonać specyficzny mutant z jedną lub więcej niedopasowanymi zasadami w miejscu rozpoznania celu jako kontrolę. Aby zaoszczędzić czas i koszty, opracowaliśmy metodę jednoczesnego wytwarzania dzikich i zmutowanych wektorów shRNA (szczegółowo opisaną w Metodach i Figurze 1). Wyniki knockdown genów dla czterech par shRNA typu dzikiego i zmutowanego są pokazane na Rysunku 2. Wyniki te wskazują na użyteczność tej metody w dostarczaniu zmutowanego punktowo wektora shRNA, który może służyć jako kontrola utraty funkcji dla nokautu genów przez shRNA typu dzikiego. Chociaż opublikowano szczegółowe protokoły konstrukcji wektorów shRNA, jest to pierwszy protokół jednoczesnego wytwarzania wektorów typu dzikiego i zmutowanego, który powinien ułatwić wdrożenie wysoce kontrolowanego systemu dla shRNA.
Strategia dokładnego sekwencjonowania poprzez struktury szpilki do włosów
Weryfikacja sekwencji szpilki do włosów shRNA jest niezbędna, ponieważ niedopasowanie nawet jednego nukleotydu w obrębie sekwencji docelowej może znieść knockdown (Figura 2 i .) Problemem, który często napotyka się podczas przygotowywania wektorów shRNA jest to, że wiele z nich jest trudnych do sekwencjonowania ze względu na wewnętrzną strukturę drugorzędową szpilki do włosów. Jedna ze strategii zaproponowanych ostatnio w celu przezwyciężenia tego problemu polega na zaprojektowaniu miejsca restrykcyjnego w obrębie pętli/ regionu łodygi szpilki do włosów, aby fizycznie oddzielić odwrócone powtórzenia przez trawienie, a następnie połączyć sekwencję przy użyciu starterów sensownych i antysensownych. Jednakże, zdolność do sekwencjonowania konstruktów shRNA bez modyfikacji sekwencji łodygi/pętli byłaby oczywistą zaletą. Aby odpowiedzieć na tę możliwość, ocenialiśmy zmodyfikowane reakcje sekwencjonowania pod kątem poprawy odczytu struktury drugorzędowej szpilki do włosów w trzech szpilkach shRNA. Modyfikacje obejmują dodanie środków znanych z rozluźniania struktury DNA, w tym DMSO, Betainy, PCRx Enhancer i ThermoFidelase I; oraz dodanie rosnących ilości chemii dGTP BigDye terminator (dGTP) do standardowej chemii BigDye v1.1 (BD), która zawiera dITP zamiast dGTP.
Wyniki sekwencjonowania dla każdego z trzech konstruktów DNA podsumowano w Tabeli 2. Odczyt struktury szpilki do włosów mierzono jako stosunek wysokości piku około 300 zasad po strukturze szpilki do sygnału około 50 zasad przed strukturą szpilki do włosów. Stosunek 1 oznacza brak utraty sygnału, a 0 oznacza całkowitą utratę odczytu. Przy braku jakiegokolwiek dodatku do chemii BD, szpilka do włosów spowodowała zmniejszenie stosunku wysokości piku dla naszej mniej ściśle ustrukturyzowanej szpilki do włosów, pHSPG-shmutTLR4, do 0,4 i całkowitą utratę możliwości odczytu dla pozostałych dwóch plazmidów. Można to zobrazować jako nagłe zatrzymanie w profilu piku sekwencji dla pHSPG-shTLR4 (Rysunek 3A).
Wśród środków rozluźniających DNA, 5% DMSO, 0,83 M Betaina i 1 × PCRx Enhancer każdy poprawił znacząco odczyt sekwencji dla niektórych konstruktów. Jednakże, dodatek 0,83 M Betainy plus 1 × PCRx Enhancer do chemii BD okazał się sekwencjonować najbardziej spójnie, ze stosunkiem wysokości pików 0,5-0,9 (Tabela 2 i Rysunek 3B). Dodanie samej chemii 10:1 BD:dGTP również poprawiło nieco odczyt, ze stosunkiem wysokości piku 0,5-0,6 (Tabela 2 i Rysunek 3C). Nieoptymalny stosunek wysokości piku dla 10:1 BD:dGTP może być przypisany widocznemu stopniowi w profilu piku sekwencji po regionie struktury drugorzędowej, gdzie sygnał jest zredukowany (Rysunek 3C, strzałka). Zwiększenie zawartości chemii dGTP do 5:1 i 3:1 BD:dGTP lub zastosowanie prostej chemii dGTP zwiększyło stosunek wysokości piku i zmniejszyło nieco stopień (stosunek 0,6 do 0,8). Jednakże mieszana inkorporacja dITP i dGTP skutkowała gorszym poszerzeniem piku wraz ze wzrostem ilości użytego dGTP, a chemia oparta wyłącznie na dGTP powodowała poważną kompresję sekwencji (dane nie pokazane). Najlepsze ogólne wyniki zaobserwowano łącząc razem chemię Betaine plus PCRx i mieszaną 10:1 BD:dGTP. Ta kombinacja zmniejszyła krok z mniejszym poszerzeniem piku i zwiększyła stosunek wysokości piku do 0,9-1,0 (Tabela 2 i Rysunek 3D). ThermoFidelase I, enzym destabilizujący DNA, który jest często używany do poprawy sekwencjonowania genomowego DNA, nie poprawił sekwencjonowania żadnej z trzech spinek do włosów w prostej chemii BD (dane nie pokazane), a w rzeczywistości znacznie zmniejszył stosunek wysokości piku w chemii 10:1 BD:dGTP dla wszystkich trzech konstruktów shRNA, powodując ponowne pojawienie się przystanku w strukturze spinki do włosów (Tabela 2 i Figura 3E).
Podsumowując, połączenie chemii 10:1 BD:GTP, 0,83 M Betainy i 1 × PCRx Enhancer zapewniło optymalne sekwencjonowanie, a mieszane chemie BD:dGTP, Betaina, PCRx Enhancer i DMSO miały pewne pozytywne efekty same w sobie. ThermoFidelase I, jednakże, prawdopodobnie powinna być unikana dla wektorów shRNA z trudną wewnętrzną strukturą drugorzędową.
Korelacja pomiędzy wydajnością shRNA knockdown a opublikowanymi algorytmami projektowania siRNA
Aby określić czy skuteczność knockdown przez wektory shRNA koreluje z opublikowanymi zasadami projektowania efektywnych oligonukleotydów siRNA, oceniano shRNA pod względem ich zdolności do knockdown ekspresji genów. Wektory shRNA były transdukowane stabilnie do ludzkich linii komórkowych THP1 lub Jurkat, jak wyszczególniono w Tabeli 3, pierwsze dwie kolumny. Średni knockdown został określony na podstawie RNA zebranego w trzech lub więcej różnych dniach i jest wymieniony dla każdego shRNA (kolumna 3). Wykazano, że knockdown jest powtarzalny dla linii komórkowych, które były niezależnie transdukowane i sortowane, co sugeruje, że knockdown jest funkcją docelowej sekwencji shRNA, a nie cech transdukcji wirusowej. Więcej niż jedna trzecia skonstruowanych wektorów shRNA nie była w stanie powstrzymać transkrypcji (<10% w kolumnie 3), pomimo porównywalnych wskaźników wzrostu i długotrwałej ekspresji markera GFP na wysokim poziomie w tych liniach komórkowych. Ponadto, duże różnice w skuteczności knockdown dla kilku shRNA skierowanych przeciwko wielu tym samym genom (tj. CLR16.2, CLR19.3 i TLR4) przemawiają przeciwko prostym biologicznym przyczynom różnic w skuteczności dla tych genów. Wiele z nieefektywnych shRNA ma ujemne wartości 5′ ΔΔG i wysoką punktację Reynoldsa, z których każda, jak przypuszczano, koreluje z efektywnością knockdownu siRNA (Tabela 3, kolumny 4 i 5) . I odwrotnie, wśród shRNA, które były zdolne do znokautowania genów, kilka miało albo dodatnie wartości 5’ΔΔG albo niską punktację Reynoldsa. Wyniki te wskazują, że algorytm 5’ΔΔG i Reynolds scoring dla siRNA może nie zapewniać pozytywnych kryteriów korelacyjnych dla projektowania shRNA.
Aby określić, czy inne opublikowane algorytmy projektowania oligonukleotydów siRNA mogą być zastosowane do wektorów shRNA, każde z docelowych miejsc shRNA zostało ocenione przez cztery dodatkowe algorytmy, a wyniki zostały wykreślone w stosunku do procentu knockdown dla każdego shRNA (Tabela 3, kolumny 6-9 i Rys. 4). Dla każdego algorytmu narysowano linię najlepszego dopasowania i obliczono wartość R2 jako wskaźnik tego, czy wariancja w skuteczności knockdown może być wyjaśniona przez punktację algorytmu. Wyniki potwierdzają słaby związek między skutecznością shRNA a rozważaniami na temat 5′ ΔΔG (free energy differential) lub algorytmem Reynoldsa i wsp. oraz wykazują słaby związek z algorytmem Hsieh i wsp. Algorytmy Amarguizoui i wsp. , Ui-Tei i wsp. oraz Takasaki i wsp. korelują bezpośrednio z efektywnością shRNA. Jednakże, żaden z algorytmów nie wyjaśnia istotnego procentu wariancji w skuteczności knockdown. Spośród badanych algorytmów, system punktacji Takasaki i wsp. wykazuje najwyższą korelację, z wartością R2 wynoszącą 0,0251.
Ponieważ te wyniki sugerują, że liniowa zależność nie ma silnego zastosowania do knockdown shRNA dla żadnego z sześciu algorytmów, oceniliśmy każdy z algorytmów poprzez analizę krzywej ROC, aby określić czy któryś z algorytmów jest lepszy od innych w identyfikacji skutecznych shRNA. Krzywa ROC jest wykresem czułości (frakcja prawdziwie pozytywna, TPF) w stosunku do 1 minus specyficzność (frakcja fałszywie pozytywna, FPF), która jest generowana przez zmianę progu decyzyjnego pomiędzy minimalnym i maksymalnym wynikiem algorytmu. Przekątna wykresu ROC przedstawia krzywą ROC dla algorytmu, który nie jest lepszy w dyskryminacji niż wybór losowy. Algorytmy, które są słabymi dyskryminatorami, mają krzywe ROC, które biegną wzdłuż przekątnej i mają pole powierzchni pod krzywą ROC (AUC), które nie różni się znacząco od AUC na przekątnej (0,5). Algorytmy, które są dobrymi dyskryminatorami, mają krzywe ROC z silnym wypukłym odchyleniem od przekątnej i AUC, które zbliżają się do 1 i są znacząco różne od AUC przekątnej.
Algorytm Hsieh et al. miał wklęsłą krzywą ROC (ryc. 5A) wskazującą na niedopuszczalną czułość i specyficzność w odróżnianiu skutecznych od nieskutecznych shRNA. Krzywe ROC dla wszystkich pozostałych algorytmów (ryc. 5B-F) przebiegały w pobliżu przekątnej wykresu ROC i miały AUC, które nie różniły się znacząco od AUC przekątnej (ryc. 5B-F). Tak więc, żaden z algorytmów nie wykazał statystycznie istotnej zdolności do rozróżniania między skutecznymi i nieskutecznymi shRNA.
Algorytm Takasaki i wsp. (Rys. 5F) okazał się najbardziej obiecujący jako dyskryminator skutecznych od nieskutecznych shRNA. Jednakże, algorytm ten cierpiał z powodu stosunkowo wysokiej frakcji fałszywie pozytywnej dla progów decyzyjnych w pobliżu maksymalnego wyniku, na co wskazuje słabe, nieregularne odchylenie od przekątnej w pobliżu początku krzywej ROC (Rys. 5F). Wskazuje to, że algorytm przypisał wysoki wynik do pewnej liczby nieskutecznych shRNA. Inspekcja danych ujawniła, że dwa z trzech wysoko punktowanych nieskutecznych shRNA celowały w geny, których ekspresja została skutecznie znokautowana przez inne shRNA (Tabela 3, gwiazdki). Jest więc mało prawdopodobne, że nieskuteczność shRNA jest konsekwencją presji selekcyjnej przeciwko stabilnej supresji ekspresji genów. Bardziej prawdopodobne jest, że algorytm Takasaki i wsp. nie uwzględnia krytycznej cechy efektywnych shRNA.
Zastosowanie modyfikacji algorytmu w oparciu o stabilność 6 centralnych zasad każdego shRNA
Inspekcja właściwości fizycznych wysoko punktowanych nieskutecznych shRNA ujawniła, że średnia stabilność dupleksu utworzonego przez 6 centralnych zasad shRNA (zasady 6-11 nici sensu zhybrydyzowane z zasadami 9-14 nici antysensu) była większa niż średnia stabilność wysoko punktowanych skutecznych shRNA (ΔG = -13.1 ± 0,1 w porównaniu do -11,1 ± 1 kcal/mol odpowiednio). Na podstawie tej obserwacji zmodyfikowano algorytm Takasaki i wsp. w taki sposób, że shRNA o centralnym dupleksie ΔG równym lub mniejszym od -12,9 kcal/mol otrzymywały minimalną punktację (Tabela 4). Ta modyfikacja przypisała minimalną punktację pięciu shRNA, z których cztery były nieskuteczne, zwiększając w ten sposób specyficzność algorytmu bez znaczącej utraty czułości. Minimalna punktacja przypisana jednemu efektywnemu shRNA (71% knockdown) wskazuje, że inne właściwości, poza stabilnością centralnego dupleksu, wpływają na skuteczność. Niemniej jednak, dodanie tej modyfikacji wyeliminowało słabe, nieregularne odchylenie krzywej ROC od przekątnej dla wysokich progów decyzyjnych i zwiększyło AUC do 0,79 (ryc. 5I). Podobna modyfikacja algorytmów Amarzguioui i wsp. oraz Ui-Tei i wsp. również podniosła AUC ich krzywych ROC (ryc. 5G i 5H). Dzięki tej modyfikacji, AUC krzywych ROC dla wszystkich trzech zmodyfikowanych algorytmów różniły się istotnie od AUC przekątnej (ryc. 5G-I), wskazując na istotną statystycznie zdolność predykcyjną. Różnice między AUC krzywych ROC dla zmodyfikowanych algorytmów nie były istotne, więc na gruncie statystycznym wszystkie trzy zmodyfikowane algorytmy miały taką samą użyteczność. Algorytmy 5′ ΔΔG, Reynolds i wsp. oraz Hsieh i wsp. nie zostały poprawione do statystycznie istotnej zdolności predykcyjnej przez zastosowanie modyfikacji centralnego dupleksu ΔG (dane nie pokazane).
Aby odnieść się do możliwości, że poprawa uzyskana dzięki modyfikacji algorytmów Amarzguioui i wsp., Ui-Tei i wsp. oraz Takasaki i wsp. jest konsekwencją przepasowania naszego zestawu shRNA, analizie poddano niezależny zestaw 38 shRNA zebranych z wcześniejszych publikacji (; Tabela 5). Podczas gdy żadna z krzywych ROC dla trzech niezmodyfikowanych algorytmów nie miała AUC istotnie różniącego się od AUC przekątnej (Amarzguioui i wsp., p = 0,174; Ui-Tei i wsp. p = 0,09; Takasaki i wsp., p = 0,26), wszystkie zmodyfikowane algorytmy dały krzywe ROC z AUC istotnie różniącym się od AUC przekątnej (p = 0,0001-0,009; ryc. 5J-L). Na gruncie statystycznym wszystkie trzy zmodyfikowane algorytmy były jednakowo użyteczne, ponieważ wszystkie AUC krzywych ROC dla zmodyfikowanych algorytmów różniły się istotnie od AUC przekątnej, ale nie różniły się istotnie między sobą. Ta analiza niezależnego zestawu shRNA sugeruje, że modyfikacja algorytmów ma ogólną ważność.
Ponieważ minimalizacja odsetka wyników fałszywie pozytywnych jest głównym problemem w projektowaniu shRNA, zalecamy użycie zmodyfikowanego algorytmu Ui-Tei i wsp. który miał najniższą wysoką frakcję fałszywie pozytywną przy progach decyzyjnych bliskich maksymalnej punktacji, na co wskazuje silne odchylenie od przekątnej w pobliżu początku krzywej ROC (Rys. 5H i 5K). Zastosowanie progu decyzyjnego 3 ogranicza selekcję shRNA do regionu krzywej ROC, w którym czułość była akceptowalna (0,28-,33), podczas gdy specyficzność była bardzo dobra (1,0). Ustalenie tego progu decyzyjnego pozwoliło na zminimalizowanie frakcji fałszywie pozytywnej, przy czym 28 – 33% efektywnych shRNA zostało zidentyfikowanych odpowiednio z naszego shRNA i z opublikowanego zestawu shRNA. W przypadku konieczności zwiększenia czułości, zalecamy zastosowanie progu decyzyjnego równego 2. Próg ten charakteryzował się czułością 0,54 – 0,55 i specyficznością 0,88 – 0,9. W przypadku dalszego obniżenia progu decyzyjnego do 0 czułość wzrosła do 0,86 – 0,9, ale swoistość spadła do 0,55 – 0,54. Zalecamy stosowanie możliwie najwyższego z tych progów decyzyjnych.
Choć statystycznie małe, badanie to ma tę zaletę, że według naszej wiedzy jest największym opublikowanym zestawem 19-merowych shRNA do tej pory. Ponadto, w przeciwieństwie do innych badań nad shRNA, które z konieczności są ukierunkowane na skuteczne shRNA, nasze badanie obejmuje zarówno funkcjonalne, jak i niefunkcjonalne shRNA. Wykazaliśmy, że zmodyfikowane algorytmy Ui-Tei et al., Amarzguioui et al. oraz Takasaki et al. są dobrymi narzędziami predykcyjnymi, które odróżniają efektywne od nieefektywnych shRNA. Jednakże, w zmodyfikowanych algorytmach nadal występują istotne niedociągnięcia. Bezpośrednia ocena modyfikacji algorytmów przy użyciu shRNA zaprojektowanych zgodnie z każdym z oryginalnych i zmodyfikowanych algorytmów potwierdziłaby te wnioski. Algorytmy te mają na celu zmniejszenie liczby fałszywie dodatnich shRNA, a nie całkowite ich wyeliminowanie, a zatem wymagałoby to dużej liczby shRNA, aby uzyskać statystycznie istotną różnicę w odsetku fałszywie dodatnich. Dostępność większych zbiorów danych shRNA powinna pomóc w opracowaniu algorytmów o zwiększonej czułości i specyficzności. Dodatkowo, kilka programów komputerowych do projektowania oligonukleotydów siRNA, które nie były brane pod uwagę w tym badaniu, może być użytecznych w projektowaniu shRNA. Kryteria projektowania funkcjonalnych oligonukleotydów siRNA pozostają kontrowersyjne, o czym świadczy duża liczba badań wciąż opracowywanych na potrzeby projektowania siRNA, a ponieważ nie badaliśmy tych sekwencji jako siRNA, nie można ustalić, czy modyfikacja tych algorytmów ma również zastosowanie w kontekście oligonukleotydów siRNA. shRNA ma dodatkową warstwę złożoności w porównaniu z oligonukleotydami siRNA, ponieważ szpilka do włosów musi być przetwarzana w komórce przed wejściem do kompleksu RISC. Ponadto, selektywna presja przeciwko stabilnej ekspresji shRNA, które są szkodliwe dla wzrostu komórek, powinna stanowić dodatkowe ograniczenie dla stabilnej ekspresji niektórych shRNA. Pomimo tych zawiłości, nasze odkrycia zaczynają wnosić wgląd w możliwość zastosowania algorytmów siRNA do projektowania funkcjonalnych shRNA.