Pro řešení otázky, jak sekvence shRNA koreluje s účinností knockdownu, bylo navrženo a zkonstruováno 27 vektorů shRNA z 11 různých genů (tabulka 1). Cílové sekvence byly vybrány v kódující oblasti každého genu a byly navrženy tak, aby rámcově odpovídaly seminárním studiím sekvenčních vlastností pro účinnost siRNA oligomerů . V souladu s tím mají sekvence nízký počet běhů a poměr G/C přibližně 50 %. ShRNA byly navrženy tak, aby cílily na místa, která jsou zbavena jednonukleotidových polymorfismů, a odpovídají všem sestřihovým variantám amplifikovaným našimi sadami primerů PCR v reálném čase.
Protože siRNA mohou mít účinky mimo cíl, je pro funkční testy důležité vytvořit jako kontrolu specifického mutanta s jednou nebo více neshodami bází v cílovém rozpoznávacím místě . Abychom ušetřili čas a náklady, vyvinuli jsme metodu současné výroby divokého typu a mutantních vektorů shRNA (podrobně popsáno v Metodách a na obrázku 1). Výsledky vyřazení genů pro čtyři páry divoký typ/mutantní shRNA jsou uvedeny na obrázku 2. Tyto výsledky ukazují užitečnost této metody při poskytování bodového mutantního vektoru shRNA, který může sloužit jako kontrola ztráty funkce pro vyřazení genu pomocí shRNA divokého typu. Ačkoli byly publikovány podrobné protokoly pro konstrukci vektorů shRNA , toto je první protokol pro výrobu divokého typu a mutantních vektorů současně a měl by usnadnit zavedení vysoce kontrolovaného systému pro shRNA.
Strategie pro přesné sekvenování pomocí vlásenkových struktur
Ověření sekvence vlásenky shRNA je nezbytné, protože neshoda i jednoho nukleotidu v cílové sekvenci může zrušit knockdown (Obrázek 2 a .) Problém, se kterým se často setkáváme při přípravě vektorů shRNA, spočívá v tom, že mnohé z nich je obtížné sekvenovat kvůli vnitřní sekundární struktuře vlásenky. Jedna ze strategií, která byla nedávno navržena k překonání tohoto problému, zahrnuje vytvoření restrikčního místa v oblasti smyčky/stonku vlásenky, aby se fyzicky oddělily invertované repetice trávením, a následné sestavení sekvence pomocí sense a antisense primerů. Schopnost dosáhnout sekvenování konstruktů shRNA bez modifikace sekvence kmene/smyčky by však byla jednoznačnou výhodou. Abychom se touto možností zabývali, hodnotili jsme modifikované sekvenační reakce pro zlepšení čtení sekundární struktury vlásenky u tří vlásenek shRNA. Modifikace zahrnují přidání činidel, o nichž je známo, že uvolňují strukturu DNA, včetně DMSO, betainu, PCRx Enhancer a ThermoFidelase I; a přidání rostoucího množství dGTP BigDye terminátoru (dGTP) ke standardní BigDye v1.1 (BD) chemii, která obsahuje dITP místo dGTP.
Výsledky sekvenování pro každý ze tří DNA konstruktů jsou shrnuty v tabulce 2. Přečtení vlásenkové struktury bylo měřeno jako poměr výšky píku asi 300 bází za vlásenkovou strukturou a signálu asi 50 bází před vlásenkovou strukturou. Poměr 1 znamená, že nedošlo ke ztrátě signálu, a 0 znamená úplnou ztrátu čtení. Při absenci jakéhokoli aditiva k BD chemii způsobil vlásenka snížení poměru výšky píku u našeho méně těsně strukturovaného vlásenky, pHSPG-shmutTLR4, na 0,4 a úplnou ztrátu čtení u ostatních dvou plazmidů. To lze vizualizovat jako náhlé zastavení v profilu sekvenčního píku pro pHSPG-shTLR4 (obrázek 3A).
Zprostředkovatelé relaxace DNA, 5 % DMSO, 0,83 M Betain a 1 × PCRx Enhancer, každý z nich výrazně zlepšil čtení sekvence u některých konstruktů. Bylo však zjištěno, že přidání 0,83 M betainu plus 1 × PCRx Enhancer k chemii BD má nejkonzistentnější sekvenaci s poměrem výšky píku 0,5-0,9 (tabulka 2 a obrázek 3B). Přidání samotné chemie BD:dGTP v poměru 10:1 rovněž poněkud zlepšilo čtení s poměrem výšky píku 0,5-0,6 (tabulka 2 a obrázek 3C). Neoptimální poměr výšky píku pro 10:1 BD:dGTP lze přičíst viditelnému kroku v profilu píku sekvence za oblastí sekundární struktury, kde je signál snížen (obrázek 3C, šipka). Zvýšení obsahu chemie dGTP na 5:1 a 3:1 BD:dGTP nebo použití přímé chemie dGTP zvýšilo poměr výšky píku a poněkud snížilo krok (poměr 0,6 až 0,8). Smíšená inkorporace dITP a dGTP však vedla k horšímu rozšíření píku s rostoucím množstvím použitého dGTP , a chemie pouze s dGTP způsobila silnou kompresi sekvence (údaje nejsou uvedeny). Nejlepší celkové výsledky byly pozorovány při kombinaci betainu plus PCRx a směsné chemie 10:1 BD:dGTP dohromady. Tato kombinace snížila krok s menším rozšířením píků a zvýšila poměry výšek píků na 0,9-1,0 (tabulka 2 a obrázek 3D). ThermoFidelase I, enzym destabilizující DNA, který se často používá ke zlepšení sekvenování genomové DNA , nezlepšil sekvenování žádného ze tří vlásenek v přímé BD chemii (údaje nejsou uvedeny) a ve skutečnosti výrazně snížil poměr výšky píku v chemii 10:1 BD:dGTP pro všechny tři konstrukty shRNA, což způsobilo opětovný výskyt zastávky na vlásenkové struktuře (tabulka 2 a obrázek 3E).
Shrnem lze říci, že kombinace chemie 10:1 BD:GTP, 0,83 M betainu a 1× PCRx Enhancer poskytovala optimální sekvenaci a smíšené chemie BD:dGTP, betain, PCRx Enhancer a DMSO měly každý sám o sobě určité pozitivní účinky. ThermoFidelase I by se však pravděpodobně měla vyhnout vektorům shRNA s obtížnou vnitřní sekundární strukturou.
Pro zjištění, zda účinnost knockdownu vektory shRNA koreluje s publikovanými pravidly pro návrh účinných siRNA oligonukleotidů, byly shRNA hodnoceny z hlediska jejich schopnosti knockdownu genové exprese. ShRNA byly stabilně transdukovány do lidských buněčných linií THP1 nebo Jurkat, jak je podrobně uvedeno v tabulce 3, první dva sloupce. Průměrný knockdown byl stanoven z RNA odebrané ve třech nebo více různých dnech a je uveden pro každou shRNA (sloupec 3). Ukázalo se, že knockdown je reprodukovatelný u buněčných linií, které byly nezávisle transdukovány a tříděny, což naznačuje, že knockdown je spíše funkcí cílové sekvence shRNA než vlastností virové transdukce. Více než třetina zkonstruovaných vektorů shRNA nebyla schopna potlačit transkripci (<10 % ve sloupci 3), a to navzdory srovnatelné rychlosti růstu a dlouhodobé expresi markeru GFP na vysokých úrovních v těchto buněčných liniích. Navíc velké rozdíly v účinnosti knockdownu u několika shRNA vyrobených proti mnoha stejným genům (tj. CLR16.2, CLR19.3 a TLR4) svědčí proti jakýmkoli jednoduchým biologickým důvodům rozdílů v účinnosti těchto genů. Mnohé z neúčinných shRNA mají záporné hodnoty 5′ ΔΔG a vysoké Reynoldsovo skóre, o nichž se předpokládalo, že korelují s účinností siRNA knockdown (tabulka 3, sloupce 4 a 5) . Naopak mezi shRNA, které byly schopny vyřadit gen, mělo několik z nich buď pozitivní hodnoty 5’ΔΔG, nebo nízké Reynoldsovo skóre. Tato zjištění naznačují, že 5’ΔΔG a Reynoldsův skórovací algoritmus pro siRNA nemusí poskytovat pozitivní korelační kritéria pro návrh shRNA.
Aby se zjistilo, zda lze na vektory shRNA použít i další publikované algoritmy pro návrh siRNA oligonukleotidů, bylo každé z cílových míst shRNA hodnoceno čtyřmi dalšími algoritmy a skóre bylo vyneseno do grafu v porovnání s procentem knockdownu pro každou shRNA (tab. 3, sloupce 6-9 a obr. 4). Pro každý graf algoritmu byla nakreslena přímka nejlepší shody a vypočtena hodnota R2 jako ukazatel toho, zda lze rozptyl v účinnosti knockdownu vysvětlit bodováním algoritmu. Výsledky potvrzují slabou souvislost mezi účinností shRNA a úvahami o 5′ ΔΔG (rozdíl volné energie) nebo algoritmem Reynoldse a spol. a také ukazují slabou souvislost s algoritmem Hsieh a spol. a každý z nich ve skutečnosti vykazuje slabou opačnou korelaci s údaji. Algoritmy Amarguizoui et al. , Ui-Tei et al. a Takasaki et al. přímo korelují s účinností shRNA. Skóre žádného z algoritmů však nevysvětluje významné procento rozptylu účinnosti knockdownu. Z testovaných algoritmů vykazuje nejvyšší asociaci skórovací systém Takasakiho et al. s hodnotou R2 0,0251.
Protože tyto výsledky naznačují, že lineární vztah se silně nevztahuje na knockdown shRNA pro žádný ze šesti algoritmů, vyhodnotili jsme každý z algoritmů pomocí analýzy křivky ROC, abychom určili, zda je některý algoritmus lepší než ostatní při identifikaci účinných shRNA. Křivka ROC je graf citlivosti (podíl pravdivě pozitivních výsledků, TPF) versus 1 minus specificita (podíl falešně pozitivních výsledků, FPF), který vzniká změnou rozhodovacího prahu mezi minimálním a maximálním skóre algoritmu. Diagonála grafu ROC představuje křivku ROC pro algoritmus, který není v diskriminaci lepší než náhodný výběr. Algoritmy, které jsou špatnými diskriminátory, mají křivky ROC vedené po diagonále a mají plochu pod křivkou ROC (AUC), která se výrazně neliší od AUC diagonály (0,5). Algoritmy, které jsou dobrými diskriminátory, mají křivky ROC se silnou konvexní odchylkou od diagonály a AUC, která se blíží 1 a významně se liší od AUC diagonály.
Algoritmus Hsieh et al. měl konkávní křivku ROC (obr. 5A), což naznačuje nepřijatelnou citlivost a specifičnost při rozlišování účinných a neúčinných shRNA. Křivky ROC všech ostatních algoritmů (obr. 5B-F) se pohybovaly v blízkosti diagonály grafu ROC a měly AUC, které se významně nelišily od AUC diagonály (obr. 5B-F). Žádný z algoritmů tedy nevykazoval statisticky významnou schopnost rozlišovat mezi účinnými a neúčinnými shRNA.
Agoritmus Takasakiho a spol. (obr. 5F) se ukázal jako nejslibnější rozlišovač účinných a neúčinných shRNA. Tento algoritmus však trpěl relativně vysokým podílem falešně pozitivních výsledků pro rozhodovací prahy v blízkosti maximálního skóre, jak naznačuje slabá, nepravidelná odchylka od diagonály v blízkosti počátku křivky ROC (obr. 5F). To naznačuje, že algoritmus přiřadil vysoké skóre řadě neúčinných shRNA. Kontrola dat odhalila, že dvě ze tří neúčinných shRNA s vysokým počtem bodů byly zaměřeny na geny, jejichž exprese byla úspěšně sražena jinými shRNA (tab. 3, hvězdičky). Je tedy nepravděpodobné, že by neúčinnost shRNA byla důsledkem selekčního tlaku proti stabilnímu potlačení genové exprese. Je pravděpodobnější, že algoritmus Takasakiho a spol. nezohledňuje kritickou vlastnost účinných shRNA.
Použití modifikace algoritmu založené na stabilitě 6 centrálních bází každé shRNA
Inspekce fyzikálních vlastností vysoce skórujících neúčinných shRNA odhalila, že průměrná stabilita duplexu tvořeného 6 centrálními bázemi shRNA (báze 6-11 smysluplného řetězce hybridizované s bázemi 9-14 protismyslného řetězce) byla vyšší než průměrná stabilita vysoce skórujících účinných shRNA (ΔG = -13).1 ± 0,1 oproti -11,1 ± 1 kcal/mol). Na základě tohoto pozorování byl algoritmus Takasakiho a kol. upraven tak, že shRNA s ΔG centrálního duplexu rovnou nebo nižší než -12,9 kcal/mol bylo přiřazeno minimální skóre (tabulka 4). Tato úprava přidělila minimální skóre pěti shRNA, z nichž čtyři byly neúčinné, čímž se zvýšila specifičnost algoritmu bez významné ztráty citlivosti. Minimální skóre přidělené jedné účinné shRNA (71% knockdown) naznačuje, že kromě stability centrálního duplexu ovlivňují účinnost i další vlastnosti. Nicméně přidání této úpravy odstranilo slabou nepravidelnou odchylku křivky ROC od diagonály pro vysoké rozhodovací prahy a zvýšilo AUC na 0,79 (obr. 5I). Podobná modifikace algoritmů Amarzguioui et al. a Ui-Tei et al. rovněž zvýšila AUC jejich křivek ROC (obr. 5G a 5H). Díky této modifikaci se AUC křivek ROC u všech tří modifikovaných algoritmů významně lišily od AUC diagonály (obr. 5G-I), což svědčí o statisticky významné prediktivní schopnosti. Rozdíly mezi AUC křivek ROC pro modifikované algoritmy nebyly významné, takže ze statistického hlediska měly všechny tři modifikované algoritmy stejnou užitečnost. Algoritmy 5′ ΔΔG, Reynolds et al. a Hsieh et al. se použitím modifikace ΔG centrálního duplexu nezlepšily na statisticky významnou prediktivní schopnost (údaje nejsou uvedeny).
Abychom se zabývali možností, že zlepšení dosažené modifikací algoritmů Amarzguioui et al, Ui-Tei et al a Takasaki et al je důsledkem nadměrného přizpůsobení našeho souboru shRNA, byl analýze podroben nezávislý soubor 38 shRNA sdružených z předchozích publikací (; tabulka 5). Zatímco žádná z křivek ROC pro tři nemodifikované algoritmy neměla AUC významně odlišnou od diagonály (Amarzguioui et al., p = 0,174; Ui-Tei et al. p = 0,09; Takasaki et al., p = 0,26), všechny modifikované algoritmy poskytly křivky ROC s AUC významně odlišnou od AUC diagonály (p = 0,0001-0,009; obr. 5J-L). Ze statistického hlediska byly všechny tři modifikované algoritmy stejně užitečné, protože AUC křivek ROC pro modifikované algoritmy se všechny významně lišily od AUC diagonály, ale vzájemně se významně nelišily. Tato analýza nezávislého souboru shRNA naznačuje, že modifikace algoritmů má obecnou platnost.
Protože při návrhu shRNA jde především o minimalizaci míry falešně pozitivních výsledků, doporučujeme používat modifikovaný algoritmus Ui-Tei et al. algoritmu, který měl nejnižší vysoký podíl falešně pozitivních výsledků při prahových hodnotách rozhodování blízko maximálního skóre, jak naznačuje silná odchylka od diagonály v blízkosti počátku křivky ROC (obr. 5H a 5K). Použití rozhodovacího prahu 3 omezuje výběr shRNA na oblast křivky ROC, kde byla citlivost přijatelná (0,28-,33), zatímco specificita byla velmi dobrá (1,0). Nastavením tohoto rozhodovacího prahu byla minimalizována falešně pozitivní frakce, přičemž bylo identifikováno 28-33 % účinných shRNA z našich shRNA, resp. z publikovaného souboru shRNA. Pokud by bylo nutné zvýšit citlivost, doporučujeme použít rozhodovací práh 2. Tento práh měl citlivost 0,54 – 0,55 a specifičnost 0,88 – 0,9. V případě, že by bylo nutné zvýšit citlivost, doporučujeme použít rozhodovací práh 1. Pokud by se rozhodovací práh dále zmírnil na 0, citlivost by se zvýšila na 0,86 – 0,9, ale specificita by klesla na 0,55 – 0,54. Doporučujeme použít co nejvyšší z těchto rozhodovacích prahů.
Ačkoli je tato studie statisticky malá, má podle našich znalostí tu výhodu, že se jedná o dosud největší publikovaný soubor shRNA na bázi 19-merů. Navíc na rozdíl od jiných studií shRNA, které jsou nutně zkreslené směrem k účinným shRNA, naše studie zahrnuje jak funkční, tak nefunkční shRNA. Ukázali jsme, že modifikované algoritmy Ui-Tei et al., Amarzguioui et al. a Takasaki et al. jsou přiměřené až dobré prediktivní nástroje, které rozlišují účinné a neúčinné shRNA. V modifikovaných algoritmech však stále existují významné nedostatky. Přímé posouzení modifikací algoritmů pomocí shRNA navržených podle jednotlivých původních a modifikovaných algoritmů by tato zjištění podpořilo. Tyto algoritmy mají snížit počet vybraných falešně pozitivních shRNA, nikoliv je zcela eliminovat, a proto by to vyžadovalo velký počet shRNA, aby se dosáhlo statisticky významného rozdílu v míře falešně pozitivních výsledků. Dostupnost větších souborů dat shRNA by měla podpořit vývoj algoritmů s lepší citlivostí a specifičností. Kromě toho může být při navrhování shRNA užitečných několik softwarových aplikací pro návrh siRNA oligonukleotidů, které nebyly v této studii zvažovány . Kritéria pro navrhování funkčních siRNA oligonukleotidů zůstávají kontroverzní, o čemž svědčí velký počet studií, které jsou stále vyvíjeny pro navrhování siRNA, a protože jsme tyto sekvence netestovali jako siRNA, nelze stanovit, zda se modifikace těchto algoritmů uplatní také v kontextu siRNA oligonukleotidů. shRNA má oproti siRNA oligonukleotidům další vrstvu složitosti, protože vlásenka musí být před vstupem do komplexu RISC zpracována v buňce. Kromě toho se očekává, že selekční tlak proti stabilní expresi shRNA, které jsou škodlivé pro růst buněk, bude představovat další omezení pro stabilní expresi určitých shRNA. Navzdory těmto složitostem naše zjištění začínají přinášet poznatky o možnosti použití siRNA algoritmů pro návrh funkčních shRNA.
.