Utformning och beredning av shRNA-plasmider
För att besvara frågan om hur shRNA-sekvensen korrelerar med knockdown-effektiviteten utformades och konstruerades 27 shRNA-vektorer från 11 olika gener (tabell 1). Målsekvenser valdes ut i den kodande regionen för varje gen och utformades för att i stort sett överensstämma med de banbrytande studierna av sekvensegenskaper för siRNA-oligomers effektivitet . Sekvenserna har följaktligen få löpningar och ett G/C-förhållande på cirka 50 %. ShRNA:erna utformades för att rikta in sig på platser som saknar polymorfismer av enskilda nukleotider och motsvarar alla splicevarianter som amplifieras av våra realtids-PCR-primerset.
Då siRNA:er kan ha off target-effekter är det viktigt för funktionella analyser att göra en specifik mutant med en eller flera basmissmatchningar inom måligenkänningsstället som en kontroll . För att spara tid och kostnader har vi utvecklat en metod för att göra vildtyp och mutant shRNA-vektorer samtidigt (se metodbeskrivning och figur 1). Resultaten av gen-nockdown för fyra vildtyp/mutant shRNA-par visas i figur 2. Dessa resultat visar att denna metod är användbar för att tillhandahålla en punktmutant shRNA-vektor som kan fungera som en förlust av funktionskontroll för nedsättning av gener med hjälp av shRNA av vildtyp. Även om detaljerade protokoll har publicerats för konstruktion av shRNA-vektorer , är detta det första protokollet för att producera vildtyp- och mutantvektorer samtidigt och bör underlätta genomförandet av högt kontrollerade system för shRNA.
Strategi för noggrann sekvensering genom hårnålsstrukturer
Verifiering av sekvensen av en shRNA-hårnål är väsentlig, eftersom felmatchning av ens en nukleotid inom målsekvensen kan upphäva knockdown (Figur 2 och .) Ett problem som ofta uppstår vid framställningen av shRNA-vektorer är att många är svåra att sekvensera på grund av hårnålens inneboende sekundärstruktur. En strategi som nyligen föreslagits för att lösa detta problem innebär att man konstruerar en restriktionsplats i hårnålens slinga/stamregion för att fysiskt separera de inverterade upprepningarna genom digestion och sedan sätta ihop sekvensen med hjälp av sense- och antisenseprimers . Det skulle dock vara en klar fördel att kunna sekvensera shRNA-konstruktioner utan att ändra stam/loop-sekvensen. För att ta itu med denna möjlighet utvärderade vi modifierade sekvenseringsreaktioner för att förbättra genomläsningen av hårnålens sekundärstruktur i tre shRNA-hårnålar. Modifieringarna omfattar tillsättning av medel som är kända för att slappna av DNA-strukturen, inklusive DMSO, Betain, PCRx Enhancer och ThermoFidelase I; och tillsättning av ökande mängder dGTP BigDye terminator (dGTP) kemi till standard BigDye v1.1 (BD) kemi som innehåller dITP i stället för dGTP.
Sequenceringsresultat för var och en av de tre DNA-konstruktionerna sammanfattas i tabell 2. Läsning av hårnålsstrukturen mättes som förhållandet mellan topphöjden cirka 300 baser efter hårnålsstrukturen och signalen cirka 50 baser före hårnålsstrukturen. Ett förhållande på 1 indikerar ingen signalförlust och 0 indikerar fullständig förlust av genomläsning. I avsaknad av någon tillsats till BD-kemin orsakade hårnålen en minskning av förhållandet mellan topphöjden för vår mindre tätt strukturerade hårnål, pHSPG-shmutTLR4, till 0,4, och en fullständig förlust av genomläsning för de andra två plasmiderna. Detta kan visualiseras som ett abrupt stopp i sekvensens toppprofil för pHSPG-shTLR4 (figur 3A).
Av de DNA-avslappnande medlen förbättrade 5 % DMSO, 0,83 M Betain och 1 × PCRx Enhancer var och en sekvensavläsningen avsevärt för vissa konstruktioner. Tillsatsen av 0,83 M Betain plus 1 × PCRx Enhancer till BD-kemi visade sig dock sekvensera mest konsekvent, med topphöjdsförhållanden på 0,5-0,9 (tabell 2 och figur 3B). Tillsatsen av enbart 10:1 BD:dGTP-kemikalier förbättrade också läsningen något, med topphöjdsförhållanden på 0,5-0,6 (tabell 2 och figur 3C). Det suboptimala topphöjdsförhållandet för 10:1 BD:dGTP kan tillskrivas ett synligt steg i sekvensens toppprofil efter sekundärstrukturområdet där signalen minskar (figur 3C, pil). Genom att öka dGTP-kemiinnehållet till 5:1 och 3:1 BD:dGTP eller genom att använda ren dGTP-kemi ökade topphöjdsförhållandet och minskade steget något (förhållandet 0,6-0,8). Blandad inkorporering av dITP och dGTP resulterade dock i värre toppbreddning när mängden dGTP som användes ökade , och enbart dGTP-kemi orsakade allvarliga sekvenskompressioner (data visas inte). De bästa övergripande resultaten observerades genom att kombinera Betaine plus PCRx och blandade kemier 10:1 BD:dGTP tillsammans. Denna kombination minskade steget med mindre toppbreddning och ökade topphöjdsförhållandena till 0,9-1,0 (tabell 2 och figur 3D). ThermoFidelase I, ett DNA-destabiliserande enzym som ofta används för att förbättra sekvenseringen av genomiskt DNA , förbättrade inte sekvenseringen av någon av de tre hårnålarna i ren BD-kemi (data visas inte) och minskade faktiskt topphöjdsförhållandet avsevärt i 10:1 BD:dGTP-kemi för alla tre shRNA-konstruktioner, vilket ledde till att ett stopp återkom vid hårnålsstrukturen (tabell 2 och figur 3E).
Sammanfattningsvis gav kombinationen av 10:1 BD:GTP-kemikalier, 0,83 M Betain och 1 × PCRx Enhancer optimal sekvensering, och blandade BD:dGTP-kemikalier, Betain, PCRx Enhancer och DMSO hade var och en för sig vissa positiva effekter. ThermoFidelase I bör dock troligen undvikas för shRNA-vektorer med svår inneboende sekundärstruktur.
Korrelation mellan shRNA:s knockdown-effektivitet och publicerade algoritmer för siRNA-design
För att avgöra om effektiviteten av knockdown av shRNA-vektorer korrelerar med publicerade regler för utformning av effektiva siRNA-oligonukleotider utvärderades shRNA:erna för deras förmåga att knockdowna genuttryck. ShRNA:erna transducerades stabilt i antingen THP1- eller Jurkat-cellinjer av människa enligt tabell 3, de två första kolumnerna. Den genomsnittliga knockdown-värdet bestämdes från RNA som samlats in under tre eller flera olika dagar och anges för varje shRNA (kolumn 3). Knockdown visade sig vara reproducerbar för cellinjer som transducerades och sorterades oberoende av varandra, vilket tyder på att knockdown är en funktion av shRNA-målsekvensen snarare än egenskaper hos den virala transduktionen . Mer än en tredjedel av de konstruerade shRNA-vektorerna kunde inte undertrycka transkriptionen (<10 % i kolumn 3), trots jämförbara tillväxthastigheter och långtidsuttryck av GFP-markören på höga nivåer i dessa cellinjer. Dessutom talar stora variationer i knockdown-effekt för flera shRNA-vektorer som tillverkats mot många av samma gener (dvs. CLR16.2, CLR19.3 och TLR4) mot att det finns enkla biologiska orsaker till skillnaderna i effektivitet för dessa gener. Många av de ineffektiva shRNA:erna har negativa 5’ΔΔG-värden och hög Reynolds-scoring, vilka båda har antagits korrelera med siRNA:s knockdown-effektivitet (tabell 3, kolumnerna 4 och 5) . Omvänt hade flera av de shRNA:er som kunde ge en genknockdown antingen positiva 5’ΔΔG-värden eller låga Reynoldsvärden. Dessa resultat tyder på att 5’ΔΔG och Reynolds poängsättningsalgoritmen för siRNA kanske inte ger positiva korrelativa kriterier för shRNA-design.
För att avgöra om andra publicerade algoritmer för siRNA-oligonukleotiddesign kan tillämpas på shRNA-vektorer utvärderades var och en av shRNA-målplatserna av ytterligare fyra algoritmer och poängen plottades mot den procentuella knockdown-effekten för varje shRNA (tabell 3, kolumnerna 6-9 och fig. 4). För varje algoritm ritades en linje med bästa anpassning och R2-värdet beräknades som en indikation på om variationen i knockdown-effekt kan förklaras av algoritmens poängsättning. Resultaten bekräftar att det finns ett dåligt samband mellan shRNA-effektiviteten och antingen 5′ ΔΔG-överväganden (differential av fri energi) eller Reynolds et al.-algoritmen , och visar också ett dåligt samband med Hsieh et al.-algoritmen , där båda algoritmerna i själva verket uppvisar en svag omvänd korrelation med uppgifterna. Algoritmerna från Amarguizoui et al. , Ui-Tei et al. och Takasaki et al. korrelerar direkt med shRNA-effekten. Ingen av algoritmens resultat förklarar dock en betydande procentandel av variationen i knockdown-effekt. Bland de testade algoritmerna visar Takasaki et al:s poängsystem det högsta sambandet, med ett R2-värde på 0,0251.
Eftersom dessa resultat tyder på att ett linjärt samband inte är starkt tillämpligt på shRNA-knockdown för någon av de sex algoritmerna, utvärderade vi var och en av algoritmerna med hjälp av en ROC-kurvanalys för att avgöra om någon algoritm är överlägsen de andra när det gäller att identifiera effektiva shRNA:er. ROC-kurvan är en plott av känsligheten (den sant positiva fraktionen, TPF) mot 1 minus specificiteten (den falskt positiva fraktionen, FPF) som genereras genom att variera beslutströskeln mellan den lägsta och högsta algoritmpoängen. Diagonalen i ROC-plotten representerar ROC-kurvan för en algoritm som inte är bättre på diskriminering än slumpmässigt urval. Algoritmer som är dåliga diskriminatorer har ROC-kurvor som följer diagonalen och har en area under ROC-kurvan (AUC) som inte skiljer sig nämnvärt från AUC för diagonalen (0,5). Algoritmer som är bra diskriminatorer har ROC-kurvor med stark konvex avvikelse från diagonalen och AUC som närmar sig 1 och skiljer sig signifikant från diagonalens AUC.
Hsieh et al:s algoritm hade en konkav ROC-kurva (fig. 5A) som indikerar oacceptabel känslighet och specificitet när det gäller att särskilja effektiva från ineffektiva shRNA:er. ROC-kurvorna för alla andra algoritmer (fig. 5B-F) låg nära diagonalen i ROC-plotten och hade AUC som inte skiljde sig signifikant från AUC för diagonalen (fig. 5B-F). Ingen av algoritmerna visade således en statistiskt signifikant förmåga att skilja mellan effektiva och ineffektiva shRNA:s.
Algoritmen från Takasaki m.fl. (fig. 5F) var den mest lovande algoritmen för att särskilja effektiva från ineffektiva shRNAs. Denna algoritm led dock av en relativt hög andel falskt positiva för beslutströsklar nära den maximala poängen, vilket indikeras av den svaga, oregelbundna avvikelsen från diagonalen nära ROC-kurvans ursprung (fig. 5F). Detta tyder på att algoritmen tilldelade ett antal ineffektiva shRNAs en hög poäng. Inspektion av data avslöjade att två av de tre ineffektiva shRNA:erna med hög poäng var riktade mot gener vars uttryck framgångsrikt slogs ned av andra shRNA:er (tabell 3, asterisker). Det är således osannolikt att shRNA:s ineffektivitet är en följd av ett selektivt tryck mot ett stabilt undertryckande av genuttryck. Det är mer troligt att Takasaki et al:s algoritm inte tar hänsyn till en kritisk egenskap hos effektiva shRNA:er.
Användning av en algoritmändring baserad på stabiliteten hos de 6 centrala baserna i varje shRNA
Inspektion av de fysikaliska egenskaperna hos de ineffektiva shRNA:s med höga poäng visade att den genomsnittliga stabiliteten hos duplexen som bildas av de 6 centrala baserna i shRNA:s (baserna 6-11 i sense-strängen som hybridiseras med baserna 9-14 i antisense-strängen) var större än den genomsnittliga stabiliteten hos effektiva shRNA:s med höga poäng (ΔG = -13.1 ± 0,1 jämfört med -11,1 ± 1 kcal/mol). Baserat på denna observation modifierades Takasaki et al:s algoritm så att shRNAs med en central duplex ΔG som är lika med eller mindre än -12,9 kcal/mol tilldelades en minimipoäng (tabell 4). Denna ändring gav minimipoäng till fem shRNA:er, varav fyra var ineffektiva, vilket ökade algoritmens specificitet utan en betydande förlust av känslighet. En minimipoäng som tilldelades ett effektivt shRNA (71 % knockdown) tyder på att andra egenskaper än central duplexstabilitet påverkar effektiviteten. Genom att lägga till denna modifiering eliminerades dock ROC-kurvans svaga erratiska avvikelse från diagonalen för höga beslutströsklar och AUC ökade till 0,79 (fig. 5I). Liknande modifiering av Amarzguioui et al. och Ui-Tei et al. algoritmerna höjde också AUC för deras ROC-kurvor (fig. 5G och 5H). Med denna modifiering var AUC för ROC-kurvorna för alla tre modifierade algoritmer signifikant annorlunda än AUC för diagonalen (fig. 5G-I), vilket tyder på statistiskt signifikant prediktionsförmåga. Skillnaderna mellan ROC-kurvernas AUC för de modifierade algoritmerna var inte signifikanta, så på statistiska grunder var alla tre modifierade algoritmer lika användbara. Algoritmerna 5′ ΔΔG, Reynolds et al. och Hsieh et al. förbättrades inte till en statistiskt signifikant prediktiv förmåga genom att tillämpa den centrala duplex ΔG-modifieringen (data visas inte).
För att ta itu med möjligheten att den förbättring som uppnåddes genom ändringen av Amarzguioui et al, Ui-Tei et al och Takasaki et al algoritmerna är en följd av att vår uppsättning shRNA:er har anpassats för mycket, gjordes en analys av en oberoende uppsättning med 38 shRNA:er som samlats in från tidigare publikationer (; tabell 5). Medan ingen av ROC-kurvorna för de tre icke-modifierade algoritmerna hade en AUC som skiljde sig signifikant från diagonalens AUC (Amarzguioui et al., p = 0,174; Ui-Tei et al. p = 0,09; Takasaki et al., p = 0,26), gav alla de modifierade algoritmerna ROC-kurvor med AUC som skiljde sig signifikant från diagonalens AUC (p = 0,0001-0,009; fig. 5J-L). På statistiska grunder var alla tre modifierade algoritmer lika användbara, eftersom AUC för ROC-kurvorna för de modifierade algoritmerna alla skiljde sig signifikant från diagonalens AUC, men inte signifikant från varandra. Denna analys av en oberoende uppsättning shRNAs tyder på att modifieringen av algoritmerna har allmän giltighet.
Då minimering av den falskt positiva frekvensen är det primära problemet vid utformning av shRNAs, rekommenderar vi att man använder den modifierade Ui-Tei et al. algoritmen, som hade den lägsta höga falskt positiva fraktionen vid beslutströsklar nära den maximala poängen, vilket indikeras av den starka avvikelsen från diagonalen nära ROC-kurvans ursprung (fig. 5H och 5K). Användning av en beslutströskel på 3 begränsar urvalet av shRNAs till ett område av ROC-kurvan där känsligheten var acceptabel (0,28-.33), medan specificiteten var mycket god (1,0). Genom att fastställa denna beslutströskel minimerades den falskt positiva fraktionen, samtidigt som 28-33 % av de effektiva shRNA:erna identifierades från våra shRNA:er respektive den publicerade uppsättningen shRNA:er. Om känsligheten skulle behöva ökas rekommenderar vi att man använder en beslutströskel på 2. Denna tröskel hade en känslighet på 0,54 – 0,55 och en specificitet på 0,88 – 0,9. Om beslutströskeln sänktes ytterligare till 0 ökade känsligheten till 0,86 – 0,9, men specificiteten sjönk till 0,55 – 0,54. Vi rekommenderar att man använder den högsta möjliga av dessa beslutströsklar.
Och även om studien är statistiskt sett liten har den här studien den fördelen, såvitt vi vet, att den är den största publicerade uppsättningen av 19-mer-baserade shRNAs hittills. Till skillnad från andra shRNA-studier som nödvändigtvis är snedfördelade mot effektiva shRNA:er omfattar vår studie dessutom både funktionella och icke-funktionella shRNA:er. Vi har visat att de modifierade algoritmerna från Ui-Tei et al., Amarzguioui et al. och Takasaki et al. är ganska till bra prediktiva verktyg som skiljer effektiva från ineffektiva shRNA:er. Det finns dock fortfarande betydande brister i de modifierade algoritmerna. En direkt bedömning av algoritmändringarna med hjälp av shRNA som utformats enligt varje ursprunglig och modifierad algoritm skulle ge stöd åt dessa resultat. Dessa algoritmer är avsedda att minska antalet falskt positiva shRNAs som väljs ut, inte att helt eliminera dem, och därför skulle detta kräva ett stort antal shRNAs för att få en statistiskt signifikant skillnad i andelen falskt positiva. Tillgången till större shRNA-databaser bör stödja utvecklingen av algoritmer med förbättrad känslighet och specificitet. Dessutom kan flera programvarutillämpningar för utformning av siRNA-oligonukleotider som inte beaktades i den här studien vara till nytta vid utformning av shRNA:er . Kriterierna för utformning av funktionella siRNA-oligonukleotider är fortfarande kontroversiella, vilket framgår av det stora antalet studier som fortfarande utarbetas för siRNA-utformning, och eftersom vi inte testade dessa sekvenser som siRNA kan det inte fastställas om modifieringen av dessa algoritmer också gäller i samband med siRNA-oligonukleotider. shRNA har ett extra komplexitetsskikt jämfört med siRNA-oligonukleotider eftersom hårnålen måste bearbetas i cellen innan den kommer in i RISC-komplexet. Dessutom kan man förvänta sig att det selektiva trycket mot det stabila uttrycket av shRNA som är skadliga för celltillväxten skulle ge ytterligare begränsningar för det stabila uttrycket av vissa shRNA. Trots denna komplexitet börjar våra resultat ge insikt om möjligheten att tillämpa siRNA-algoritmer för utformning av funktionella shRNA:er.