Critérios para desenho, construção e derrubada de genes por vetores de shRNA

Desenho e preparação de plasmídeos de shRNA

Para abordar a questão de como a seqüência de shRNA se correlaciona com a eficácia de derrubada, 27 vetores de shRNA de 11 genes diferentes foram desenhados e construídos (Tabela 1). As sequências alvo foram selecionadas na região codificadora de cada gene e foram desenhadas para se adequarem amplamente aos estudos seminais das características da sequência para a eficácia do siRNA oligómero. Consequentemente, as sequências são baixas em séries e têm uma relação G/C de cerca de 50%. Os shRNAs foram projetados para locais alvo que são desprovidos de polimorfismos de nucleotídeos simples, e correspondem a todas as variantes de emendas amplificadas por nossos conjuntos de primers de PCR em tempo real.

>

Table 1 ShRNA vectores preparados para este estudo

Desde que os siRNAs podem ter efeitos fora do alvo, é importante para ensaios funcionais fazer um mutante específico com um ou mais desajustes de base dentro do local de reconhecimento do alvo como um controle . Para conservar tempo e custo, desenvolvemos um método de fazer vectores de shRNA do tipo selvagem e mutante simultaneamente (detalhado em Métodos e Figura 1). Os resultados de derrubada de genes para quatro pares de shRNA do tipo selvagem/mutante são mostrados na Figura 2. Estes resultados demonstram a utilidade deste método em fornecer um vetor de shRNA mutante pontual que pode servir como um controle de perda de função para a derrubada de genes por shRNAs do tipo selvagem. Embora protocolos detalhados tenham sido publicados para a construção de vetores de shRNA, este é o primeiro protocolo para a produção simultânea de vetores do tipo selvagem e mutante e deve facilitar a implementação de um sistema altamente controlado para shRNA.

>

Figure 1
figure1

Design para a produção simultânea de vetores de shRNA do tipo selvagem e mutante. Um fio de cabelo do tipo selvagem (azul) é sintetizado juntamente com um fio invertido contendo uma mutação de um bp dentro do sentido e uma cópia antisense da sequência alvo (mostrada em vermelho). O híbrido de fio duplo é ligado ao vector retroviral 5′ de um promotor H1 e transformado em bactérias competentes. Como a replicação é semi-conservadora, as bactérias filhas serão de duas populações diferentes que transportam um vector mutante de dupla cadeia ou um vector mutante de dupla cadeia e podem ser isoladas através da preparação e sequenciação de colónias individuais.

Figure 2
>figure2

Análise de expressão de genes para vetores de shRNA do tipo selvagem e mutante, preparados simultaneamente usando híbridos de dupla cadeia/do tipo selvagem. (A) Seqüências dos locais alvo para quatro vetores de shRNA do tipo selvagem e mutante que foram preparados simultaneamente, conforme detalhado na Figura 1. (B) Análise em tempo real de derrubamento de shRNA, e perda de derrubamento por vetores de shRNA mutantes de (A). Os valores são padronizados para 100% em células THP1 não transduzidas. A expressão em células THP1 transduzidas com um vetor vazio (EV) é mostrada como um controle adicional. Os valores representam a média +SEM para pelo menos três ensaios realizados em duplicado.

Estratégia para seqüenciamento preciso através de estruturas de grampos capilares

Verificar a seqüência de um grampo capilar de shRNA é essencial uma vez que o descasamento de até mesmo um nucleotídeo dentro da seqüência alvo pode abortar o knockdown (Figura 2 e .) Uma questão que é frequentemente encontrada na preparação de vetores de shRNA é que muitos são difíceis de sequenciar devido à estrutura secundária intrínseca do grampo capilar. Uma estratégia recentemente proposta para superar este problema envolve a engenharia de um local de restrição dentro da região do laço/tronco do grampo capilar para separar fisicamente as repetições invertidas por digestão e, em seguida, unir a sequência usando iniciadores de sentido e anti-senso . No entanto, a capacidade de alcançar a sequência de construções de shRNA sem modificar a sequência haste/loop seria de clara vantagem. Para abordar esta possibilidade, avaliamos reações de sequenciamento modificadas para melhorar a leitura da estrutura secundária do grampo capilar em três grampos capilares de shRNA. As modificações incluem a adição de agentes conhecidos para relaxar a estrutura do DNA, incluindo DMSO, Betaine, PCRx Enhancer e ThermoFidelase I; e a adição de quantidades crescentes da química do dGTP BigDye terminator (dGTP) à química padrão BigDye v1.1 (BD) que contém dITP em vez de dGTP.

Os resultados do sequenciamento para cada uma das três construções de DNA estão resumidos na Tabela 2. A leitura da estrutura do grampo capilar foi medida como a relação da altura do pico cerca de 300 bases após a estrutura do grampo capilar para o sinal cerca de 50 bases antes da estrutura do grampo capilar. Uma razão de 1 indica que não há perda no sinal e 0 indica perda completa da leitura-pensamento. Na ausência de qualquer aditivo à química BD, o grampo capilar causou uma redução na relação de altura de pico para o nosso grampo capilar menos estruturado, pHSPG-shmutTLR4, para 0,4, e uma perda completa em leitura para os outros dois plasmídeos. Isto pode ser visualizado como uma parada abrupta no perfil de pico de sequência para pHSPG-shTLR4 (Figura 3A).

Table 2 Avaliação dos resultados de sequenciamento de três construções de pino capilar de DNA. A relação média da altura de pico depois e antes da região do grampo capilar foi determinada como uma medida de quão bem a sequência lida através da estrutura do grampo capilar. Quanto maior a relação entre a altura dos picos, maior a capacidade de se sequenciar através do grampo capilar. Um valor de 1 indica que não há perda na altura do pico, e um valor de zero indica uma parada completa na sequência após a região dos pinos do cabelo. Todos os valores são as médias de pelo menos triplicar as reações sequenciais.
Figure 3
figure3

DNA sequenciação de pHSPG-shTLR4 utilizando condições de reação modificadas. Os picos de sequenciação de ADN são mostrados numa vista de escala completa onde as posições base são indicadas pela linha de números em cada painel e o eixo Y é a intensidade do sinal. As condições de sequenciamento de reação mostradas são: Química BigDye v1.1 (BD) (A), 0,83 M Betaine + 1 ×PCRx Enhancer em química BD (B), 10:1 BD:dGTP (C), 0,83 M Betaine + 1 ×PCRx Enhancer em química 10:1 BD:dGTP (D), e 1 × ThermoFidelase I em química 10:1 BD:dGTP (E). A queda no sinal (passo em altura de pico) no grampo do cabelo é realçada por uma seta no painel de quimioterapia 10:1 BD:dGTP.

entre os agentes relaxantes de DNA, 5% DMSO, 0,83 M Betaine e 1 × PCRx Enhancer cada um melhoraram significativamente a sequência lida para algumas construções. No entanto, a adição de 0,83 M Betaine mais 1 × PCRx Enhancer à química BD melhorou a sequência de forma mais consistente, com taxas de pico de altura de 0,5-0,9 (Tabela 2 e Figura 3B). A adição de 10:1 BD:dGTP também melhorou um pouco a leitura, com taxas de altura de pico de 0.5-0.6 (Tabela 2 e Figura 3C). A razão sub-ótima de altura de pico para 10:1 BD:dGTP pode ser atribuída a um passo visível no perfil de pico da sequência após a região da estrutura secundária onde o sinal é reduzido (Figura 3C, seta). Aumentar o conteúdo da química dGTP para 5:1 e 3:1 BD:dGTP ou usar a química reta dGTP aumentou a relação de altura de pico e reduziu um pouco o passo (relação de 0,6 para 0,8). Entretanto, a incorporação mista de dITP e dGTP resultou em piores picos de ampliação à medida que a quantidade de dGTP utilizada aumentou, e a química dGTP apenas causou compressões sequenciais severas (dados não mostrados). Os melhores resultados gerais foram observados ao combinar Betaine mais PCRx e 10:1 BD:dGTP misturados químicos. Esta combinação reduziu o degrau com um menor alargamento dos picos e aumentou as taxas de altura dos picos para 0,9-1,0 (Tabela 2 e Figura 3D). ThermoFidelase I, uma enzima desestabilizadora do DNA que é frequentemente usada para melhorar o sequenciamento do DNA genômico, não melhorou o sequenciamento de nenhum dos três grampos capilares na química BD reta (dados não mostrados), e na verdade reduziu significativamente a relação de altura de pico em 10:1 BD:dGTP para todas as três construções de shRNA, causando o reaparecimento de uma parada na estrutura do grampo capilar (Tabela 2 e Figura 3E).

Em resumo, a combinação dos químicos 10:1 BD:GTP, 0,83 M Betaine, e 1 × PCRx Enhancer proporcionaram uma sequência óptima, e os químicos mistos BD:dGTP, Betaine, PCRx Enhancer, e DMSO tiveram, cada um, alguns efeitos positivos por si só. Contudo, a ThermoFidelase I, provavelmente deve ser evitada para vectores de shRNA com estrutura secundária intrínseca difícil.

Correlação entre a eficiência de knockdown do shRNA e os algoritmos publicados para o design do siRNA

Para determinar se a eficácia de knockdown por vectores de shRNA se correlaciona com as regras publicadas para o design de oligonucleótidos eficazes de siRNA, os shRNAs foram avaliados pela sua capacidade de expressão do gene knockdown. Os shRNAs foram transduzidos de forma estável em linhas de células humanas THP1 ou Jurkat, conforme detalhado na Tabela 3, primeiras duas Colunas. O knockdown médio foi determinado a partir do RNA coletado em três ou mais dias diferentes e é listado para cada shRNA (Coluna 3). O knockdown foi mostrado como reprodutível para linhas de células que foram independentemente transduzidas e classificadas, sugerindo que o knockdown é uma função da seqüência alvo do shRNA em vez de características da transdução viral. Mais de um terço dos vetores de shRNA construídos não foram capazes de suprimir a transcrição (<10% na Coluna 3), apesar das taxas de crescimento comparáveis e da expressão a longo prazo do marcador GFP em níveis elevados nestas linhas celulares. Além disso, as grandes variações na eficácia de choque para vários shRNAs feitas contra muitos dos mesmos genes (ou seja, CLR16.2, CLR19.3 e TLR4) argumentam contra qualquer razão biológica simples para diferenças na eficácia destes genes. Muitos dos shRNAs ineficazes têm valores negativos de 5′ ΔΔG e alta pontuação de Reynolds, cada um dos quais foi hipotético para correlacionar com a eficácia do siRNA knockdown (Tabela 3, Colunas 4 e 5) . Por outro lado, entre os shRNAs que foram capazes de conferir a knockdown do gene, vários tiveram valores positivos de 5′ ΔΔG ou escores baixos de Reynolds. Estes resultados indicam que o 5’ΔΔG e o algoritmo de pontuação de Reynolds para siRNA podem não fornecer critérios correlativos positivos para o design do shRNA.

Table 3 Comparação entre a eficácia de knockdown e o algoritmo de design do siRNA. A média de knockdown foi medida por PCR em tempo real de amostras triplicadas. Todas as médias são precisas dentro de 10% SEM. Os asteriscos indicam pontuações elevadas de Takasaki et al. algoritmos que têm uma eficácia de knockdown correspondente fraca.

Para determinar se outros algoritmos publicados para o design de oligonucleótidos de siRNA podem ser aplicados a vectores de shRNA, cada um dos locais alvo de shRNA foi avaliado por quatro algoritmos adicionais, e as pontuações foram traçadas contra a percentagem de knockdown para cada shRNA (Tabela 3, Colunas 6-9 e Fig. 4). Para cada gráfico do algoritmo foi traçada uma linha de melhor ajuste e o valor R2 foi calculado como uma indicação de se a variância na eficácia de knockdown pode ser explicada pela pontuação do algoritmo. Os resultados confirmam uma associação pobre entre a eficácia do shRNA e considerações de 5′ ΔΔG (diferencial de energia livre) ou o algoritmo de Reynolds et al. e também demonstram uma associação pobre com o algoritmo de Hsieh et al. Os algoritmos de Amarguizoui et al. , Ui-Tei et al. , e Takasaki et al. , correlacionam-se diretamente com a eficácia do shRNA. Entretanto, nenhum dos escores dos algoritmos explica uma porcentagem significativa da variância na eficácia de knockdown. Entre os algoritmos testados, o sistema de pontuação de Takasaki et al. mostra a maior associação, com um valor R2 de 0,0251,

>

Figure 4
figure4

Correlação entre a eficácia de knockdown do shRNA e a pontuação de seis algoritmos publicados para o siRNA. As pontuações dos algoritmos para cada local alvo de shRNA da Tabela 2 são plotadas contra a eficiência de derrubada observada para os algoritmos de Hsieh et al. (A), 5′ ΔΔG (diferencial de energia livre) (B), Reynolds et al. (C), Amarzguioui et al. (D), Ui-Tei et al. (E) e Takasaki et al. (F). A pontuação de 5′ ΔΔG é plotada em um eixo horizontal inverso, uma vez que a eficácia de knockdown está prevista para correlacionar com o valor negativo de 5′ ΔΔG. Uma linha de tendência é mostrada junto com o valor R2 para cada gráfico. Knockdown de menos de 10% é plotado como zero.

Porque estes resultados sugerem que uma relação linear não se aplica fortemente a knockdown de shRNA para qualquer dos seis algoritmos, avaliamos cada um dos algoritmos pela análise da curva ROC para determinar se algum algoritmo é superior aos outros na identificação de shRNAs eficazes. A curva ROC é um gráfico de sensibilidade (a fração verdadeira positiva, TPF) versus 1 menos a especificidade (a fração falso-positiva, FPF) que é gerada pela variação do limiar de decisão entre a pontuação mínima e máxima do algoritmo. A diagonal do gráfico ROC representa a curva ROC para um algoritmo que não é melhor em discriminação do que a seleção aleatória. Algoritmos que são maus discriminadores têm curvas ROC que seguem ao longo da diagonal e têm uma área sob a curva ROC (AUC) que não é significativamente diferente da AUC da diagonal (0,5). Algoritmos que são bons discriminadores têm curvas ROC com forte desvio convexo da diagonal e CUA que se aproximam de 1 e são significativamente diferentes da CUA da diagonal.

O algoritmo de Hsieh et al. teve uma curva ROC côncava (Fig. 5A) indicando sensibilidade inaceitável e especificidade na discriminação efetiva de shRNAs ineficazes. As curvas ROC para todos os outros algoritmos (Figs. 5B-F) eram próximas à diagonal do gráfico ROC e tinham AUCs que não eram significativamente diferentes das AUCs da diagonal (Figs. 5B-F). Assim, nenhum dos algoritmos mostrou uma capacidade estatisticamente significativa de discriminar entre shRNAs eficazes e ineficazes.

Figure 5
figure5

Análise da curva de pontuação SiRNA dos algoritmos de pontuação. A fração verdadeira positiva foi plotada contra a fração falso-positiva, uma vez que o limiar de decisão variou da pontuação mínima à máxima (ver Materiais e Métodos para detalhes) para os algoritmos Hsieh et al. (A), 5′ ΔΔG (diferencial de energia livre) (B), Reynolds et al. (C), Amarzguioui et al. (D), Ui-Tei et al. (E) e Takasaki et al. (F) usando um limiar de eficácia de 50% de knockdown. As curvas ROC para os algoritmos modificados de Amarzguioui et al. (G), Ui-Tei et al. (H) e Takasaki et al. (I) também são mostradas. Um conjunto de 38 shRNAs publicados (Tabela 5) foi analisado usando os algoritmos modificados de Amarzguioui et al. (J), Ui-Tei et al. (K) e Takasaki et al. (L) para confirmar a utilidade dos algoritmos modificados. A área sob a curva (AUC) e a probabilidade (p) de que a AUC seja significativamente diferente de 0,5, a área sob diagonal, é indicada para cada curva ROC.

O algoritmo de Takasaki et al. (Fig. 5F) mostrou o mais promissor como discriminador de shRNAs ineficazes. No entanto, este algoritmo sofreu de uma fração falso-positivo relativamente alta para limiares de decisão próximos ao escore máximo como indicado pelo desvio fraco e errático da diagonal próxima à origem da curva ROC (Fig. 5F). Isto indicou que o algoritmo atribuiu uma pontuação elevada a um número de shRNAs ineficazes. A inspeção dos dados revelou que dois dos três shRNAs ineficazes com pontuação alta visaram genes cuja expressão foi derrubada com sucesso por outros shRNAs (Tabela 3, asteriscos). Assim, é improvável que a ineficácia dos shRNAs seja uma consequência da pressão seletiva contra a supressão estável da expressão gênica. É mais provável que o algoritmo de Takasaki et al. não seja responsável por uma característica crítica dos shRNAs eficazes.

Aplicação de um algoritmo de modificação baseado na estabilidade das 6 bases centrais de cada shRNA

Inspecção das propriedades físicas dos shRNAs ineficazes de alta pontuação revelou que a estabilidade média do duplex formado pelas 6 bases centrais dos shRNAs (bases 6-11 da cadeia de sentido hibridizada para bases 9-14 da cadeia antisense) foi maior do que a estabilidade média dos shRNAs eficazes de alta pontuação (ΔG = -13.1 ± 0,1 versus -11,1 ± 1 kcal/mol, respectivamente). Com base nesta observação, o algoritmo de Takasaki et al. foi modificado de tal forma que aos shRNAs com um duplex central ΔG igual ou inferior a -12,9 kcal/mol foi atribuída uma pontuação mínima (Tabela 4). Esta modificação atribuiu um escore mínimo a cinco shRNAs, quatro que foram ineficazes, aumentando assim a especificidade do algoritmo sem uma perda significativa de sensibilidade. Um escore mínimo atribuído a um shRNA efetivo (71% de knockdown), indica que outras propriedades, além da estabilidade duplex central, influenciam a eficácia. Entretanto, a adição desta modificação eliminou o fraco desvio errático da curva ROC da diagonal para limiares de decisão altos e aumentou a AUC para 0,79 (Fig. 5I). Modificações semelhantes dos algoritmos de Amarzguioui et al. e Ui-Tei et al. também elevaram os CUA de suas curvas ROC (Fig. 5G e 5H). Com esta modificação, os CUA das curvas ROC dos três algoritmos modificados foram significativamente diferentes dos CUA da diagonal (Fig. 5G-I), indicando uma capacidade preditiva estatisticamente significativa. As diferenças entre as CUA das curvas ROC para os algoritmos modificados não foram significativas, portanto, por motivos estatísticos, todos os três algoritmos modificados foram de igual utilidade. Os algoritmos 5′ ΔΔG, Reynolds et al, e Hsieh et al. não foram melhorados para uma capacidade preditiva estatisticamente significativa aplicando a modificação do duplex central ΔG (dados não mostrados).

Tabela 4 Modificação da pontuação do algoritmo com base no shRNA duplex central ΔG. Os dados de knockdown por cento representam o knockdown médio como mostrado na Tabela 3. shRNAs com um ΔG central igual ou inferior a -12,9 kcal/mol estão sublinhados. A estes foram atribuídas pontuações mínimas de acordo com a modificação do algoritmo. As pontuações mínimas são: algoritmo Amarzguioui et al., -4; algoritmo Ui-Tei et al., -2; algoritmo Takasaki et al., -13,26. Os três shRNAs que tiveram alta pontuação no algoritmo original de Takasaki et al. mas têm baixa eficácia de knockdown são marcados com asteriscos. A modificação minimizou a pontuação destes shRNAs, aumentando assim a especificidade do algoritmo.

Para abordar a possibilidade de que a melhoria alcançada pela modificação dos algoritmos de Amarzguioui et al, Ui-Tei et al, e Takasaki et al. é uma consequência do sobreajuste do nosso conjunto de shRNAs, um conjunto independente de 38 shRNAs agrupados de publicações anteriores (; Tabela 5) foram submetidos a análise. Embora nenhuma das curvas ROC dos três algoritmos não modificados tivesse uma AUC significativamente diferente da diagonal (Amarzguioui et al., p = 0,174; Ui-Tei et al. p = 0,09; Takasaki et al., p = 0,26), todos os algoritmos modificados produziram curvas ROC com AUCs significativamente diferentes da AUC da diagonal (p = 0,0001-0,009; Figs. 5J-L). Por motivos estatísticos, todos os três algoritmos modificados foram de igual utilidade, pois os CUA das curvas ROC dos algoritmos modificados eram todos significativamente diferentes dos CUA da diagonal, mas não significativamente diferentes uns dos outros. Esta análise de um conjunto independente de shRNAs sugere que a modificação dos algoritmos é de validade geral.

Tabela 5 Sequências de shRNA previamente publicadas analisadas neste estudo

Porque a minimização da taxa de falsos positivos é a principal preocupação no desenho de shRNA, recomendamos o uso do Ui-Tei et al. modificado, que teve a menor fração falso-positivo alta nos limiares de decisão próximos ao escore máximo, como indicado pelo forte desvio da diagonal próxima à origem da curva ROC (Figs. 5H e 5K). Utilizando um limiar de decisão de 3 limites de seleção de shRNAs para uma região da curva ROC onde a sensibilidade era aceitável (0,28-,33), enquanto a especificidade era muito boa (1,0). Ao estabelecer este limiar de decisão, a fração falso-positiva foi minimizada, enquanto 28 – 33% das shRNAs efetivas foram identificadas a partir das nossas shRNAs e do conjunto publicado de shRNAs, respectivamente. Caso a sensibilidade precise ser aumentada, recomendamos o uso de um limiar de decisão de 2. Este limiar tinha uma sensibilidade de 0,54 – 0,55 e uma especificidade de 0,88 – 0,9. Se o limiar de decisão fosse mais relaxado para 0, a sensibilidade aumentaria para 0,86 – 0,9, mas a especificidade cairia para 0,55 – 0,54. Recomendamos utilizar o maior destes limiares de decisão possível.

Pois estatisticamente pequeno, este estudo tem a vantagem de ser o maior conjunto publicado de shRNAs com base de 19 mers até à data. Além disso, ao contrário de outros estudos de shRNAs que são necessariamente inclinados para shRNAs eficazes, o nosso estudo inclui tanto shRNAs funcionais como não funcionais. Mostramos que os algoritmos modificados de Ui-Tei et al., Amarzguioui et al. e Takasaki et al. são ferramentas preditivas justas e boas que distinguem os shRNAs eficazes dos ineficazes. No entanto, ainda existem deficiências significativas nos algoritmos modificados. Uma avaliação directa das modificações dos algoritmos usando shRNAs desenhados de acordo com cada algoritmo original e modificado daria suporte a estes resultados. Estes algoritmos destinam-se a reduzir o número de shRNAs falsos positivos seleccionados, não os eliminando completamente por completo, e assim isto exigiria um grande número de shRNAs para obter uma diferença estatisticamente significativa na taxa de falsos positivos. A disponibilidade de conjuntos de dados de shRNAs maiores deve apoiar o desenvolvimento de algoritmos com maior sensibilidade e especificidade. Adicionalmente, várias aplicações de software para o design de oligonucleotídeos de siRNA que não foram consideradas neste estudo podem ser úteis no design de shRNAs . Os critérios para o desenho de oligonucleotídeos de siRNA funcionais permanecem controversos, como evidenciado pelo grande número de estudos ainda em desenvolvimento para o desenho de siRNA, e como não testamos essas sequências como siRNAs não é possível estabelecer se a modificação desses algoritmos também se aplica no contexto dos oligonucleotídeos de siRNA. shRNA tem uma camada adicional de complexidade sobre os oligonucleotídeos de siRNA, uma vez que o fio de cabelo precisa ser processado dentro da célula antes de entrar no complexo RISC. Além disso, a pressão seletiva contra a expressão estável de shRNAs que são deletérios para o crescimento celular seria esperada para emprestar uma restrição adicional para a expressão estável de certos shRNAs. Apesar destas complexidades, os nossos resultados começam a trazer uma visão da capacidade de aplicar algoritmos de siRNA para o design de shRNAs funcionais.

Deixe uma resposta

O seu endereço de email não será publicado.