Frontiers in Genetics

Introduction

転写および転写後プログラムは、遺伝子発現レベルおよび/または複数の異なるmRNAアイソフォームの生産を制御し、これらのメカニズムの変化は、遺伝子発現および発現プロファイルの差異の調節不全をもたらす。

αシヌクレインの発現調節障害は、シヌクレイン病、特にパーキンソン病(PD)およびレビー小体型認知症(DLB)の発症に関与しているとされている。 PDを中心とするシヌクレイン病におけるSNCA過剰発現の役割はよく知られているが、ここでは、異なるシヌクレイン病におけるSNCA転写物の完全なレパートリーを決定することに焦点を当てた。 これまで、SNCA遺伝子には、代替スプライシング、転写開始点(TSS)、ポリアデニル化部位の選択から生じる、いくつかの異なるSNCA転写物アイソフォームが報告されています(McLeanら, 2012; Xuら, 2014)。 コーディングエキソンの代替スプライシングは、SNCA 140、SNCA 112、SNCA 126、およびSNCA 98を生じさせ、4つのタンパク質アイソフォームをもたらす(Beyer and Ariza, 2012)。 SNCA遺伝子の代替TSSは、4つの異なる5′UTRをもたらし、異なるポリアデニル化部位の代替選択は、タンパク質産物の組成に影響を与えずに、3′UTRの主要な長さを決定する(Beyer and Ariza、2012年)。 私たちの目的は、既知および新規の異なるSNCA mRNA種が、シヌクレインパチーの病因および異質性にどのように貢献しているかについて、新たな洞察を得ることである。 第3世代のロングリード技術により、アイソフォーム構造の前例のない、ほぼ完全な画像が得られるようになった。 しかし、ヒト疾患遺伝子に対する既存のロングリード転写物シーケンシングは、アンプリコンベースのアプローチを使用している(Treutleinら、2014年;Kohli、2017年;Tsengら、2017年)。 このアプローチは、ヒト疾患遺伝子における複雑な代替スプライシングの特定に成功しているが、PCRプライマー設計に限定されており、代替開始および終了部位を発見することはできない。 IDTプローブの使用などによるターゲットエンリッチメントでは、低いシーケンスコストで目的の遺伝子の包括的なアイソフォームビューを実現することができます。 さらに、高精度の完全長転写物リードによりアイソフォーム特異的なハプロタイピングが可能となる。

ここでは、PacBio SMRTシーケンスを用いてSNCA遺伝子領域のgDNAとcDNAをターゲットキャプチャーした最初の既知の研究を紹介する。 SNCA遺伝子領域は長さ約114kbで、6つのエクソンからなり、転写産物の長さは約3kbである。 PD、DLB、正常対照の12個のヒト脳サンプルをマルチプレックスし、PacBio SequelシステムでgDNAとcDNAライブラリーの塩基配列を決定しました。 gDNAキャプチャーのSNPs、indel、short tandem repeatの同定、cDNAデータのアイソフォームレベルのハプロタイピングに用いたバイオインフォマティクス解析について述べる。 また、cDNAのデータには、アイソフォームレベルのハプロタイプを用いた。我々は、ターゲットキャプチャーは、疾患に関連する神経遺伝子のゲノム変異と代替スプライシングを共同で研究する費用対効果の高い方法であることを示す。 (1) PD (N = 4); (2) DLB (N = 4); (3) 臨床的および神経病理学的に正常な被験者 (N = 4) の3つの剖検診断が確認された人々で構成された。 前頭皮質脳組織は、Duke大学のKathleen Price Bryan Brain Bank(KPBBB)、Banner Sun Health Research Institute Brain and Body Donation Program(Beach et al.、2015)、Oregon Health and Science UniversityのLayton Aging and Alzheimer’s Disease Centerを通じて入手した。 神経病理学的表現型は、死後検査において、McKeithらの方法と臨床実践の勧告(McKeithら、1999、2005)に従った標準的な確立された方法に従って決定された。 LB病変の密度(標準的な一連の脳領域における)は、軽度、中等度、重度、非常に重度でスコア化された。 PDとDLBの各診断群内の研究サンプルは、臨床病理学的表現型の重症度が各病態内で類似するように慎重に選択された。 すべての脳で脳幹、辺縁系、新皮質のレビー小体(LB)が認められ、PDでは亜核と扁桃体のMcKeithスコアが重度から非常に重度であった。 すべての脳は、CERAD基準およびBraak and Braak stage = IIによると、ADではないことを示している。 神経学的に健康な脳サンプルは、ほとんどの場合、死後1年以内に検査され、認知障害やパーキンソニズムがなく、PD、アルツハイマー病(AD)、その他の神経変性疾患の診断には不十分な神経病理所見が認められた臨床的に正常な被験者の死後組織から得られたものであった。 サンプルはすべて白人であった。 これらの被験者の人口統計学的特徴と神経病理学的特徴を補足表1にまとめている。 このプロジェクトは、Duke Institution Review Board (IRB)による倫理的承認を得ている。 1564>

Genomic DNA and RNA Extraction

Genomic DNAはQiagenの標準プロトコル(Qiagen, Valencia, CA)により脳組織から抽出した。 RNAは、TRIzol試薬(Invitrogen, Carlsbad, CA)を用いて脳サンプル(100 mg)から抽出し、製造者のプロトコルに従ってRNeasyキット(Qiagen, Valencia, CA)で精製した。gDNAおよびRNA濃度は分光光度法で測定し、RNAサンプルの品質と著しい分解のなさはAgilent Bioanalyzerを用いてRNA完全数(RIN、補足表1)の測定によって確認された。

Library Preparation and Sequencing

IDT Xgen® Lockdown® Probesを用いたgDNA Capture and Single-Molecule Sequencing

各gDNAサンプル約2μgをCovaris g-TUBE で6kbに切り出し、バーコード付きアダプターでライゲーションした。 12プレックスのバーコード付きgDNAライブラリーの等モルプール(合計2μg)を、カスタム設計のSNCA遺伝子パネルを用いたプローブベースキャプチャーに入力した。

SMRTBellライブラリーは、626 ngの捕捉および再増幅したgDNA1を用いて構築した。

IDT Xgen® Lockdown® Probesを用いたcDNAキャプチャと1分子アイソフォームシーケンス(Iso-Seq)

Clontech SMARTer cDNA合成キットと12サンプル固有のバーコード付きオリゴdT(PacBio 16mer barcode配列、補足方法参照)を用いて1反応あたり約100~150 ngのトータルRNAを逆転写させた。 各サンプルについて、3回の逆転写(RT)反応を並行して処理した。 PCR最適化は、下流の大規模PCR反応に最適な増幅サイクル数を決定するために使用された。 単一のプライマー(Clontech SMARTer kit 5′ AAG CAG TGG TAT CAA CGC AGA GTA C 3′からのプライマーIIA)が、RT後のすべてのPCR反応に使用された。 大規模なPCR産物は1X AMPure PBビーズで別途精製し、バイオアナライザーをQCに使用した。 12プレックスバーコードcDNAライブラリーの等モルプール(合計1μg)を、カスタムデザインのSNCA遺伝子パネルを用いたプローブベースキャプチャーに入力した。

SMRTBellライブラリーは、874 ngの捕捉および再増幅cDNA2 を用いて構築された。 1つのSMRT Cell 1M(6時間の動画)を、PacBio Sequelプラットフォームで2.0ケミストリーを使用して配列決定した。

gDNA Analysis

バーコード付きのgDNAデータの配列決定は、3つのSMRT Cell 1Mで2.0ケミストリーを使用して実行された。

Short Variant Analysis and Phasing

Circular Consensus Sequence (CCS) readsは、SMRT Analysis 6.0を用いて、それぞれのDemultiplexデータセットから生成し、minimap2を使ってhg19参照ゲノムにアライメントを行った。 捕捉後の増幅によるPCR重複は、エンドポイントをマッピングすることで同定し、カスタムスクリプトを用いてタグ付けした。 短いバリアントは、GATK4 HaplotypeCaller(GATK4 HC)(Poplin et al.、2018)を使用して呼び出された。 カバレッジ深さと品質メトリクスを使用したフィルタリングの最初のパスの後、バリアントはIGV3で手動で検査された。 バリアントが近傍のSNPと位相が合わない場合、手動でフィルタリングを行った。 手動キュレーションを通過したバリアント部位は、WhatsHap (Martin et al., 2016) を用いたリードバック位相合わせのために、重複排除したCCSアラインメントとともに使用した。

Clustering and Determining Haplotypes for CT-Rich Region

chr4: 90742331-90742559 (hg19) にアラインしたサブシーケンスを各試料のために抽出した。 これらの部分配列のサイズ分布を検査した後、pythonとMUSCLE (Edgar, 2004)を組み合わせてサイズと配列類似度でクラスタリングし、各クラスタごとに独立してコンセンサス配列を作成した。

カスタムスクリプトとワークフローは、さらにhttps://github.com/williamrowell/Long-reads-Sequencing-of-SNCA-in-Diseasesに記載。

アイソフォーム解析

バーコード付きcDNAデータの配列決定は、PacBio Sequelシステムで、1つのSMRT Cell 1Mで2.0化学を使用して行われた。 バイオインフォマティクス解析は、PacBio SMRT Analysis v6.0.0のIsoSeq3アプリケーションを使用して、高品質の完全長アイソフォーム配列を得た(詳細は補足方法を参照)

Isoform SNP Calling

全12サンプルの最終41アイソフォームに関する完全長リードは、hg19ゲノムに配列して積み上げ作成されました。 QVが13未満の塩基は除外した。 次に、少なくとも40塩基のカバレッジがある各位置で、pカットオフ0.01でボンフェローニ補正をかけたフィッシャー正確検定を適用した。 ホモポリマー領域(同じヌクレオチドが4つ以上ある伸張)に近くない置換SNPのみを呼び出した。 SNPコール後、各サンプルの遺伝子型は、サンプル固有の完全長(FL)リードのサポート数を集計することで決定しました。 参照塩基と代替塩基の両方をサポートするFLリードが5本以上あるサンプルは、ヘテロ接合体であることを示します。 一方の対立遺伝子に対応するFLリードが5本以上あり、他方の対立遺伝子に対応するFLリードが5本未満の場合、そのサンプルはホモ接合体であった。 それ以外の場合は、結論は出ませんでした。 スクリプトは以下の場所で入手可能です。 https://github.com/Magdoll/cDNA_Cupcake.

Results

我々はSNCA遺伝子用のカスタムプローブを設計し、PD、DLB、および正常対照からなる12のヒト脳試料からなる多重化ライブラリーでgDNAとcDNAの両方を標的捕捉した(図1、補足の表1)。 gDNAとcDNAのライブラリはPacBio Sequelプラットフォームで配列決定された。 バイオインフォマティクス解析は、PacBioソフトウェアを使用し、その後カスタム解析を行った。 研究デザインの模式図。 パーキンソン病、レビー小体型認知症、対照群の患者の剖検脳組織からDNAとRNAを抽出し、gDNAとcDNAライブラリをプローブハイブリダイゼーションで作成し、PacBio Sequelシステムで塩基配列を決定した。 1564>

Targeted gDNA Capture Identified Known and Novel Variations

Circular consensus sequences (CCS) を作成し、PCR重複を除去(補足方法)した結果、SNCA遺伝子領域の16倍から71倍の平均ユニークカバレッジが得られた。 CCSリードの平均挿入長は2.9 kb、平均リード精度は98.9%であった。 LINEエレメントの存在により意図的にプローブでカバーされなかった5 kb領域 (hg19 chr4: 90697216-90702113) とエクソン1周辺のGC含量の高い2.1 kb領域を除き、各212サンプルについて両方のハプロタイプの遺伝子型を決定するのに十分なカバー率があった(図2、補足図1)

FigURE 2
www.frontiersin.org

Figure 2. ターゲットとなるgDNAの捕捉と位相合わせ。 各条件から1つのサンプルを示す例。 上のトラックはSNCAアイソフォームの1つを示し、次に3つのサンプルのgDNAカバレッジを示す。 variantトラックは各SNPを示し、ヘテロ接合体(紫)、ホモ接合体alternative(オレンジ)、ホモ接合体reference(灰)に色分けされている。 フェイズブロックは水色で表示されています。 下のトラックはキャプチャープローブの位置を示している。 プローブ設計のドロップアウト領域は、イントロン4の中央にある2つのLINEエレメントに起因する。 GATK4 HC、quality-based filtering、manual curationを用い、dbSNP(dbSNP Build ID: human_9606_b150_GRCh37p13)にない8SNPSと13インデルを含む282SNPと35インデルを確認した(Supplementary Table 2)。 SNCAのコーディング領域にはバリアントは確認されなかったが、非翻訳領域には8つのバリアントが確認された。 いくつかのショートタンデムリピート(STR)を含む同定されたバリアントの大部分は、イントロン2、3、および4に該当する。

我々は以前、SNCAのイントロン4における高多型CTリッチ領域について、4種類のハプロタイプが観察された(Lutzら、2015)。 この高度に反復的で構造的に可変な領域はGATK4 HCで遺伝子型を決定することが困難であることが判明したが,我々は12サンプルすべてのコンセンサス配列を構築し,以前に発見した4つのハプロタイプすべてを観察することができた(補足図2)。 さらに、イントロン4には、参照配列で16回繰り返される3塩基からなる新規STRを同定した。 12検体中、TTGの繰り返し単位が9、12、15コピーの3つのハプロタイプが確認された。 GATK HCは、この領域のカバレッジがかなり低いPD-4の1つのハプロタイプを除いて、これらすべてを正しくジェノタイピングしました。 しかし、このサンプルの与えられたデータでは、目視で遺伝子型を決定することができる(表1)

TABLE 1
www.frontiersin.org

Table 1. イントロン4(chr4:90713442)における新規トリプレットタンデムリピート。

我々は、GATK HCによって検出された短いバリアントを、リードベースの位相決定ツールWhatsHap(Martinら、2016)と組み合わせて使用し、遺伝子座にわたるCCSリードの位相決定に、遺伝子座上のヘテロ接合バリアントの密度によって主に駆動する範囲の成功があった。 PD-1、PD-4、N-4、DLB-1、およびDLB-4サンプルは、低ヘテロ接合性の長いストレッチがあり、非常に少数の短いフェーズブロックがあったが、他のサンプルでは、平均リード長の7~18倍、最大54kbのフェーズブロックが得られた(補足図3)。 Iso-Seqデータをhg19にマッピングし、アーチファクトを除去した後(補足表3、補足図4)、41のSNCAアイソフォームの最終的なセットを得た(図3)。 最終的なアイソフォームはすべて正規のスプライスサイト(GT-AGまたはGC-AG)を持ち、合計20本以上の完全長リードでサポートされている。 大半のアイソフォーム(41種中28種)は6つのエキソンをすべて持ち、代替の5′開始点および3′UTRの長さが異なるだけであった。 3UTRの長さは300から2.6kbの間であった。 SNCAにおける非常に多様な代替5′開始部位の使用は知られている。あまり知られていないのは、可変3′UTR長であり、これは以前、完全長アイソフォーム構造を解決しないRNA-seqデータを用いて研究されていた(Rhinn et al.、2012)。 Iso-Seqのデータから、可変の3′UTR長は5′開始位置のすべての可能な組み合わせと優先的な結合をせずに対になっているようであることがわかった。 開始および終了部位の変動は、予測されるオープンリーディングフレームをほとんど変化させず(補足図5)、正規の141アミノ酸配列に翻訳されると予測される<1564><3534>図3<1696><3534><699><1128>図3. 標的Iso-Seqを使用して捕捉されたSNCAアイソフォームは、新規の開始および終了部位を特定する。 アイソフォームの複雑さの大部分は、代替3′UTR長およびエクソン1の組み合わせ使用によるもので、エクソン1(緑)、2(赤)、および4(青)には少数のまれな代替スプライス部位が見出される。 すべての接合部には正規のスプライス部位がある。 エクソン5をスキップするアイソフォームが5つ、エクソン3をスキップするアイソフォームが2つ同定された。 また、イントロン4には新規の開始(オレンジ)および終了(紫)部位を同定した。 1564>

さらに、一般に公開されているshort read junctionデータを用いて、新規の(しかし正規の)junctionの検証を行った。 Intropolis (v1, https://github.com/nellore/intropolis) データベースは、21,000以上の一般に入手可能なRNA-seqを結合したものである。 1本のshort readでサポートされるジャンクションデータが大量にあるため、本研究では、Iso-Seqの新規ジャンクションを確認するために、最低10本のshort readサポート(すべての>21000 RNA-seq データセットから結合)を必要とします。 PB.1016.253とPB.1016.296の新規ジャンクションを除き(図3)、他のすべての新規ジャンクションはIntropolisデータセットでサポートされています。 興味深いことに、これらの新規ジャンクションは、Gencodeに注釈されたジャンクションに比べて、短いリードのサポートが著しく少ない。 例えば、新規エクソンによって導入されたPB.1016.139の2つの新規ジャンクションは、それぞれ2,519と44のIntropolis short read countsによってサポートされていますが、他の4つの既知のジャンクションは、100万以上のshort read countsによってサポートされています。 1564>

我々はエクソン3スキップを持つアイソフォーム(SNCA126)を2つ、エクソン5スキップを持つアイソフォーム(SNCA112)を5つ観測した。 この2つのエクソンスキップ群におけるスプライシングの多様性は,ほとんどが代替的な5′UTR開始位置の多様な使用と可変的な3′UTR長に起因している. ORF予測では、エキソン3またはエキソン5をスキップするとORFは短くなるが、リーディングフレームは維持される。 3つのアイソフォームはイントロン4に新規の3′末端部位を持っている。 ORF予測は、これが切断されたタンパク質産物をもたらすことを示している。

我々は、イントロン4(hg19 chr4:90692548-90693045、図3)に位置するこれまで注釈のなかった5つの開始部位を同定した。 この新規開始部位に関連する3つのアイソフォームは、新規開始部位、エクソン5、および可変の3′UTR長から構成されている。 興味深いことに、GTExおよびSandorら(2017)から公にダウンロードされたショートリードデータおよびCAGEピークデータ(FANTOM5)がこの新規開始部位を支持しなかった一方で、最近公開されたNA12878ダイレクトRNAデータセット4には、この代替開始部位を確認するSNCA転写物がただ1つ含まれていました。 さらに、エクソン5と新規開始部位の間の新規ジャンクションは、Intropolis short read junctionデータによって確認されています。 興味深いことに、この新規5′開始部位は、エクソン5の読み枠を維持しながら新規ペプチドを導入すると予測される。

我々はまた、新しい末端部位を持つ3つのSNCA転写物を同定した(図3)。 2つのアイソフォーム(PB.1016.383、PB.1016.384)はエクソン4で拡張した3′UTRを用い、3番目のアイソフォーム(PB.1016.381)はイントロン4で新しい3′エクソンを使用した。 新規の最後のエクソンと前のエクソンとの間の新規の接合は、公開されているショートリードの接合データ(Intropolis)により支持されている。 新規の3′UTRはtruncated ORFの予測になる。

アイソフォームの存在量の代理として正規化した全長リード数を使用すると、正規のSNCAアイソフォームの一つ(PB.1016.131)が最も多く、すべての対象サンプルで50〜60%の存在量であることが分かった(補足表4)。 さらに、41種のアイソフォームをスプライシングパターンによってグループ分けした(表2)。 6つのエキソンをすべて持つアイソフォームが存在量の95-97%を占めている。 以前の研究では、DLBサンプルの前頭葉皮質において、エクソン3を欠くアイソフォーム(SNCA126)の発現が正常と比較して著しく増加することが示されている(Beyerら、2008)。我々のアイソフォーム数の集計では、正常サンプルに対するPDおよびDLBのSNCA112(エクソン5スキップ)変異体と同様に、DLBサンプルのうち3つが、正常と比較してカウントレベルがわずかに上昇している。

TABLE 2
www.frontiersin.org

Table 2.

Full-Length cDNA Enables Isoform-Level Phasing Information

12 サンプルからの全長リードを積み上げ、cDNAを用いてSNPをコールしてバリアントをコールした(「方法」セクションを参照)。 合計4つのSNPがコールされ、すべてdbSNPで以前にアノテーションされていた(表3、図3)。 4つのSNPはすべて非CDS領域に位置し、1つは3′UTR(エクソン6)、1つはイントロン4、2つは5′UTR(エクソン1)であった。 3 UTR SNP (chr4: 90646886) は、少なくとも1 kbの長さの3 UTRを持つアイソフォームによってのみカバーされ、それゆえ、すべての正規のアイソフォームがこのSNPをカバーするわけではない。 イントロン4のSNP(chr4: 90743331)は、新規のalternative 3′末端のアイソフォーム(PB.1016.383、PB.1016.384)だけがカバーし、他のどのSNPとも関連していない。 また、2つの5′UTR SNPs (chr4: 90757312 and chr4: 90758389) は、2つの互いに排他的なexon 1 usageによってカバーされており、したがって、リンクもない。

TABLE 3
www.frontiersin.org

Table 3. cDNA SNP情報

我々の現在のアプローチは、十分にカバーできる転写領域に置換変異のみをコールするに限定されている。 我々のSNPリストをhg19 dbSNPアノテーションと比較すると、見逃されたSNPまたはバリアントのほとんどは、母集団における頻度が1%未満であるか、一塩基置換でないか、または複雑性の低い領域に隣接していることがわかります。 例えば、rs77964369 (chr4: 90646532) はT/Aの頻度が50/50であると報告されているが、このTは11ゲノムAs下流のストレッチに隣接している。 Iso-Seqのread pileupのマニュアル検査では、この部位に約1300のreadがあるが、少なくとも我々の12サンプル間では変異の証拠を示唆していない

サンプル固有のreadを使用して、各SNP位置における各サンプルの遺伝子型を呼び出した(表3)。 PD-2はリード数が少なすぎて4つのSNPsすべてで結論が出ないほかは、ほとんどのサンプルで遺伝子型を判定することができた。 注目すべきは、DLB-3がすべてのSNPの位置でヘテロ接合である唯一のサンプルであったことである。 1564>

考察

ロングリードシーケンスを用いた神経疾患の研究のために、多重化されたgDNAおよびcDNAライブラリー上のSNCA遺伝子の標的濃縮を用いた最初の研究を記述した。 PacBio Sequelシステムの長いリード長により、SNCA遺伝子の全長転写アイソフォームレパートリーの配列決定が容易になった。 また、エクソン3欠失(SNCA126)やエクソン5欠失(SNCA112)など、既知のエクソンスキッピングイベントが観察されました。 さらに、大きなイントロン4内の新しい代替開始・終了部位が同定され、新規タンパク質に翻訳されることが予測された。 また、SNCAタンパク質の異なるアイソフォームの生物学的および病理学的な意義は、まだ十分に解明されていない。 しかしながら、特定のSNCA翻訳後修飾及びスプライシングアイソフォームは、細胞内凝集傾向と関連しており(Kalivendiら、2010)、ヒトシヌクレイン病変において異なる発現をしている(Beyerら、2008;Beyer及びAriza、2012)。 SNCAの翻訳後修飾の研究により、シヌクレインパチーの病理学的特徴であるレビー小体は、リン酸化、ニトロ化、およびモノユビキチン化したSNCAを豊富に含むことが示されました(Kimら、2014年)。 SNCA凝集に対する転写後修飾の影響も研究されている。 SNCA凝集に影響を与えるものとして、代替スプライシングが示唆された。 エクソン3または5のいずれかの欠失は、機能的な結果を予測する:一方、エクソン3欠失(SNCA126)は、N末端のタンパク質-膜相互作用ドメインの中断につながり、凝集の減少につながる可能性があり、エクソン5欠失(SNCA112)は、非構造化C末端の著しい短縮のために凝集を促進する結果になるかもしれない(Leeら、2001;Beyer、2006)。 DLB患者の前頭葉皮質では、SNCA112が対照群と比較して顕著に増加しており(Beyerら、2008)、一方、SNCA126のレベルは低下している(Beyerら、2006)。 一方、SNCA126の発現はPD脳の前頭葉皮質で増加を示し、MSAでは有意差はありませんでした(Beyerら, 2008)。 SNCA98はエクソン3と5の両方を欠く脳特異的スプライスバリアントであり、胎児脳と成体脳の様々な領域で異なる発現量を示すことが分かっています。 SNCA98は、DLB、PD(Beyerら、2007)、MSA(Beyerら、2008)の前頭葉皮質において、対照群と比較して過剰発現が報告されています。 また、3′UTRの代替利用をもたらす転写後の過程が、mRNAの安定性や局在に影響を及ぼすことが報告されています(Fabian et al, 2010; Rhinn et al., 2012; Yeh and Yong, 2016)。 既知の異なるSNCAタンパク質アイソフォームの凝集傾向やレビー小体の構成に関するさらなる調査が必要である。 さらに、本研究では、各被験者の複数の脳領域を用いて、様々な臨床病理学的ステージの被験者からなるより大きなサンプルサイズにおいて、既知および新規の転写物のmRNA定量分析のための基礎を築いた。 神経病理学的重症度の文脈におけるSNCAの脳領域特異的トランスクリプトーム景観のこれらの分析は、神経病理学的病期の進行およびレビー小体およびレビー神経突起密度の重症度における特定のSNCA転写アイソフォームの役割に関して有益であろう。 これは、全長転写産物のアイソフォームの配列におけるヘテロ接合性に基づいて、特定の遺伝子の完全な領域にわたるgDNA配列の位相合わせを可能にする可能性を持つ強力なアプローチである。 今回のPacBioターゲットgDNAデータでは、SNCAを中心とする114kbの領域の81%をカバーする位相化ブロックが得られ、最長の位相化ブロックは54kbを超えました。 gDNAの位相解析はリードの長さとヘテロ接合性によって制限されるため、リードの長さを長くすると、より大きな位相ブロックが生成されると考えられる。 例えば、以前、クローニングとサンガー配列決定によるフェーズドシーケンスを用いて、可変反復配列のクラスターからなるイントロンCTリッチ領域内に4つの異なるハプロタイプを発見した(Lutz et al.、2015)。 その結果、ハプロタイプ3と呼ばれる特定のハプロタイプが、アルツハイマー病患者におけるレビー小体病変の発症リスクをもたらすことを明らかにしました。 今回、この高多型低複雑領域の配列と、定義された4つのハプロタイプの検証を行いました。 サンプル数は少ないものの、「ハプロタイプ3」は疾患患者(PD患者1名、DLB患者2名)にのみ存在し、これまでの知見と一致するものであった。 この試験的な結果および前回の発表は、より大きなサンプルサイズを用いて、正確に定義された、すなわちロングリードによるSTRおよび構造的ハプロタイプとシヌクレインパチーの関連解析を繰り返す前提となっている。 さらに、ロングリードgDNAはSTRを含む短い構造変異やハプロタイプをより正確に定義し、SNP以外の疾患関連変異の発見と検証を促進できることを示した。 1564>

Data Availability

gDNAの3つのSMRTセルの生データはZenodo.orgでdoi: 10.5281/zenodo.1560688 として利用可能である。 cDNAの生データは、Zenodo.orgのdoi: 10.5281/zenodo.1581809で公開されています。 gDNAとcDNAの結果は、gDNAの変異体やcDNAのアイソフォームを含めて、Zenodo.orgのdoi: 10.5281/zenodo.3261805 に掲載されています。

Author Contributions

OC-F が研究の構想および設計を担当。 ETとWRは配列データベースを整理し、配列解析を行い、すべての図と表を作成した。 O-CGとJBは、脳組織と核酸サンプルの調製を担当した。 THはシーケンスデータセットを作成した。 SKは試薬の設計と入手を行った。 OC-F、ET、WRは原稿の第一稿を執筆した。 OC-Fは研究費を獲得した。

研究助成

This work was funded in part by the National Institutes of Health/National Institute of Neurological Disorders and Stroke (NIH/NINDS) .

利益相反声明

ET, WR, TH, and SK is or were employees of Pacific Biosciences at the study when the time of the time.

残りの著者は、潜在的な利益相反と解釈される商業的または金銭的関係がない状態で研究が行われたことを宣言する

Acknowledgements

この原稿はBioRxivでプレプリントとして公開されている(Tseng et al, 2019). https://www.biorxiv.org/content/10.1101/524827v1.

Supplementary Material

本論文のSupplementary Materialは、以下のサイトでオンライン公開されています。 https://www.frontiersin.org/articles/10.3389/fgene.2019.00584/full#supplementary-material

Beach, T. G., Adler, C. H., Sue, L. I., Serrano, G., Shill, H. A., Walker, D. G., and al. (2015). アリゾナ加齢・神経変性疾患研究会、脳・身体提供プログラム。 Neuropathology 35, 354-389. doi: 10.1111/neup.12189

PubMed Abstract | CrossRef Full Text | Google Scholar

Beyer, K. (2006). Α-シヌクレインの構造、翻訳後修飾、凝集エンハンサーとしてのalternative splicing。 Acta Neuropathol. 112, 237-251. doi: 10.1007/s00401-006-0104-6

PubMed Abstract | CrossRef Full Text | Google Scholar

Beyer,K., and Ariza,A. (2012). 神経変性の引き金となるα-シヌクレインの翻訳後修飾とalternative splicing。 Mol. Neurobiol. 47, 509-524. doi: 10.1007/s12035-012-8330-5

CrossRef Full Text | Google Scholar

Beyer, K., Domingo-Sàbat, M., Humbert, J., Carrato, C., Ferrer, I.、and Ariza, A. (2008). レビー小体病におけるα-シヌクレイン、パーキン、シンフィリン-1アイソフォームの発現の違い。 Neurogenetics 9, 163-172. doi: 10.1007/s10048-008-0124-6

PubMed Abstract | CrossRef Full Text | Google Scholar

Beyer, K., Domingo-Sàbat, M., Lao, J. I. , Carrato, C. , Ferrer, I., and Ariza, A. (2007). 新しいα-シヌクレインアイソフォームの同定と特徴づけ、レビー小体病におけるその役割。 Neurogenetics 9, 15-23. doi: 10.1007/s10048-007-0106-0

CrossRef Full Text | Google Scholar

Beyer, K., Humbert, J., Ferrer, A., Lao, J. I. , Carrato, C. , pez, D.L. , et al. レビー小体型認知症とアルツハイマー型認知症におけるαシヌクレイン126mRNAレベルの低さ。 Neuroreport 17, 1327-1330. doi: 10.1097/01.wnr.0000224773.66904.e7

PubMed Abstract | CrossRef Full Text | Google Scholar

Fabian, M. R., Sonenberg, N. , and Filipowicz, W. (2010). マイクロRNAによるmRNAの翻訳と安定性の制御。 Annu. Rev. Biochem. 79, 351-379. doi: 10.1146/annurev-biochem-060308-103103

PubMed Abstract | CrossRef Full Text | Google Scholar

Edgar, R. C. (2004). MUSCLE: 高精度・高スループットの多重配列アライメント。 Nucleic Acids Res. 32, 1792-1797. doi: 10.1093/nar/gkh340

PubMed Abstract | CrossRef Full Text | Google Scholar

Kalivendi, S. V., Yedlapudi, D., Hillard, C.J., and Kalyanaraman, B. (2010).の記事参照。 酸化剤はΑ-シヌクレインのオルタナティブスプライシングを誘発する:パーキンソン病への示唆。 Free Radic. Biol. Med. 48, 377-383. doi: 10.1016/j.freeradbiomed.2009.10.045

PubMed Abstract | CrossRef Full Text | Google Scholar

Kim, W. S., Gedal, K. K. , and Halliday, G. M. (2014). レビー小体病におけるα-シヌクレインの生物学。 アルツハイマーズ・リサーチ・サー(Alzheimers Res.Ther. 6, 1-9. doi: 10.1186/s13195-014-0073-2

CrossRef Full Text | Google Scholar

Kohli, M. (2017). アンドロゲン受容体バリアントAR-V9は前立腺がん転移巣においてAR-V7と共発現し、アビラテロン耐性を予測する。 Clin. Cancer Res. 23, 1-13. doi: 10.1158/1078-0432.CCR-17-0017

CrossRef Full Text | Google Scholar

Lee, H.-J., Choi, C., and Lee, S.J. (2001). 膜結合型Α-シヌクレインは高い凝集傾向を持ち、細胞質型の凝集の種になる能力がある。 J. Biol. Chem. 277, 671-678. doi: 10.1074/jbc.M107045200

CrossRef Full Text | Google Scholar

Lutz, M. W., Saul, R., Linnertz, C., Glenn, O.-C., Roses, A. D., and Chiba-Falek, O. (2015). SNCAのイントロン4におけるシトシン・チミン(CT)リッチハプロタイプは、アルツハイマー病におけるレビー小体病理のリスクを与え、SNCAの発現に影響を与える。 Alzheimers Dement. 11, 1133-1143. doi: 10.1016/j.jalz.2015.05.011

PubMed Abstract | CrossRef Full Text | Google Scholar

Martin, M., Patterson, M., Garg, S., Fischer, S. O., Pisanti, N., Klau, G. W., et al (2016). WhatsHap: fast and accurate read-based phasing. bioRxiv .doi: 10.1101/085050

CrossRef Full Text | Google Scholar

McKeith, I. G., Dickson, D. W., Lowe, J., Emre, M., O’Brien, J. T., Feldman, H.、他 (2005). レビー小体型認知症の診断と管理:DLBコンソーシアムの第3回報告書。 Neurology 65, 1863-1872. doi: 10.1212/01.wnl.0000187889.17253.b1

PubMed Abstract | CrossRef Full Text | Google Scholar

McKeith, I. G., Perry, E. K. , および Perry, R. H. (1999). 第2回レビー小体型認知症国際ワークショップの報告:診断と治療. レビー小体型認知症に関するコンソーシアム. Neurology 53, 902-905. doi: 10.1212/WNL.53.5.902

PubMed Abstract | CrossRef Full Text | Google Scholar

McLean, J. R., Hallett, P. J., Cooper, O., Stanley, M., and Isacson, O. (2012). パーキンソン病脳領域およびαシヌクレイン過剰発現トランスジェニックマウスにおける完全長αシヌクレインおよびその3つの交互スプライシングバリアントの転写発現レベル。 Mol. Cell. Neurosci. 49, 230-239. doi: 10.1016/j.mcn.2011.11.006

PubMed Abstract | CrossRef Full Text | Google Scholar

Poplin, R., Ruano-Rubio, V., DePristo, M. A., Fennell, T. J., Carneiro, M. O., Van der Auwera, G. A., et al(2018).。 Scaling accurate genetic variant discovery to tens of thousands samples. bioRxiv .doi: 10.1101/201178

CrossRef Full Text | Google Scholar

Rhinn, H., Qiang, L., Yamashita, T., Rhee, D., Zolin, A., Vanti, W.ら (2012). パーキンソン病の病態における収束メカニズムとしてのΑ-シヌクレイン転写物の代替使用。 Nat. Commun. 3, 889-821. doi: 10.1038/ncomms2032

CrossRef Full Text | Google Scholar

Sandor, C., Robertson, P., Lang, C., Heger, A., Booth, H., Vowles, J., et al(2017).参照).Sandor, C., Robertson, P., Lang, C. , H. and H., Vowles, J., et al. 精製した患者由来のドーパミンニューロンのトランスクリプトームプロファイリングにより、パーキンソン病の収束的な摂動と治療法を特定した。 Hum. Mol. Genet. 54, ddw412-ddw415. doi: 10.1093/hmg/ddw412

CrossRef Full Text | Google Scholar

Treutlein, B., Gokce, O., Quake, S. R. and Südhof, T. C. (2014). 1分子ロングリードmRNAシーケンシングによってマッピングされたneurexin alternative splicingのカートグラフィー。 Proc. Natl.Acad. Sci. 111, E1291-E1299. doi: 10.1073/pnas.1403244111

PubMed Abstract | CrossRef Full Text | Google Scholar

Tseng, E., Rowell, W. J., Omolara-Chinue, G., Hon, T., Barrera, J., Kujawa, S., et al(2019).。 The landscape of SNCA transcripts across synucleinopathies: New insights from long reads sequencing analysis. bioRxiv .doi: 10.1101/524827

CrossRef Full Text | Google Scholar

Tseng, E., Tang, H.-T., AlOlaby, R. R., Hickey, L. and Tassone, F.(2017).[1]。 プレミューテーションキャリアにおけるFMR1スプライシングバリアントのランドスケープの発現変化。 Biochim. Biophys. Acta Gene. Regul. Mech. 1860, 1117-1126. doi: 10.1016/j.bbagrm.2017.08.007

CrossRef Full Text | Google Scholar

Xu, W., Tan, L., and Yu, J.-T. (2014). SNCA遺伝子とパーキンソニズムの関連性。 Neurobiol. Aging 36, 1-14. doi: 10.1016/j.neurobiolaging.2014.10.042

CrossRef Full Text | Google Scholar

Yeh, H.-S., and Yong, J.(2016).:パーキンソン病とSNCA遺伝子の関連性. mRNAの代替ポリアデニル化。 3′-untranslated region matters in gene expression(遺伝子発現における3′-非翻訳領域の重要性)。 Mol. Cell 39, 281-285. doi: 10.14348/molcells.2016.0035

PubMed Abstract | CrossRef Full Text | Google Scholar

.

コメントを残す

メールアドレスが公開されることはありません。