首都大学東京 理工学研究科分子物質化学専攻 生物化学研究室

HOME

研究プロジェクト

リボヌクレオプロテオミクス研究に向けたLC-MS システムの開発

Development of a LC-MS system for ribonucleoproteome analysis

田岡万悟1,4 中山洋2,4 高橋信弘3,4 礒辺俊明1,4
Masato Taoka, Hiroshi Nakayama, Nobuhiro Takahashi, Toshiaki Isobe

1.首都大学東京 大学院 理工学研究科 分子物質科学専攻
2.理化学研究所 基幹研究所 先端技術基盤部門 バイオ解析チーム
3.東京農工大学 共生科学技術研究院 生命農学部門
4.CREST

要旨

近年、ゲノム上の非コード領域などから生じるnon-coding RNA(ncRNA)とタンパク質の複合体(RNP複合体)が転写や翻訳を始めとする細胞機能の調節に重要な役割を果たしていることが明らかになっている。RNP複合体に関する従来の研究では、タンパク質成分はプロテオミクスの方法で解析し、RNA成分はタンパク質とは独立に、逆転写反応で変換したcDNAを解析する間接的な方法により解析されてきた。筆者らは、最新の質量分析法によってRNP複合体などを構成するRNAをタンパク質と同時に直接ゲノム上に帰属して同定し、転写後修飾を含む化学構造を高精度で解析できるリボヌクレオプロテオミクス研究のための革新的なプラットフォームの開発を進めている。本稿では、この方法の現状とRNP複合体解析への応用について紹介した。

はじめに

近年の研究により、RNAはゲノムに保存された遺伝情報とタンパク質を繋ぐ中間体としての役割に加えて、染色体の安定性やリモデリング、転写や翻訳、物質輸送を含む多彩な細胞機能の調節に重要な役割を担っていることが明らかにされている。これらのRNAの多くはタンパク質をコードしないゲノム上の非コード領域や特定の遺伝子のイントロンから転写され、複雑な転写後修飾を受けたのち、複数のタンパク質成分と複合体を形成して機能することが知られている。”non-coding RNA(ncRNA)”と総称されるこれらのRNAは、microRNAやpiwiRNAなどのサブクラスに分類されるが、いずれも生物の発生や分化などの高次機能の調節に直接関与すること、またその異常はガンや形態形成不全を伴う各種の疾患の原因となることが報告されている。したがってncRNAの研究は、細胞機能を解析する基礎生物学だけでなく、ガンを始めとする疾病の早期診断を目指す臨床研究や、創薬の標的あるいは医薬品の素材としても注目されている。

ゲノムから転写されたncRNAはただちに特定のタンパク質群と複合体を形成し、糖や塩基の修飾やプロセシングなどの複雑な過程によって成熟することが知られている。したがって、ncRNAの構造や機能、生合成過程を理解するためには、RNA-タンパク質複合体(RNP複合体)を単位として、その細胞内でのダイナミクスを包括的に解析する研究が重要である。筆者らは、プロテオミクスとRNA研究を融合した機能性RNP複合体に関する研究を「リボヌクレオプロテオミクス」と呼ぶことを提案し、そのための方法論の開発を進めている。最新の質量分析法を中心としたRNA解析のための基本的なプラットフォームの概要を図1に示した。この方法では、親和性タグなどを利用して細胞から分離したRNP複合体に含まれるRNA成分をリボヌクレアーゼで消化し、生成したRNA断片のタンデム質量分析データからゲノム情報を利用して目的のRNAを同定すると同時に転写後修飾を含む化学構造を解析することを目標としている。本稿では、LC-MS法を利用した従来のRNA研究の概要と、筆者らが開発を進めているRNA解析のための質量分析プラットフォームの現状について紹介した。

図1

PAGETOP

LC-MS法を利用したRNA研究

ncRNAを含むRNAの多くは転写後に特定の糖や塩基が修飾されて成熟することが知られている。現在、原核生物から真核生物にいたる生物種のRNAについて、少なくとも107種類の修飾が報告されている(1)。これらの修飾は、水素付加やメチル化、異性化、塩基へのアミノ酸や糖の付加、5’末端のトリメチルグアニル化など、多様性に富んでいる。従来のRNA修飾の解析は、主として細胞内含量の多いtRNAやrRNA、あるいは低分子核内RNA(snRNA)で行われているが、これらのRNAでの修飾は、基質分子受容能力の調節や立体構造の安定化(2)、細胞内局在の調節(3)、抗生物質耐性(4)など、RNA分子の構造と機能の発現や調節に必須であることが知られている。一般にRNAの転写後修飾は、基本的に4種類のみの構成要素からなるRNAに多様性を付与し、生体が少ない材料で多様な機能と複雑な調節を可能とするための戦略の1つになっていると考えられる。従来から研究が進んでいるスプライセオソームやリボソームなどのRNP複合体の生合成や機能の調節には、核小体RNA(snoRNA)などによって規定される部位特異的なメチル化や擬ウリジル化などの極めて複雑で精密な転写後修飾が関わっていることが多くの研究によって明らかになっている。したがって、転写後修飾の解析はRNAの構造と機能の研究にとって本質的に重要な意味をもっている。

一方、従来のRNA研究は、主として逆転写反応によって合成したcDNAをPCR法で増幅し、塩基配列分析装置やアレイ法で分析する間接法によって行われてきた。これらの方法は効率よく微量のRNAを解析できるため、細胞のRNAを高感度で網羅的に分析する目的には適しているが、逆転写酵素の特異性に由来するさまざまな問題点とともに、定量的な分析が難しいことや転写後修飾の解析ができないなどの多くの問題も抱えていた。RNAの質量分析法は、主として、こうした従来法の欠点を補う転写後修飾の解析法の1つとして古くから行われてきた(5, 6)。最近の研究では、例えば東京大学の鈴木らは質量分析法を利用して、機能未知遺伝子群から網羅的にRNA修飾遺伝子を探索する研究(7)や、RNA修飾異常に起因する疾患の研究(8)、RNA修飾が決定するtRNAの細胞内局在化機構の研究(3)やncRNAに含まれるRNA修飾の同定(9)などの成果を報告している。また、オリゴヌクレオチド間の塩基対形成能を利用して複数のRNA分子を同時に単離精製する技術を開発し(10)、この方法と質量分析法を組み合わせることで、肝実質細胞に特異的に発現してコレステロールや脂肪酸の代謝に関与しているmiRNA(miR-122)の安定化に寄与するアデニル化修飾を発見するとともに、この修飾がポリAポリメラーゼGLD-2によるものであることを明らかにしている(11)。

PAGETOP

リボヌクレオプロテオミクス研究のためのRNA質量分析法

RNAのLC-MS法の高性能化

筆者らは、RNP複合体などを構成する低分子RNAを直接分析することで、それぞれのRNAをゲノム情報に帰属し、転写後修飾も含めた構造と機能の関係を明らかにすることを目標としている。この方法の大きな特徴は、試料に含まれるRNA成分をゲノム上に帰属することで、目的とするRNP複合体に含まれるRNAを予備知識によってあらかじめ予見することなく、未知の分子種も含めて同定できることである。この方法の開発にあたって筆者らは、プロテオミクス研究のために開発したダイレクトナノフローLC-MSショットガン解析システム(12)をRNA分析のために最適化することを基本的な戦略としたが(図1)、RNAはタンパク質に比べて構築単位が少なくて化学的な多様性が小さいこと、またタンパク質はゲノムの約2%ほどを占めるORFに規定されるのに対し、RNAはゲノムの全領域から生成し、しかも転写領域が明確に定義されていないことなどから、さまざまな検討や研究が必要であった。

RNAのLC分離に関する研究では、各種の逆相カラムと分離条件の組み合わせについて検討し、リン酸基に富む化合物であるRNAに対して保持能力が高いシリカ系C-30逆相系充填剤と塩基性条件下でRNAとイオンペアを形成する揮発性の高い分離媒体の共存イオンを選定することで分離を最適化し、低分子RNAやそのRNase消化物を効率よく分離できるナノLC法を開発した(13)。また、内径150μmのエレクトロスプレーカラムを装着したナノLCから50-100 nL/分の微流速で送液されてくるRNA溶出液にオンラインで連続的にアセトニトリルを添加し、負電荷をもつ親水性のRNA成分を、従来は困難とされてきた「ネガティブモード」で安定してイオン化するための補助スプレー装置を試作して装着した。これらの研究で開発したLCシステムを質量精度が極めて高い電場型フーリエ変換質量分析計と連結し、さらには独自に開発した配列データベース検索エンジン(Ariadneと命名:後述)と組み合わせて、RNAを効率良く分離して質量分析(MS)およびタンデム質量分析(MS/MS分析)し、配列データベースから非予見的に特定のRNAを同定できるプロトタイプRNA解析システムを試作した。

このシステムは、化学合成したsiRNAや無細胞合成系で合成したmRNAなどをRNase T1で消化して得られたRNA断片(オリゴリボヌクレオチド)の精密質量分析や塩基組成の分析に有効であったが、RNAの分析感度は、同様のシステムによってタンパク質を分析した時の感度に比べて約1/10程度であった。そこで、このシステムを高感度化するため、 RNA試料のRNase消化物をESIカラムに導入するために使用する「トラップカラム」を微少化、精密化し、さらにナノLCから溶出したRNA断片を効率よくイオン化するための補助スプレー装置を改良した(特許出願済)。また、培養細胞やRNP複合体に含まれるRNAを電気泳動で分離後にゲル内でRNase消化してLC-MSシステムに導入するための前処理法を最適化した。これらの改良により、現在のシステムでは試作品に比べてRNAの分析感度が約10倍向上し、培養細胞などから親和性タグを利用して分離した微量のスプライセオソーム(後述)やリボソーム先駆体に含まれるフェムトモルレベルのタンパク質とRNA成分をほぼ同程度の感度で同定し、その塩基配列や、メチル化などの修飾を含めた化学構造もタンパク質成分と同時に解析することができるようになった(13)。さらに現在では、試料に含まれるRNAの分離から前処理、LC-MS分析とデータ解析に至るシステムの全自動化を進めている。

RNA検索のためのソフトウエア

前項でも触れたように、RNAを含む核酸の化学構造を質量分析法によって解析する研究は古くから行われていたが、RNAの質量分析情報とりわけタンデム質量分析法で得られたRNA断片のMS/MS情報からゲノム情報を利用してもとのRNAを特定し、その化学構造を解析する試みは行われていなかった。筆者らは、同様の方法がプロテオミクス研究では既に一般的であり、しかもこの方法がRNA研究に適用できれば、ゲノム情報を利用して従来は知られていない未知のRNAも同定できること、またRNAの機能発現や調節に不可欠な転写後修飾や細胞内での代謝過程の解析も可能になると考えた。この方法を実現するための中心となる技術の1つがRNAの質量分析情報をゲノム情報と連結するソフトウェア、すなわちゲノム検索エンジンであった。これと同様の機能をもつソフトウエアは、プロテオミクスではMascotやSequestなどとして一般に知られているが、開発をはじめてみると、タンパク質を対象としたソフトウェアで使用されているアルゴリズムをそのままRNA解析に適用することができないことがわかった。その主な理由は次の通りである。

1) RNAとタンパク質はいずれも直鎖状ポリマーであるが、タンパク質は両末端と特定の側鎖のみに解離基を持つ(アルギニン、ヒスチジン、リジンの側鎖残基)のに対して、RNAは主鎖に解離基(リン酸基)を持つため、衝突解離(CID)法によるMS/MS分析でのRNAの断片化プロファイルはペプチドとは大きく異なる(後述)。

2)現在の質量分析技術ではRNAなどの高分子をそのまま分析して構造解析することは困難であるため、RNaseなどで消化して生じたRNA断片の質量分析情報からもとのRNAを特定し、その構造を解析することが必要である。しかし20種類のアミノ酸から構成されるタンパク質に比べて、RNAは4種類のヌクレオチド成分のみから構成される多様性の小さい高分子であるため、質量分析法で解析可能な比較的小さいRNA断片の配列情報から元のRNAを特定することが困難である。

3)タンパク質はコード領域の大部分がORFとして規定されており、配列DBもよく整備されているのに対して、非コードRNAに対応するゲノムDNAの特定は研究が進められている段階で、現状では予測が困難である。このためRNAを同定するためには独自の非コードRNA DBを構築するか、ゲノム配列全体をDBとして検索することが必要である。

これらの問題点を解決しながらRNAの検索エンジンを開発する目的で、筆者らは、まず始めに衝突解離法によって得られるRNA断片の開裂パターンを詳細に解析した。これまでRNAのMS/MS解析はほとんど行われておらず、DNAと同様だとする報告や異なるとする報告が混在する状況であったため(14, 15)、合成RNAや生体から単離した既知RNAのMS/MSスペクトルデータを収集することで、衝突解離法でのRNAの断片化ルールを実験的に解析した。その結果、開裂しうる主鎖リン酸部分のうちc/y位とa/w位の2箇所が選択的に開裂することがわかった(図2)。また、RNAではタンパク質と異なり主鎖に荷電部位があるために内部イオンが強く検出されること、DNAでは塩基の脱離が高い頻度で生じるのに対してRNAではほとんど塩基脱離が生じないなど、RNAに特異な開裂様式があることがわかった。この開裂様式はエレクトロスプレーイオン化法やMALDI法(16)、あるいはイオントラップ型やハイブリッド型質量分析装置などの方法に依存せず一致することから、衝突解離法によるRNAの開裂に普遍的なルールと考えられた。

図2a

図2b

「Ariadne」(17)は、これらの研究を基礎にして筆者らが開発した世界で初めてのRNA検索エンジンである(特許出願済:http://ariadne.riken.jp/)。このソフトウェアは、RNaseなどによって塩基配列特異的に切断したRNA断片から得られる一連のMS/MSデータのセットから、元のRNAを特定するソフトウエアである(図3)。 その最大の特徴は、検索を@ MS/MSデータによるRNA断片の配列分析と同定(MS/MSイオン検索)とA 同定した複数のRNA断片の配列情報を利用したRNAの同定(ヌクレオチドマッピング法)の二段階で行うことである。一段階目のMS/MSイオン検索では、実際のMS/MS開裂パターンを考慮した確率モデルによって試料RNAに由来するMS/MSデータを定量的に評価し、最も一致度の高いRNA配列を同定する。二段階目のヌクレオチドマッピング法では、MS/MSイオン検索で同定した複数の配列をDB中での出現確率に基づいて評価し、あるRNAが同定される確率がランダムな事象よりも有意に低いか否かを計算することで特定のRNAを同定する。このヌクレオチドマッピング法はプロテオミクスで使用される検索エンジンには無い独自のものであり、このアルゴリズムを考案することではじめて構成成分の多様性が少ないRNAをゲノム情報を利用して確実に同定することができるようになった。また、開発から改良を重ねた現在のAriadneでは、小規模なRNA DB(公開されている低分子RNA DBなど)だけではなく、ヒトやマウスなどの巨大な哺乳類ゲノムを直接検索して特定のRNAを同定できるようになっている。ちなみにヒトゲノムを対象としたAriadneの検索時間は現状でも1〜2 時間程度であり、実用的にも十分に使用できるものとなっている。また、上記の2段階評価法を採用したAriadneのRNA識別能は極めて高いため、現在では培養細胞などからプルダウン法で精製したRNP複合体に含まれるRNA成分を混合物のまま直接LC-MS分析し、そのMS/MSデータを配列DBに対して検索することで、試料に含まれる複数のRNA成分を同定すると同時にメチル化などの簡単な転写後修飾を解析できるようになっている。

図3

PAGETOP

RNP複合体のリボヌクレオプロテオミクス研究:RNAとタンパク質の並行解析

筆者らは、細胞内に存在するRNP複合体を系統的に解析することで細胞の機能性RNP複合体の構成や生合成、機能調節機構を明らかにするとともに、RNAとタンパク質の相互作用ネットワークに関する知見を得ることを目標としている。例えば、特定のタンパク質をベイトにして免疫沈降法などで精製したRNP複合体を構成するタンパク質とRNA成分を並行して迅速に同定することで、目的とする複合体の構造と機能のダイナミクスを明らかにすることができるし、機能未知のRNA結合タンパク質を含むRNP複合体を分離できればその構成成分の同定が機能解析の端緒となり、さらにはRNA−タンパク質の相互作用に関する新しい知見が期待できる。

本稿で紹介したAriadneを組み込んだRNAの質量分析法を適用して、酵母のスプライセオソーム先駆体を分析した例を図4図5に示した。この例では、多段階アフィニティータグを導入した「Lsm-3タンパク質」をベイトにして酵母細胞(S.cerevisiae)から分離精製したスプライセオソーム先駆体からフェノールクロロホルム抽出法とアセトン沈殿法を組み合わせた方法でタンパク質とRNAを抽出し(13)、それぞれの成分を電気泳動法で分析した(図4)。また、ここで検出したタンパク質成分は従来のプロテオミクス技術で同定し、RNA成分はRNase T1によるゲル内消化後にLC-MS/MS-Ariadneシステムで同定した(図5)。図5a にはRNAの電気泳動で検出されたもっとも高分子量のバンド(U4)のMS/MS情報から酵母ゲノムをAriadne検索して得られた「Score histogram」を示し、図5bにはこのバンドのMS/MSデータから同定したRNA断片を酵母ゲノムを構成するすべての染色体上にマップした結果を示した。いずれの結果もこのバンドがU4 snRNAであることを明確に示している。この研究では、Lsm3複合体を構成する約30種類の既知タンパク質と3種類の新規タンパク質とともに、この複合体の構成成分であるU4、U5S、U5L、U6 の4種類のsnRNAのすべてが同定できた。さらに、この分析で得られたMSスペクトルを詳しく解析してみると、これらのU-snRNAには、既知の5’キャップ構造やメチル化修飾のほかに、従来は知られていない3'末端転写終結位置の不均一性があることが明らかになった。この不均一性については、従来の分子生物学や細胞生物学の手法も併用しながら、その確認や生物学的な意義についての研究を進めている。また、筆者らはこの方法を利用して、酵母やヒト細胞から分離したスプライセオソームやリボソーム、マイクロRNA代謝に関わるさまざまなRNP複合体の解析を進めている。

図4

図5

PAGETOP

おわりに

筆者らはプロテオミクスとRNA研究が融合した「リボヌクレオプロテオミクス」研究が、今後の生命科学の進展に極めて重要であると考えている。本稿で紹介したRNAの質量分析法は、ゲノム情報を利用してRNAを非予見的に同定して転写後修飾を含む化学構造を解析する従来にはない新しい概念と方法論を提供するものであり、従来から行われてきた逆転写反応を利用したRNA解析法を補完するリボヌクレオプロテオミクス研究の基礎技術の1つとなることが期待される。本稿で述べたように、現在この方法は、培養細胞などから分離したフェムトモルレベルのRNP複合体のRNA成分をタンパク質成分とほぼ同じ感度で同定し、化学構造を解析できるようになっている。今後はさらなる高感度化と定量法などを検討することで、細胞機能を調節するさまざまなRNP複合体の解析、とりわけ現在はまだよく知られていないマイクロRNA代謝に関わるRNP複合体の生合成や機能調節に関わるRNAの修飾や分子集合機構、さらには細胞の環境変化に依存したRNP複合体のダイナミクスの解析やRNA-タンパク質のネットワーク解析などの研究に寄与することが期待される。

図の説明

図1.リボヌクレオプロテオーム析の概念図解

組織や培養細胞から精製したRNP複合体を構成するRNAとタンパク質を並行して同定し、同時にその化学構造を解析する。

図2.MS/MSにおけるRNAの開裂傾向

(a) RNAの開裂部位を模式的に示した。衝突解離型のMS/MSではc/yタイプの娘イオンとa/wタイプの娘イオンが生じる。c/yタイプに比べa/wタイプがやや弱く検出される傾向がある。b/x、d/zタイプのイオンはほとんど検出されない。
(b) 酵母フェニルアラニンtRNAのRNaseT1消化断片5'-AUUUAmG-3'(mGはメチルグアニン)の実際のMS/MSスペクトル。主なシグナルはc/yタイプとa/wタイプ。

図3.データベース検索エンジンAriadneのシステム構成

図4.酵母スプライセオソーム先駆体の構成成分分析

Taoka M. et al.: Nucleic Acids Res (2009) doi:10.1093/nar/gkp732より改変して転載。(a) Lsm3をベイトとしてプルダウンした複合体のタンパク質のSDS-PAGE。タンデムアフィニティータグを使った2段階精製によって得られたタンパク質を泳動後クマシー染色した。主なタンパク質成分の同定結果はレーン右側に示した。(b) 同じ複合体に含まれるRNAのUrea-PAGE。染色はSYBR Goldによる。RNAの同定結果はレーン右側に提示した。その他、詳しくは文献を参照。

図5.LC-MS-Ariadneによるスプライセオソーム複合体に含まれるU4 snRNAの同定

図4bに示した「U4」のバンドを切り取り、LC-MSで分析してAriadneで解析し、U4snRNAを同定した。(a)は同定の際のヌクレオチドマッピングのスコアの頻度分布、(b)はバンドU4のMS/MSデータから同定したRNA断片を酵母染色体上にマップした結果。酵母ゲノム上にマップされたRNA断片群の位置とU4snRNAがコードされている位置が一致している。

キーワード

・LC-MS ・RNA ・リボヌクレオプロテオミクス

謝辞

本研究はJST が支援する CREST 研究の資金によるものである。この原稿を書くに当たり、ご協力いただいた山内芳雄博士、延優子氏、正木俊平博士に感謝いたします。

文献

  1. Juhling F. et al.: Nucleic Acids Res (2009) 37: D159-162.
  2. Goto-Ito S. et al.: Nat Struct Mol Biol (2009) 16: 1109-1115.
  3. Kaneko T. et al.: EMBO J (2003) 22: 657-667.
  4. Okamoto S. et al.: Mol Microbiol (2007) 63: 1096-1106.
  5. Banoub J. H. et al.: Chem Rev (2005) 105: 1869-1915.
  6. Noma A. et al.: 蛋白質核酸酵素 (2006) 51: 2226-2231.
  7. Noma A. et al.: EMBO J (2006) 25: 2142-2154.
  8. Suzuki T. et al.: EMBO J (2002) 21: 6581-6589.
  9. Ohara T. et al.: Nat Struct Mol Biol (2007) 14: 349-350.
  10. Miyauchi K. et al.: Nucleic Acids Res (2007) 35: e24.
  11. Katoh T. et al.: Genes Dev (2009) 23: 433-438.
  12. Natsume T. et al.: Anal Chem (2002) 74: 4725-4733.
  13. Taoka M. et al.: Nucleic Acids Res (2009) doi:10.1093/nar/gkp732.
  14. Huang T. Y. et al.: J Am Soc Mass Spectrom (2008) 19: 1832-1840.
  15. Schurch S. et al.: J Am Soc Mass Spectrom (2002) 13: 936-945.
  16. Douthwaite S. et al.: Methods Enzymol (2007) 425: 1-20.
  17. Nakayama H. et al.: Nucleic Acids Res (2009) 37: e47.
PAGETOP