研究紹介

インタビュー
シーケンサーの技術進歩が解析を後押しする

全ゲノム解析では、ヒトのゲノム約30億塩基対が解読対象になる。したがって、膨大な量の塩基配列を決定しなければならない。これまで、疾患に関連する遺伝子の探索には、ゲノム上にとびとびに存在する一塩基多型を利用した「ゲノムワイド(ゲノム全域)関連解析」が広く使われてきたが、それに比べ、解読すべき塩基の量は何千倍にもなる。さらに、こうして得たゲノム配列情報から統計的に意味のある結論を引き出すためには、また何倍ものサンプル数が必要になるのである。したがって、次世代シーケンサーと呼ばれる高性能な装置が近年登場してようやく、がんの全ゲノム解読は可能になったのである。

「次世代シーケンサー」という呼び方は、第一世代シーケンサーに対比させて使われるようになった。第一世代は、2003年に完了したヒトゲノムプロジェクトで採用された技術で、処理スピードが遅く、1人分のヒトゲノムを解読するのに何年もの歳月を要した。そこで、配列解読の処理スピードを上げるとともに解析コストを下げるための技術開発が行われた。その結果登場したのが、次世代シーケンサーである。配列解読の並列処理や、光技術採用などのさまざまな工夫が行われ、処理能力は格段に向上した。

だが、「それでもまだ、性能は十分ではありません」と、柴田分野長は語る。ゲノムの約30億塩基対の配列中には、次世代シーケンサーでは配列を読み取りにくい場所があるのだという。最近は、そうした課題に対処できるように、次世代シーケンサーの中で技術改良がさらに進み、初期のいわば第二世代に対比して、多彩な特徴を備えた第三世代シーケンサーが登場してきている。柴田分野長たちは今後、こうした第三世代のシーケンサーも利用していく計画だ。

国立がん研究センターには、第三世代シーケンサーの1つ、PacBioが設置されている。PacBioは、DNAが1分子あれば塩基配列を読み取れるので、少量のサンプルでも事前に増幅する必要がないことが特徴だ。しかもリード長が長い。配列決定操作の際、1回で連続して読み取れる配列の長さを「リード長」と呼ぶが、このシーケンサーはそれが長く、3000〜7000塩基対ほどもある。したがって、従来のシーケンサーでは扱いにくかった、反復配列(同じ塩基の繰り返し)、遺伝子内のエキソンの位置の変化(スプライシングバリアント)などが解析できる。

柴田分野長たちは、このシーケンサーを活用していく予定だが、「現時点では、いろいろなタイプのシーケンサーを組み合わせて用いるのが有効です」と、付け加えた。リード長、試料量、処理スピード、配列決定精度などのすべてにおいて満足できる性能を備えた技術は、まだ登場していないからだ。

【国立がん研究センターに設置されているPacBio】

第三世代のシーケンサーの1つで、国内ではまだ導入例が少ない。