非コードRNA遺伝子をゲノムワイドに発見する汎用システム
【研究キーワード】
非コードRNA / 遺伝子発見 / バイオインフォマティクス / 深層学習
【研究成果の概要】
これまで主に画像解析に用いられてきた深層学習手法の畳み込みニューラルネットワークや自然言語処理で用いられてきた文字列変換器を,非コードRNA配列に適用し,配列の分類やクラスタリング,そして機能解析を行うというバイオインフォマティクスの分野で最新の手法を提案した.具体的には,教師無し深層学習に基づく非コードRNAクラスタリングのアルゴリズムRNA-BERT(NAR Genomics and Bioinformatics誌掲載済)を開発した.RNA配列を効果的に埋め込むために,事前学習アルゴリズムを適用して,構造情報や配列の文脈情報を効果的に取り込んだRNA配列の埋め込みベクトルを計算する手法を開発した.事前学習によって得られた埋め込みベクトルの精度を検証するために,非コードRNAクラスタリングによるテストを実施し、既存の方法よりも優れた精度を達成した.
分担者である佐々木は,研究代表者のメタゲノムとメタトランススクリプトームを統合し、腸管部位間のマイクロバイオームの機能活性を解析可能にする新規手法開発に向け、健常個体のコモンマーモセット選定を実施し、DNAおよびRNA抽出用の食道、胃、十二指腸、小腸、大腸、糞便のサンプリングを実施した。細菌叢のDNAとTotal RNA抽出後,次世代シークエンサーによってRNA-Seqを行なった.現在,シークエンスされたデータを解析中である.
アサガオ花弁より発生段階を追ってサンプリングしたtotal RNAからライブラリーを調整し,RNA-seqを行った.サンプリングは開花72時間前から開花12時間後の3日半,3時間毎に3反復して行った.ゲノム編集で変異導入したアサガオが雌性不稔であることを確認した.リファレンスゲノム配列の精度を向上するために,一分子リアルタイムDNAシークエンサーと,Saphyrシステムによる光学マッピングによるアセンブリの統合を試みた.
【研究代表者】
【研究分担者】 |
佐々木 えりか | 公益財団法人実験動物中央研究所 | マーモセット医学生物学研究部 | 部長 | (Kakenデータベース) |
星野 敦 | 基礎生物学研究所 | 分野横断研究ユニット | 助教 | (Kakenデータベース) |
|
【研究種目】基盤研究(A)
【研究期間】2018-04-01 - 2023-03-31
【配分額】43,810千円 (直接経費: 33,700千円、間接経費: 10,110千円)