統計的手法と生成過程モデリング手法の融合に基づく音声生成機能拡張技術の構築
【研究分野】知覚情報処理
【研究キーワード】
音声変換 / 音声合成 / 信号処理 / 統計処理 / 機能拡張
【研究成果の概要】
本研究では、音声生成過程における物理的制約により生じる障壁を取り除くために、音声生成機能を拡張するための基盤技術および応用技術の研究開発に取り組んだ。高精度な音声変換処理を可能とする統計的手法と、発声器官動作操作による音声変換処理を可能とする音声生成過程モデリング手法を融合させることで、現存の音声生成過程との親和性に優れ、かつ、高品質な変換処理を実現する音声変換手法を構築した。また、音声生成機能拡張の応用技術として、失われた声を再び取り戻すための発声障碍者補助技術、個人性を保持した外国語発声の生成技術、体内伝導音声を活用した周囲環境に頑健な通話技術などを構築した。
【研究代表者】
【研究分担者】 |
亀岡 弘和 | 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 | メディア情報研究部 メディア認識研究グループ | 主任研究員(特別研究員) | (Kakenデータベース) |
中村 哲 | 奈良先端科学技術大学院大学 | 情報科学研究科 | 教授 | (Kakenデータベース) |
猿渡 洋 | 東京大学 | 情報理工学(系)研究科 | 教授 | (Kakenデータベース) |
サクリアニ サクティ | 奈良先端科学技術大学院大学 | 情報科学研究科 | 助教 | (Kakenデータベース) |
Neubig Graham (NEUBIG Graham) | 奈良先端科学技術大学院大学 | 情報科学研究科 | 助教 | (Kakenデータベース) |
川波 弘道 | 奈良先端科学技術大学院大学 | 情報科学研究科 | 助教 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2014-04-01 - 2017-03-31
【配分額】16,250千円 (直接経費: 12,500千円、間接経費: 3,750千円)