深層学習を用いたスペイン語の通時的研究
【研究キーワード】
スペイン語史 / 年代推定 / 地点推定 / 分散表現 / 言語変化 / 深層学習 / 計量文献学 / ロマンス語 / 年代推定・場所推定 / スペイン語 / 類推
【研究成果の概要】
・中近世スペイン語古文書の年代推定・地点推定の研究については,年代や緯度・経度で表された地点を連続変数とみなし,回帰モデルで推定する実験を行った。これまでは,年代と地点をともに離散変数とみなし,分類問題として解いていた。しかし,年代と地点は連続変数と考えた方がより自然である。文書ベクトルには,文字n-gram,単語n-gram,Doc2Vec,BERTによる分散表現を用いた。実験の結果,回帰モデルとしては,予測の信頼度として推定分散が求まるガウス過程の有効性が確認された。文書ベクトルとしては,Doc2VecやBERTによる分散表現ベースのものよりも,n-gramの方が優れていることが分かった。これは,文書の全体的な情報よりも,n-gramが捉える具体的な単語や文字連続が推定に効果的であることを示唆している。研究成果は国内学会・国際学会で発表した。
・前年度に引き続き,現代スペイン語品詞タガーを用いて品詞タグ付けした中近世スペイン語散文作品の品詞タグの人手での修正を行った。また,今年度,新たに,中世スペイン語騎士道物語『アマディス・デ・ガウラ』について,品詞タグ付けと人手での修正を行った上で,計量文献学的分析を行った。この作品の成り立ちには不明瞭な点があるが,計量文献学的見地からの分析は存在しない。分析の結果,定説を一部支持する知見が得られた一方,従来考慮されてこなかった別の可能性があることも判明した。研究成果は国内学会・国際学会で発表した。
・類推による古典ラテン語の動詞活用の平準化のモデリングの研究については,進展させることができなかった。
【研究代表者】
【研究種目】若手研究
【研究期間】2018-04-01 - 2023-03-31
【配分額】2,210千円 (直接経費: 1,700千円、間接経費: 510千円)