政治テキストの内容分析システムの構築
【研究分野】政治学
【研究キーワード】
政治テキスト / 内容分析 / 頻度分析 / 主成分分析 / クラスター分析 / コンピュータ / 政治概念 / 認知構造図 / 総理演説 / 政治分析
【研究成果の概要】
本年度は、最終年度として政治テキストの分析ソフトウェアシステムとして『Content Analyzer』を完成させた。昨年度までの作業で、複数テキスト・ファイルからの検索と該当個所の抽出、概念の単純頻度計測および同時出現頻度の計測は実現していたが、本年度はこれらのデータから主成分分析およびクラスター分析を行うルーティンを追加し、テキストの分析システムとしての一貫性を持ったソフトウェアとして『Content Analyzer』を完成させるための作業を行った。なお、本作業で作成したソフトウェアについては、当初CASPT(Content Analyzing System of Political Texts)というものを考えていたが、実現したソフトウェアの実用範囲は必ずしも政治テキストのみにとどまらない汎用性をもつことにかんがみ、より一般的な『Content Analyzer』とした。また、本年度の作業としては、『Content Analyzer』の研究補助ソフトとしての有用性を試す意味から、現実の政治テキストとして、総理大臣の国会演説を利用して、さまざまな分析を試みた。その結果、複数テキスト・ファイルからの検索・抽出といった最も単純な機能も、きわめて有用であることが確認されたし、単純頻度計測や同時出現頻度の計測も、汎用の表計算ソフトと結び付けることで、政治学的に意味ある分析を容易にできる。また、主成分分析やクラスター分析のルーティンを加えたことによって、複数テキスト間の類似度が視覚的に判断できるようになった。市販のソフトの中には、複数テキスト間の類似度を示すものがいくつか登場してきているが、いかなる基準でそれらのテキストが類似しているのかを確認する方法がない。『Content Analyzer』は、その点、みずからの基準をはっきりさせた上で、複数テキスト間の類似度を計測できるため、研究ツールとしては、より有用性が高いと思われる。
【研究代表者】
【研究分担者】 |
服部 正太 | 構造計画研究所 | 創造工学部 | 部長 |
野中 尚人 | 学習院大学 | 法学部 | 教授 | (Kakenデータベース) |
原田 至郎 | 東京大学 | 東洋文化研究所 | 助手 | (Kakenデータベース) |
|
【研究種目】基盤研究(A)
【研究期間】1995 - 1997
【配分額】8,900千円 (直接経費: 8,900千円)