社会調査の基盤を提供する自由回答の自動コーディングシステムの開発と公開
【研究分野】社会学
【研究キーワード】
社会調査法 / 自由回答 / 自動コーディング / SSM 職業コーディング / ISCO コーディング / Web システム / 機械学習 / 確信度 / 社会調査 / SSM職業コーディング / ISCO自動コーディング / Webシステム / ISCOコーディング / ルールベース手法 / Web公開システム / 産業・職業自動コーディグ支援システム / サポートベクターマシン / クラス所属確率 / アンサンブル学習
【研究成果の概要】
社会調査では回答者の職業や産業は重要で、正確さを期するために自由回答で収集する場合が多い。しかし、統計処理のために収集後にコード化する作業が必須で、最近では国内標準コードに加えて国際標準コードの要請も生じており、コーダの負担が増大している。本研究では、自然言語処理や機械学習など人工知能における最新の成果を適用してコーディング作業を自動化し、結果を Web により入手できるシステムを開発した。その際、各コードには人間による見直しが必要か否かを 3 段階の確信度で付与するため、作業の大幅な軽減が見込める。
【研究代表者】
【研究分担者】 |
田辺 俊介 | 東京大学 | 社会科学研究所 | 准教授 | (Kakenデータベース) |
吉田 崇 | 静岡大学 | 人文社会科学部 | 准教授 | (Kakenデータベース) |
|
【研究協力者】 |
魏 大比 (豊原 明) | 代表 |
李 偉 | 東京工業大学大学院 | 理工学研究科 | 博士課程在学 |
|
【研究種目】基盤研究(C)
【研究期間】2010 - 2012
【配分額】4,290千円 (直接経費: 3,300千円、間接経費: 990千円)