日本史資料データベースの入出力・検索環境における字形・字体および語彙の研究
【研究分野】情報システム学(含情報図書館学)
【研究キーワード】
字形 / 字体 / 語彙 / Glossary / synonym dictionary / source version files / Vocabulary / database
【研究成果の概要】
既存の「古文書目録データベース」を前提に、相互に連携して動作する「古文書目録データベース(底本別管理)」・「古文書目録データベース(諸本統合)」を開発し、古文書の全文および画像を表示する機能、複数底本に収録された同一文書を相互に参照する機能を実現した。これによって、個々の古文書がどのような文字および字形・字体で表現されているかをデータベース上で確認すること、および、複数底本に収録された同一文書の文字および字形・字体を相互に比較検討することが可能になった。また、外字辞書・外字単語辞書・同義語辞書を開発し、辞書とデータベースとの連携によって、外字辞書・外字単語辞書の検索結果をデータベースの入力データとして取得する機能、外字単語辞書を参照してデータベースから索引語句を抽出する機能、同義語辞書を参照して同義語を並列検索する機能を実現した。さらに、2001年2月の本所歴史情報処理システムの更新に伴って、SHIPSデータベースの外字表示を可能とし、上記データベースをSHIPSに移行して本格運用を開始した。
「平安遺文フルテキストデータベース」・「古文書フルテキストデータベース」について、データを修正して外字表示を実現した。「奈良時代古文書フルテキストデータベース」については、『大日本古文書 編年文書』(正倉院文書)の全文を外字表示可能な形式で入力した。「古文書目録データベース(底本別管理)」・「同(諸本統合)」の各項目については、データを修正して外字表示を実現するとともに、外字を辞書に登録し、入力・検索を可能とした。また、「古文書目録データベース(諸本統合)」のうち「入来院家文書」について、画像表示および複数底本相互参照に必要なデータを入力した。これらの作業を通して、日本史資料に現れる文字・字形・字体および語彙について検討した。
【研究代表者】