価格と文書に基づく経済対象のベクトル表現とその応用
【研究キーワード】
ベクトル表現 / 投資 / 埋め込み表現 / 深層学習 / 文書
【研究成果の概要】
本研究の目的は、株銘柄など経済対象のベクトル表現を、数値データと非数値データから機械学習により獲得し、投資に寄与するデータ工学手法を探究することである。研究内容には、ベクトル表現に加え、それを入力する価格の系列モデルの二つがある。また、得られたベクトル表現は、ポートフォリオ、リスク評価、経済対象の関係マイニングなど、さまざまに応用が考えられる。本研究では、価格データの中でもコーパスが得やすい株、為替を対象とし、米国と日本のデータを利用して基礎研究を行う。初年度は、事前研究として行った、ベクトル表現獲得とそのポートフォリオへの応用の一般化と詳細な研究が目的となっていた。
初年度はまず、研究の立ち上げを行った。データの整備、計算機環境の整備を行った。初年度の体制は、博士課程2年次の学生1名と、修士の学生2名で実質的な研究を行い、自然言語処理、並びに経済学の共同研究者にアドバイスをいただきながら進めた。
研究内容としては、予定通り、事前研究の発展に務めた。自然言語処理では一般的な、テキスト情報からのベクトル表現技術を、株価を予測することを通して獲得することに転用した。予測性能自体は向上しないが、得られたベクトル表現を株ポートフォリオに用いると、大きな利益が得られることが、事前研究において示されていた。事前研究では米国ニューヨーク市場株だけで行っていたが、多国の市場に拡張し、理論的に一般化したものを雑誌論文として投稿した。この論文は、年度の途中に条件付き採録となっているが、コロナ禍を原因として雑誌側の対応が遅れており、採録には至っていない。
事前研究は国際会議として論文発表したものがあったが、これに対しては、世界中から問い合わせが相次いだ。このため、ポートフォリオ配信サイトを構築し、その公開に向けて準備を進めている。
初年度は、この他、2年度に向けて、新しい研究の基礎研究を行った。
【研究代表者】
【研究分担者】 |
新谷 元嗣 | 東京大学 | 大学院経済学研究科(経済学部) | 教授 | (Kakenデータベース) |
宮尾 祐介 | 東京大学 | 大学院情報理工学系研究科 | 教授 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2021-04-01 - 2026-03-31
【配分額】16,900千円 (直接経費: 13,000千円、間接経費: 3,900千円)