スパースモデリングによる発見的統計手法の開発
【研究キーワード】
高次元線形回帰 / スパース推定 / 因果推論 / 高次元検定 / 個別処置効果 / グラフィカルモデル / カウントデータ / スパースモデリング / 高次元データ / ロバスト推測 / グラフィカルモデリング / 関数推定
【研究成果の概要】
高次元線形回帰モデルにおける2グループ間の差異検出について,予測誤差に関する最適性の研究をおこなった.前年度までに構築した推定量が,予測誤差の意味でどの程度「良い」のか,理論的に検証するためである.具体的には,傾向スコアが既知の場合において,予測誤差のminimax最適な収束レートを導出し,比較・検証を進めた.提案した推定量は傾向スコアを未知として導出しているため,その収束レートはminimax最適なものよりも少し悪くなるものの,両者の差を規定するパラメータを明確にすることができた.
一方で,高次元パラメータを有する2標本問題についての研究も進めた.ただし,遺伝子データ解析への応用を目指し,2グループへの割り当てが共変量に依存するケースを扱った.遺伝子データ解析の文脈では,疾患の有無などでグループが構成されており,ランダムな割り当ての想定は実質的に不可能である.また,遺伝子データはその測定法によって連続・カウント・2値など多様な結果変数を有する.前年度に求めた同時検定統計量は,連続値を持つ結果変数のみを扱っていたため,まずはこれを拡張し,統一的な検定統計量へと再構築した.具体的には,各結果変数に対して一般化線形モデル,傾向スコアにロジスティック回帰モデルを想定し,2グループ間の差異を規定する高次元パラメータに対する最大値型検定統計量を構築した.そしてその検定統計量が,高次元漸近枠組み(サンプルサイズと変数の次元が共に大きくなる)において,ガンベル型の分布へと分布収束することを示した.これにより,高次元データにおいて2グループ間の差異を検出するための,適切な検定方式を実現することができた.
【研究代表者】
【研究種目】若手研究
【研究期間】2018-04-01 - 2023-03-31
【配分額】4,030千円 (直接経費: 3,100千円、間接経費: 930千円)