【Research Report】テキストマイニングによる有価証券報告書の因果関係文以外の特徴文の抽出

サマリー

近年、金融市場においてテキストマイニングの注目度が増し、金融経済月報や企業の決算短信等様々な媒体に対してテキストマイニングを用いた研究が盛んに行われている。坂地ら[坂地他, 2015]は機械学習を用いて、決算短信から原因・結果を含む因果関係文を特徴文として抽出する手法を開発した。佐藤ら[佐藤他, 2017]は坂地らの手法を参考に、有価証券報告書から因果関係文の抽出を試みたところ、「対処すべき課題」の項目では因果関係文以外の特徴文の存在が示唆された。そこで、本稿では有価証券報告書の「対処すべき課題」の項目における企業の課題に関する記述を「課題文」と定義し、課題文の文末表現の特徴から、手がかりとなる表現を自動獲得手法により増幅し、それらを用いて課題文の抽出を試みた。その結果、抽出した課題文を確認したところ判別モデルの精度は良好であった。また、抽出した課題文の数は「対処すべき課題」全文の数を上回るペースで年々増加する傾向であり、近年の有価証券報告書における課題に関する開示意識の高まり等が示唆された。さらに、抽出した課題文を用いて、単語ごとに各業種における特有度合いをスコア化し、業種特有の課題に関する単語の抽出を試みた結果、それぞれの業種の課題に則した単語を抽出することが出来た。このように本稿での提案手法は、有価証券報告書を用いた分析手段として有用であり、投資判断情報の効率的な獲得に役立つだろう。

サービス・事例紹介

この記事に関連する当社のサービスや事例のご紹介をご希望の方は、下記よりお問い合わせください。
担当研究所・研究員からご案内をいたします。

ご意見の投稿

この記事についてご意見をお聞かせください。
今後のサイト運営や、レポートの参考とさせていただきます。

  • 戻る
  • ページ先頭へ戻る