【Research Report】テキストマイニングを用いた有価証券報告書からの未来志向文の抽出

サマリー

 有価証券報告書や決算短信、新聞記事などのテキストデータには、企業の業績や業績予想の根拠、経営戦略、進行中の施策、今後の取り組み、認識しているリスクなど、投資判断において重要な情報が含まれている。近年、これら数値情報以外の情報を取得する技術として、テキストマイニングの金融分野への応用が進み、テキストデータから投資判断に有用と思われる非財務情報の効率的な抽出を試みる研究が行われている。しかしながら、これらの研究の多くは、業績やその根拠など主に企業の過去の活動に焦点をあてており、将来における取り組みなどの企業の未来の活動に関する情報について抽出を試みた例はそれほど多くない。投資判断が企業の将来における活動やその成果の確度に大きく依拠するとすれば、企業が今後何をするのか、どんな活動に重点をおくのかを把握することは、過去の情報を把握すること以上に重要であると言えよう。 そこで本稿では、企業の今後の活動に関して記述している文(未来志向文)を抽出することを目的とし、モデルの開発を行った。未来志向文は、その企業の取り組みに関する記述かつ未来に関する記述であるという前提の下、2つの機械学習による判定モデルを組み合わせ、企業の今後の取り組みに関する記載の多い有価証券報告書の「対処すべき課題」から、未来志向文の抽出を試みた。その結果、本研究で構築したモデルは適合率、再現率、F値いずれの評価指標においても平均で0.9を超える非常に高い性能を示した。また、本モデルを用いて有価証券報告書あたりの未来志向文の文数や「対処すべき課題」全文に対する割合の推移を見ると、「対処すべき課題」全文の数の増減にかかわらず未来志向文の文数は増加傾向にあり、全文に対する割合も0.55程度から0.65程度に単調に増加していた。 本稿で提案した未来志向文抽出モデルを用いることで、有価証券報告書等のテキストデータから今後の企業の取り組みに関する情報を、網羅的かつ効率的に抽出することができ、これらの情報を用いた新たな投資判断材料の獲得が期待できるだろう。

サービス・事例紹介

この記事に関連する当社のサービスや事例のご紹介をご希望の方は、下記よりお問い合わせください。
担当研究所・研究員からご案内をいたします。

ご意見の投稿

この記事についてご意見をお聞かせください。
今後のサイト運営や、レポートの参考とさせていただきます。

  • 戻る
  • ページ先頭へ戻る