業種分類は投資家や研究者にとって重要な情報であり,ポートフォリオの多様化や経済動向に応じた資金配分の変更,株式市場の分析などに利用される.また,企業戦略やイノベーションとの関連を研究する分野でも広く活用される.しかし,既存の業種分類には2つの問題がある.第一に,事業の多様性を反映できず,複数事業を持つ企業も特定の業種一つに割り当てられる点.第二に,分類が固定的であり,新しい市場や製品が迅速に反映されない点である.本研究はこれらの問題に対処する新しい業種分類を提案する.具体的には,有価証券報告書のテキストデータをテキストマイニング技術で解析し,事業を表す単語ベクトルのコサイン類似度をもとに企業間の類似度を測定し,類似する企業をグループ化する.この方法により,企業の多様な事業を業種分類に反映し,事業の変化も年度ごとに反映できる.また,提案した業種分類を東証業種分類中分類と比較して信頼性を検証する.本研究の分類方法は,既存の業種分類を補完し,企業間の類似性にもとづく新たな分析視点を提供することを目指している.