ITパスポート試験 用語辞典
テキストマイニング【Text Mining】
データマイニングを文字列データに適用した手法のことである。自由な形式で書かれた文章を、単語や文節で区切り、統計学やパターン認識、AIなどのデータ解析技法を用いて有用な情報を探し出す分析技術である。日本語は英語などに比べ、文法のゆらぎが大きく形態素解析が難しいとされていたが、自然言語処理技術の向上により実用的な分析が可能となっている。
テキストマイニングの対象は、SNSや口コミ、アンケート回答、チャットボット、掲示板などがある。テキストマイニングの中でも、ウェブページを対象にしたものはウェブマイニングという。
「マイニング」とは「採掘」を意味する。これは、膨大な文字情報の山の中から有用な情報を掘り当てるという概念からである。
テキストマイニングの対象は、SNSや口コミ、アンケート回答、チャットボット、掲示板などがある。テキストマイニングの中でも、ウェブページを対象にしたものはウェブマイニングという。
「マイニング」とは「採掘」を意味する。これは、膨大な文字情報の山の中から有用な情報を掘り当てるという概念からである。
- 分野:
- ストラテジ系 » 企業活動 » 業務分析・データ利活用
- 重要度:
(Wikipedia テキストマイニングより)
テキストマイニング(text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。
テキストデータの多くは形式が定まっておらず、また日本語は英語などと比べて単語の境界判別の必要性(→わかち書き)や文法ゆらぎが大きい点において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。テキストマイニングの対象としては、顧客からのアンケートの回答やコールセンターに寄せられる質問や意見、電子掲示板やメーリングリストに蓄積されたテキストデータなどがある。
テキストマイニングの効果
テキストマイニングは、言葉的にはデータマイニングと似ているが、その効果は異なる。データマイニングが顧客個人の購買傾向を分析するなどの目的で行われるのに対し、テキストマイニングは顧客個人の特性よりも提供側の状態を把握する面において威力を発揮する。例えば商品の評価や顧客サービスの問題点などを把握することができる。
「業務分析・データ利活用」に属する用語
- フィールドワーク
- パレート図
- ABC分析
- 特性要因図
- 管理図
- 系統図
- 最小二乗法
- 回帰分析
- 擬似相関
- 散布図
- マトリックス図
- 箱ひげ図
- ヒートマップ
- レーダチャート
- ヒストグラム
- モザイク図
- クロス集計表
- 分割表
- ロジックツリー
- コンセプトマップ
- CSV
- シェープファイル
- 共起キーワード
- チャートジャンク
- GISデータ
- クロスセクションデータ
- 母集団
- 標本抽出
- 仮説検定
- 有意水準
- 第1種の誤り
- 第2種の誤り
- 統計的バイアス
- 認知バイアス
- A/Bテスト
- BI
- データウェアハウス
- データマイニング
- ビッグデータ
- テキストマイニング
- データサイエンスのサイクル
- データサイエンティスト
- デシジョンツリー
- シミュレーション
- ブレーンストーミング
- ブレーンライティング
- 親和図法
「企業活動」の他の分野
「ストラテジ系」の他のカテゴリ
このページのWikipediaよりの記事は、ウィキペディアの「テキストマイニング」(改訂履歴)の記事を複製、再配布したものにあたり、このページ内の該当部分はクリエイティブ・コモンズ 表示 - 継承 3.0 非移植 ライセンスの下 に提供されています。