研究/データマイニング

出典: Fukudat

データマイニングとは,大量のデータから役に立つ知見をマイニング(mining -- 採掘,採鉱 = 発見) する方法を研究する学問である.

1994年にIBM Almaden Research CenterRakesh Agrawalらがアソシエーション・ルール発見(association rule discovery)問題を提起したことにより,この研究分野が生まれた.ちょうどその頃,OLAP (on-line analytical processing) という概念がEdgar F. Coddにより提唱されたこともあり,それ以来データを分析的に処理する研究が盛んに行われている.

データマイニングの課題には,アソシエーション・ルール発見問題の他に,クラス分類(classification)問題,クラスタリング(clustering)問題,類似時系列(similar time series)発見問題,外れ値検出(outlier detection)問題などが挙げられる.

早稲田大学大学院理工学研究科でデータマイニングについて教えてる.その講義資料はここで公開している.

ウェブマイニング

Third-Generation Business Intelligence

第3世代ビジネスインテリジェンス (3rd generation business intelligence)

リンク集

研究者のページ
鹿島さんの研究日記 | 森本先生のページ | もりも.コム | 徳山先生のページ | 森下先生のページ
イベント
データサイエンス
学会
ACM SIGKDD
データセット
UC Irvine Machine Learning Repository
Enron mail dataset
朱鷺の杜
他の言語