研究/データマイニング
出典: Fukudat
< 研究
データマイニングとは,大量のデータから役に立つ知見をマイニング(mining -- 採掘,採鉱 = 発見) する方法を研究する学問である.
1994年にIBM Almaden Research CenterのRakesh Agrawalらがアソシエーション・ルール発見(association rule discovery)問題を提起したことにより,この研究分野が生まれた.ちょうどその頃,OLAP (on-line analytical processing) という概念がEdgar F. Coddにより提唱されたこともあり,それ以来データを分析的に処理する研究が盛んに行われている.
データマイニングの課題には,アソシエーション・ルール発見問題の他に,クラス分類(classification)問題,クラスタリング(clustering)問題,類似時系列(similar time series)発見問題,外れ値検出(outlier detection)問題などが挙げられる.
私は早稲田大学大学院理工学研究科でデータマイニングについて教えてる.その講義資料はここで公開している.
[編集]
ウェブマイニング
- ネットワークのクラスタリング
[編集]
Third-Generation Business Intelligence
第3世代ビジネスインテリジェンス (3rd generation business intelligence)
- http://searchdatamanagement.techtarget.com/news/column/0,294698,sid91_gci1272060,00.html
- http://jisi.dreamblog.jp/blog/682.html
[編集]
リンク集
- 研究者のページ
- 鹿島さんの研究日記 | 森本先生のページ | もりも.コム | 徳山先生のページ | 森下先生のページ
- イベント
- データサイエンス
- 学会
- ACM SIGKDD
- データセット
- UC Irvine Machine Learning Repository
- Enron mail dataset
- 朱鷺の杜
