POI

2008年6月5日木曜日

データマイニング - Wikipedia

データマイニング - Wikipedia

"データの巨大集合やデータベースから有用な情報を抽出する技術体系"

頻出パターン抽出
データ集合の中から,高頻度で発生する特徴的なパターンを見つける。
* 相関ルール抽出 例1:スーパーでビデオを買った人のうちガムテープを買う人が多い
→ 両者を同じ場所に置く。
* その他の頻出パターン o 時系列やグラフを対象としたものもある

クラス分類
* 代表的な手法:単純ベイズ分類器, 決定木, サポートベクターマシン
o 例:薬品の化合物のデータから,その化合物に薬効がある・ないといったカテゴリを予測

回帰分析
与えられたデータに対応する実数値を予測する問題
* 代表的な手法:線形回帰、ロジスティック回帰、サポートベクトル回帰
o 例:曜日、降水確率、今日の売上げなどのデータを元に、明日の売上げを予測

クラスタリング
o 例:Webの閲覧パターンのデータから、類似したものをまとめることで、閲覧の傾向が同じ利用者のグループを発見する。

0 件のコメント: