講義概要
ビジネスデータの分析や科学計算で利用されているデータマイニング技術について,特に多次元データ分析,相関ルールマイニング,クラスタリング,グラフマイニング,推薦処理を中心に手法の特徴と分析ツールについて学びます.
講師
- 所属
- 大阪大学
- 講師名
- 鬼塚 真
2014年より大阪大学大学院情報科学研究科教授.2000年~2001年ワシントン大学客員研究員,2010年~2014年NTT特別研究員.これまで多次元メモリDBMS, XMLデータベース/ストリーム処理,大規模分散処理基盤,分散データベースにおけるクエリ最適化,分散クエリ処理およびデータマイニング・機械学習に関する研究開発に従事.
講義内容
- 多次元データ分析:時間、場所、商品、購入者などの多角的な観点からデータを分析する手法である,多次元データ分析について学ぶ.
- 相関ルールマイニング:「ビールとおむつ」の購入頻度が高いという例に代表される,相関ルールマイニングについて学ぶ.
- クラスタリング分析:データの構造的な類似性に基づいて共通性の高いデータをクラスタとして抽出する,クラスタリング分析について学ぶ.
- グラフマイニング:インターネット上でのwebページやソーシャルネットワークなどのグラフ構造のデータを分析する,グラフマイニングについて学ぶ.
- 情報推薦:大量の利用者の購買履歴を利用して,共通する傾向を抽出し情報や商品を推薦する技術である情報推薦について学ぶ.
受講要件
- 【受講要件】
-
情報工学や情報科学に関して,大学生レベルの知識(データベース,データ構造とアルゴリズム,グラフ理論など)を有することが望ましい
- 【事前学習のポイント】
-
事前配布するスライドを確認して疑問点を明らかにして,受講時に質問してインタラクティブに進めたいと思います.
教科書
講義2週間前に電子ファイル送付(事前学習を推奨)講義に関連する解説記事・参考文献・図書等
データマイニングの基礎 ,元田 浩, 山口 高平, 津本 周作, 沼尾 正行,オーム社