![]() 教員名 : 入江 豪
|
科目授業名称(和文) Name of the subject/class (in Japanese)
データマイニング
科目授業名称(英文) Name of the subject/class (in English)
Data Mining
授業コード Class code
994657L
科目番号 Course number
46CSINS304
教員名
楊 沢坤、入江 豪
Instructor
Go Irie
Zekun Yang 開講年度学期
2025年度後期
Year
2025年度
Semester
②Second semester
曜日時限
月曜3限
Class hours
Monday 3rd Period
開講学科・専攻 Department
工学部 情報工学科
Department of Information and Computer Technology, Faculty of Engineering 単位数 Course credit
2.0単位
授業の方法 Teaching method
講義
Lecture 外国語のみの科目(使用言語) Course in only foreign languages (languages)
-
授業の主な実施形態 Main class format
① [対面]対面授業/ [On-site] On-site class
概要 Description
データマイニングとは、データから有益な情報や知識を発見・抽出するプロセスの総称です。
情報学はデータの学問といっても過言ではありません。データは取得した状態そのままでは役に立つとは限らず、そこから真に有益な情報・知識を引き出すためには、データの形式や性質にあった適切なデータ処理手法を選択し使いこなす必要があります。 本講義では、様々なデータから情報・知識を抽出するための基本的なデータ処理手法を中心に、その理論とアルゴリズム、及び、Pythonプログラミングによる実践的な利用方法について学習します。 目的 Objectives
本講義では、さまざまなデータから、有益な情報・知識を発見するためのデータ処理手法に関する基礎理論・特性・アルゴリズムを理解するとともに、課題を通じて実際に使いこなすことができる実践的スキルを修得することを目標とします。
具体的には、研究や技術開発において頻繁に用いられる情報検索、パターンマッチング、頻出パターンマイニング、グラフマイニング、次元削減、クラスタリング、回帰分析を実行する定番的なデータ処理手法の基礎理論・特性・アルゴリズムを修得します。さらに、現代の情報工学技術の研究開発において極めて利用頻度の高いプログラミング言語であるPythonを用いて、これらのデータ処理手法を実装・活用できるようになることを目標とします。 本講義は、本学科のディプロマ・ポリシーに定める「情報工学に必要な基礎学力と専門知識」を身に付けるための科目です。 到達目標 Outcomes
情報検索、パターンマッチング、頻出パターンマイニング、グラフマイニング、次元削減、クラスタリング、回帰分析における基本的なデータ処理手法の理論・特性を説明できるとともに、それぞれを解くアルゴリズムをPythonにより実装し、活用できること。
卒業認定・学位授与の方針との関係(学部科目のみ)
リンク先の [評価項目と科目の対応一覧]から確認できます(学部対象)。
履修登録の際に参照ください。 You can check this from “Correspondence table between grading items and subjects” by following the link(for departments). https://www.tus.ac.jp/fd/ict_tusrubric/ 履修上の注意 Course notes prerequisites
本講義では、課題・到達度評価試験においてPythonプログラミングを実施していただきます。第1回課題にて、Pythonプログラミング環境を構築していただきますので、PCをご用意ください。
履修者は全員LETUS上のコース「データマイニング (994657L)」に自己登録してください。 アクティブ・ラーニング科目 Teaching type(Active Learning)
-
-
準備学習・復習 Preparation and review
各回の1週間前を目安に講義素材を公開しますので、講義日前に目を通しておくようにしてください。ほぼ毎回、各回の学習内容に関連したPythonコードを公開します。学習した内容と実装方法、使い方を説明できるよう復習しておくようにしてください。
成績評価方法 Performance grading policy
到達度評価試験 50%
期間内課題の提出状況・内容(5回程度を予定) 40% 学習態度・学習に対する姿勢 10% 学修成果の評価 Evaluation of academic achievement
・S:到達目標を十分に達成し、極めて優秀な成果を収めている
・A:到達目標を十分に達成している ・B:到達目標を達成している ・C:到達目標を最低限達成している ・D:到達目標を達成していない ・-:学修成果の評価を判断する要件を欠格している ・S:Achieved outcomes, excellent result ・A:Achieved outcomes, good result ・B:Achieved outcomes ・C:Minimally achieved outcomes ・D:Did not achieve outcomes ・-:Failed to meet even the minimal requirements for evaluation 教科書 Textbooks/Readings
教科書の使用有無(有=Y , 無=N) Textbook used(Y for yes, N for no)
N
書誌情報 Bibliographic information
-
MyKiTSのURL(教科書販売サイト) URL for MyKiTS(textbook sales site)
教科書および一部の参考書は、MyKiTS (教科書販売サイト) から検索・購入可能です。
https://gomykits.kinokuniya.co.jp/tokyorika/ It is possible to search for and purchase textbooks and certain reference materials at MyKiTS (online textbook store). https://gomykits.kinokuniya.co.jp/tokyorika/ 参考書・その他資料 Reference and other materials
講義内で使用することはありませんが、参考図書として下記のものを挙げておきます。
Trevor Hastie, Robert Tibshirani, Jerome Friedman(著) 杉山 将・井手 剛・神嶌 敏弘・栗田 多喜夫・前田 英作(監訳) 統計的学習の基礎—データマイニング・推論・予測— 共立出版 2014年06月 授業計画 Class plan
講義の進捗によって多少前後する可能性があります。
1. はじめに ・データマイニングとは ・データマイニングで何ができる? 2. Pythonの基礎 ・Jupyter Notebookの使い方 ・Pythonの基礎:基本的な演算、文字列、リスト、辞書、関数など 3. 情報検索(1) ・情報検索とは ・データとメタデータ ・部分一致検索 ・全文検索と文字列検索 4. 情報検索(2) ・索引方式 ・ランキング 5. 頻出パターンマイニング ・頻出パターンマイニングとは ・バスケット分析 ・相関ルール ・アプリオリアルゴリズム ・系列パターンマイニング 6. グラフマイニング ・グラフマイニングとは ・グラフの基礎 ・最短経路問題 ・中心性 ・コミュニティ抽出 7. 次元削減(1) ・次元削減とは ・主成分分析 8.次元削減(2) ・ラプラス固有写像 ・正準相関分析 9. クラスタリング(1) ・クラスタリングとは ・特徴ベースクラスタリング:K-means 10. クラスタリング(2) ・確率の基礎:同時確率と条件付き確率、ベイズルール、周辺化、カルバック-ライブラーダイバージェンスなど ・特徴ベースクラスタリング:混合ガウス分布 11. クラスタリング(3) ・距離ベースクラスタリング:凝集型クラスタリング、スペクトラルクラスタリング 12. 回帰分析(1) ・回帰分析とは ・最小二乗法 13. 回帰分析(2) ・正則化 ・モデル選択・情報量基準 14. まとめ/予備 15. 到達度評価試験 担当教員の実務経験とそれを活かした教育内容 Work experience of the instructor
-
教育用ソフトウェア Educational software
-
-
備考 Remarks
授業でのBYOD PCの利用有無 Whether or not students may use BYOD PCs in class
Y
授業での仮想PCの利用有無 Whether or not students may use a virtual PC in class
N
|