Submit Search
機械学習
Jun 25, 2012
11 likes
8,341 views
Hikaru Takemura
某研究室のM1が,B4向けに機械学習の講義を行った際のスライドです.
Read more
1 of 25
Download now
Downloaded 43 times
Ad
Recommended
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
協調フィルタ
Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
JapanR 2016でのLT資料です
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
Pythonによる機械学習
Pythonによる機械学習
Kimikazu Kato
計算機統計学会第30回大会でのプレゼン資料です。
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
Ryota Kamoshida
某所で機械学習の講習会(?)のようなものをしたときの資料です. 機械学習によるデータ分析について,アルゴリズムやツールの使い方*以外*の部分で 重要だと思うことを重点的にまとめたつもりです.
統計学勉強会#2
統計学勉強会#2
Hidehisa Arai
A presentation for meeting of statistics in Japan. https://connpass.com/event/204931/ Topics: Methods and their properties to measure dependencies between variables
機械学習の理論と実践
機械学習の理論と実践
Preferred Networks
SACSIS2013でのチュートリアル講演資料です。機械学習の導入:背景、手法、理論、応用)、実践:オンライン学習+線形分類で実際作ってみる、使う際の課題、発展:分散+リアルタイムでの機械学習(Jubatus)、深層学習(Deep Neural Net)についてまとめました
機械学習 入門
機械学習 入門
Hayato Maki
学部初級生向けの機械学習入門資料
人工知能の概論の概論とセキュリティへの応用(的な~(改)
人工知能の概論の概論とセキュリティへの応用(的な~(改)
Typhon 666
20150825 #ssmjp での発表資料です。公開向けではなかったのでわかりにくいかもですが。。。
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
horihorio
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識
Ken Morishita
この続きでTheanoの使い方について簡単に書きました:http://qiita.com/items/3fbf6af714c1f66f99e9
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
福岡市内のイベントで発表した資料です。
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?
KSK Analytics Inc.
ディープラーニング(深層学習)のソフトウェア「TensorFlow」の紹介と従来の機械学習との違いを解説
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Preferred Networks
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Yuya Unno
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
最尤推定やベイズ推定の基本がようやく理解できたため,かみ砕いて説明したプレゼンを作りました.
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
エンジニアサポートCROSS2014 機械学習CROSSセッション前半資料です
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
TensorFlow初心者の開発者が、TensorFlowに期待することを発表します。
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
Neural Network with Attention Mechanism for Natural Language Processing: survey
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
Yuya Unno
BigData Conference 2017 Springにて行ったセミナーの資料です
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/30518257
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
Takashi J OZAKI
DCC7 / EIP64 May 14, 2014
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
現在は機械学習ライブラリが充実しており、また、教師データの獲得も容易になっています。 そのため、機械学習のビジネス利用への敷居が下がっています。 予測や分類といった問題を解く際には、設定した課題に対してどのモデルが最も適しているかを評価するための指標(評価関数)が必要になります。 Kaggle(([有名なデータサイエンスのコンペティション](https://www.kaggle.com)))などでは評価指標が定まっていますが、実ビジネスで機械学習を応用する際には自ら評価指標を設定する必要があります。 しかし、適切な評価関数を選ぶのは初学者には難しく、またビジネスの問題設定、目的意識によっても異なります。 さらに、オフラインでの予測はユーザの実際の行動予測とはギャップがある 場合もあります。 [1] Data-Driven Metric Development for Online Controlled Experiments: Seven Lessons Learned Xiaolin Shi*, Yahoo Labs; Alex Deng, Microsoft; KDD '16 [2] 情報検索の基礎 Christopher D.Manning (著), Prabhakar Raghavan (著), Hinrich Schutze (著) 岩野 和生ら (翻訳), 共立出版 2012 [3] kaggle: https://www.kaggle.com/ そこで、多くある評価関数のうち代表的なものを幾つかをまとめました。
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜
Yuya Unno
Sakusaku svm
Sakusaku svm
antibayesian 俺がS式だ
はじパタLT2
はじパタLT2
Tadayuki Onishi
Rで学ぶデータサイエンス 5 「パターン認識」 第2章 k-平均法
Ad
More Related Content
What's hot
(20)
人工知能の概論の概論とセキュリティへの応用(的な~(改)
人工知能の概論の概論とセキュリティへの応用(的な~(改)
Typhon 666
20150825 #ssmjp での発表資料です。公開向けではなかったのでわかりにくいかもですが。。。
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
horihorio
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識
Ken Morishita
この続きでTheanoの使い方について簡単に書きました:http://qiita.com/items/3fbf6af714c1f66f99e9
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
福岡市内のイベントで発表した資料です。
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?
KSK Analytics Inc.
ディープラーニング(深層学習)のソフトウェア「TensorFlow」の紹介と従来の機械学習との違いを解説
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Preferred Networks
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Yuya Unno
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
最尤推定やベイズ推定の基本がようやく理解できたため,かみ砕いて説明したプレゼンを作りました.
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
エンジニアサポートCROSS2014 機械学習CROSSセッション前半資料です
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
TensorFlow初心者の開発者が、TensorFlowに期待することを発表します。
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
Neural Network with Attention Mechanism for Natural Language Processing: survey
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
Yuya Unno
BigData Conference 2017 Springにて行ったセミナーの資料です
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/30518257
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
Takashi J OZAKI
DCC7 / EIP64 May 14, 2014
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
現在は機械学習ライブラリが充実しており、また、教師データの獲得も容易になっています。 そのため、機械学習のビジネス利用への敷居が下がっています。 予測や分類といった問題を解く際には、設定した課題に対してどのモデルが最も適しているかを評価するための指標(評価関数)が必要になります。 Kaggle(([有名なデータサイエンスのコンペティション](https://www.kaggle.com)))などでは評価指標が定まっていますが、実ビジネスで機械学習を応用する際には自ら評価指標を設定する必要があります。 しかし、適切な評価関数を選ぶのは初学者には難しく、またビジネスの問題設定、目的意識によっても異なります。 さらに、オフラインでの予測はユーザの実際の行動予測とはギャップがある 場合もあります。 [1] Data-Driven Metric Development for Online Controlled Experiments: Seven Lessons Learned Xiaolin Shi*, Yahoo Labs; Alex Deng, Microsoft; KDD '16 [2] 情報検索の基礎 Christopher D.Manning (著), Prabhakar Raghavan (著), Hinrich Schutze (著) 岩野 和生ら (翻訳), 共立出版 2012 [3] kaggle: https://www.kaggle.com/ そこで、多くある評価関数のうち代表的なものを幾つかをまとめました。
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜
Yuya Unno
人工知能の概論の概論とセキュリティへの応用(的な~(改)
人工知能の概論の概論とセキュリティへの応用(的な~(改)
Typhon 666
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
horihorio
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識
Ken Morishita
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?
KSK Analytics Inc.
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
Preferred Networks
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Yuya Unno
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
予測型戦略を知るための機械学習チュートリアル
予測型戦略を知るための機械学習チュートリアル
Yuya Unno
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
Takashi J OZAKI
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜
Yuya Unno
Similar to 機械学習
(20)
Sakusaku svm
Sakusaku svm
antibayesian 俺がS式だ
はじパタLT2
はじパタLT2
Tadayuki Onishi
Rで学ぶデータサイエンス 5 「パターン認識」 第2章 k-平均法
Maeshori missing
Maeshori missing
Daisuke Ichikawa
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
Hokuto Kagaya
エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎
Daiyu Hatakeyama
JAZUG 女子部 第13回勉強会の資料。 機械学習の基礎について説明します。 https://jazug.connpass.com/event/106003/
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
Naoki Hayashi
2018年3月修了の修士論文発表会の資料. Presentation for Defense of Master Thesis in 2018.
Nips20180127
Nips20180127
WEBFARMER. ltd.
This Docments is used in NIPS2017-ronbun-yomi-kai. This is introduction to tripleGAN model or els.
深層学習 - 画像認識のための深層学習 ②
深層学習 - 画像認識のための深層学習 ②
Shohei Miyashita
2016年4月頃に作成したスライド
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
[DL輪読会]10分で10本の論⽂をざっくりと理解する (ICML2020)
[DL輪読会]10分で10本の論⽂をざっくりと理解する (ICML2020)
Deep Learning JP
2020/08/028 Deep Learning JP: http://deeplearning.jp/seminar-2/
20180830 implement dqn_platinum_data_meetup_vol1
20180830 implement dqn_platinum_data_meetup_vol1
Keisuke Nakata
20180830 implement dqn_platinum_data_meetup_vol1
深層学習 - 画像認識のための深層学習 ①
深層学習 - 画像認識のための深層学習 ①
Shohei Miyashita
2016年4月頃に作成したスライド
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
Shuyo Nakatani
機械学習×プログラミング勉強会 vol.2 での発表資料です。 ベイズの何が嬉しいか、ノンパラベイズの何が嬉しいかを数式を使わず語ります。
Deep learningbook chap7
Deep learningbook chap7
Shinsaku Kono
Deep Learning Book Chap 7.1-7.4
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Yoshitaka Ushiku
視覚を持ったエージェントに自然言語で屋内のある地点からある地点までの道順を教えると、エージェントが頑張って自力でゴールまでたどり着けるというのが Vision-Language Navigation の目的です。 この論文はCVPR 2019のStudent Best Paperに輝いた論文で、上記の問題に対して局所的パスと大局的パス両方にクロスモーダルなマッチングを与えるReinforced Cross-Modal Matchingと未知環境下で自己教示的に模倣学習するSelf-Supervised Imitation Learningを提案しています。Vision & Languageや強化学習、模倣学習、自己教示など今注目をあびる要素の集大成みたいな論文ですね。
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
y-uti
社内勉強会で『Python 機械学習プログラミング』の第 3 章の発表を担当した際の資料です。教科書で触れられている各アルゴリズムについて、アルゴリズムの概要と Iris データセットへの適用結果を説明しています。 発表資料に対応して、Jupyter Notebook で実行した ipynb ファイルを Gist にアップロードしています。 https://gist.github.com/y-uti/bd0928ad4f4eff7794a00108f6cbe7cc [2017-05-08] スライド 37 ページの内容はカーネル SVM の理解について大きな誤りがあったため取り消します。
数式を使わない機械学習超入門 〜Support Vector Machine 解説編〜
数式を使わない機械学習超入門 〜Support Vector Machine 解説編〜
Shu Sakamoto
「機械学習」という単語を聞いたことすらない人に向けて超入門スライドを作りました。概念レベルでの理解を第一に置いているので、数式や細かい定義などは省略しています。機械学習へのとっかかりにどうぞ。著作権・ライセンスフリーですが、複製して使用される場合はDMなどで一言お声掛け頂けると喜びます。
言語資源と付き合う
言語資源と付き合う
Yuya Unno
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
第46回東京R勉強会 #TokyoRの資料です。
Deep Learningの基礎と応用
Deep Learningの基礎と応用
Seiya Tokui
第14回情報科学技術フォーラム (FIT2015) のイベント企画「ビッグデータ解析のための機械学習技術」におけるチュートリアル講演資料です。ニューラルネットの基礎(計算グラフとしての定式化、勾配法、誤差逆伝播法)をさらったあと、最近画像や自然言語などで注目されている応用・手法について広く浅く紹介しています。
Sakusaku svm
Sakusaku svm
antibayesian 俺がS式だ
はじパタLT2
はじパタLT2
Tadayuki Onishi
Maeshori missing
Maeshori missing
Daisuke Ichikawa
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
2014/5/29 東大相澤山崎研勉強会:パターン認識とニューラルネットワーク,Deep Learningまで
Hokuto Kagaya
エンジニアのための機械学習の基礎
エンジニアのための機械学習の基礎
Daiyu Hatakeyama
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
修士論文発表:「非負値行列分解における漸近的Bayes汎化誤差」
Naoki Hayashi
Nips20180127
Nips20180127
WEBFARMER. ltd.
深層学習 - 画像認識のための深層学習 ②
深層学習 - 画像認識のための深層学習 ②
Shohei Miyashita
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
Yuya Unno
[DL輪読会]10分で10本の論⽂をざっくりと理解する (ICML2020)
[DL輪読会]10分で10本の論⽂をざっくりと理解する (ICML2020)
Deep Learning JP
20180830 implement dqn_platinum_data_meetup_vol1
20180830 implement dqn_platinum_data_meetup_vol1
Keisuke Nakata
深層学習 - 画像認識のための深層学習 ①
深層学習 - 画像認識のための深層学習 ①
Shohei Miyashita
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
Shuyo Nakatani
Deep learningbook chap7
Deep learningbook chap7
Shinsaku Kono
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi...
Yoshitaka Ushiku
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
y-uti
数式を使わない機械学習超入門 〜Support Vector Machine 解説編〜
数式を使わない機械学習超入門 〜Support Vector Machine 解説編〜
Shu Sakamoto
言語資源と付き合う
言語資源と付き合う
Yuya Unno
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
Deep Learningの基礎と応用
Deep Learningの基礎と応用
Seiya Tokui
Ad
機械学習
1.
プログラミング輪講
機械学習 @pika_shi
2.
機械学習とは l ⼈人間が⾏行行うパターン認識則や経験則
を,コンピュータで実現させる l サンプルデータ集合を対象に解析を ⾏行行い,そのデータから有⽤用な規則, ルールを抽出する 2
3.
検索エンジンとの関係 l ランキングの改良
(例)どのページがユーザにとって好ましいかを,過去のクリックの履 歴により分析 Webページ 問い合わせ クエリ 検索 エンジン クリック 索引 DB フィード PageRank バック ランキングされた検索結果 3
4.
機械学習の例 l 教師あり学習
l 教師なし学習 決定⽊木 ナイーブ・ベイズ K-means SVM 主成分分析 パーセプトロン 強化学習 4
5.
SVM
6.
SVMとは? l 現在最も識別性能の⾼高い分類器の1つ l ⾼高次元でもうまく分類できるので,複雑な問題に適⽤用され
ることが多い l 顔の表情の分類 l ⼿手書き⽂文字認識 l 地震による被害規模の予測 l 僕の研究 l Pythonのライブラリ l LIBSVM http://www.csie.ntu.edu.tw/~cjlin/libsvm/ l SVM-Light http://svmlight.joachims.org/ 6
7.
SVMの学習 l マージン最⼤大化により識別線を決定
7
8.
カーネルトリック l 訓練データを⾼高次元空間に写像し、その写像された空間上
で線形分離を⾏行行う 8
9.
LIBSVMを使う >> from svm
import * >> from svmutil import * >> >> # 訓練データ >> problem = svm_problem([1,-1], [[0,0], [1,1]]) >> # パラメータの設定 (カーネルの種類など) >> # 多クラスSVMや,クロスバリデーションなども引数で設定可能 >> prameter = svm_parameter(‘-t 2 –h 0’) >> # 訓練 >> m = svm_train(problem, parameter) >> # 予測 >> predict = svm_predict([1,-1], [[-1, 0],[3, 3]], m) >> predict[0] [1.0, -1.0] 9
10.
パーセプトロン
11.
パーセプトロンとは? l ⼈人間の視覚・脳の機能をモデル化した分類器
11
12.
パーセプトロンの学習能⼒力力 l パーセプトロンは⾮非線形分離が不可能
l AND,OR,XORのうち不可能なのは? 多層パーセプトロン なら可能! 12
13.
多層パーセプトロン l 中間層(隠れ層)をもち,⾮非線形分離も可能に
13
14.
バックプロパゲーション(誤差逆伝播法) l 分類器の精度をより⾼高めるために,出⼒力力結果から重みを調
整していく l ネットワーク内の重みを調整しながら,後ろに伝わってい く l 今回の課題で実装してもらいます(クリックデータの学習) 14
15.
過学習 l 学習しすぎて,逆に学習能⼒力力が低下 l
中間層を多くしすぎた時などに⽣生じる 15
16.
SVMとの⽐比較 l パーセプトロンとSVMはどっちが汎化能⼒力力が⾼高い?
16
17.
決定⽊木
18.
決定⽊木 l 意思決定を⾏行行うための学習モデル
学年 B4 M1 B5 学年 ⾃自宅 or 下宿 早起き ソフト ⾃自宅or下宿 ⾏行行く ⾃自宅or下宿 B4 下宿 得意 ⾏行行く B4 下宿 苦⼿手 ⾏行行く 下宿 ⾃自宅 下宿 ⾃自宅 B4 ⾃自宅 苦⼿手 ⾏行行かない ⾏行行く ⾏行行かない ⾏行行く ⾏行行かない B5 下宿 苦⼿手 ⾏行行く M1 下宿 得意 ⾏行行く ⾃自宅or下宿 M1 ⾃自宅 得意 ⾏行行かない 下宿 ⾃自宅 ⾏行行く ⾏行行かない 18
19.
決定⽊木とは? l どっちの決定⽊木がよい?
学年 ⾃自宅or下宿 B4 M1 B5 下宿 ⾃自宅 ⾃自宅or下宿 ⾏行行く ⾃自宅or下宿 ⾏行行く ⾏行行かない 下宿 ⾃自宅 下宿 ⾃自宅 簡単なものほどよい ⾏行行く ⾏行行かない ⾏行行く ⾏行行かない (オッカムの剃⼑刀) l 情報理論(エントロピー),ジニ係数などを⽤用いて簡単な決 定⽊木を求めることができる 19
20.
決定⽊木のライブラリ l Pythonのライブラリ
l scikit-learn http://scikit-learn.sourceforge.net/dev/modules/ tree.html l 多クラス分類はSVMより決定⽊木の⽅方がうまくいくことが多 い l 逆に2クラス分類はやはりSVMには精度は及ばない 20
21.
scikit-learnを使う >> from sklearn
import tree >> >> # 訓練データ >> samples = [[0, 0], [1, 1]] >> # クラス >> values = [0, 1] >> # 訓練 >> clf = tree.DecisionTreeClassifier() >> clf = clf.fit(samples, values) >> # 予測 >> clf.predict([2, 2]) array([1]) 21
22.
ナイーブ・ベイズ
23.
ナイーブ・ベイズとは? l 確率モデルに基づいた分類器 l
⽂文書分類,診断などに⽤用いられることが多い 通常メール スパムメール 飲み会 当選 旅⾏行行 おめでとう 出会い l 次のメールはスパム? l 最近出会いがなくて寂しい.誰か飲み会開いて! l 出会いがなくて寂しいそこのあなた!このサイトに登録すればモテ モテですよ. 23
24.
その他 l 不均衡データ問題 (imbalanced
data) l 識別器の訓練データに⼤大きなクラスの偏りがある場合,⼤大きいクラ スに流されてしまう l 対策としては,⼤大きい⽅方のクラスサイズを⼩小さい⽅方に合わせる,ま たはその逆が⼀一般的 l アンサンブル学習 (ensemble learning) l 識別器を複数組み合わせて,⾼高精度の識別器を作成 l うまく作成できれば,識別器の能⼒力力を120%引き出すことができる 24
25.
課題
Download