SlideShare a Scribd company logo
Azure Machine Learning NLP 最新動向 2020/07/02
Azure Machine Learning NLP 最新動向 2020/07/02
Agenda
https://interpret.ml/
機械学習モデル解釈・説明のための
包括的なフレームワーク
決定木
ルールリスト
線形回帰・ロジスティック回帰
GAM2
….
SHAP
LIME
Partial Dependence
Sensitivity Analysis
Interpretability for
Text Data
https://github.com/interpretml/interpret-text
• 最先端のテキスト解釈・説明の技術を積極的に採用
• 各アルゴリズムについて、使いやすい統合 API を提供
• 対話型ダッシュボードによるインサイトの獲得を支援
各文章データのテキスト分類モデルの
解釈性・説明性の機能を提供するオープンソースライブラリ
• Classical Text Explainer
(glass-box)
• Unified Information Explainer
(post-hoc and model agnostic)
• Introspective Rationale Explainer
(plug-in during training, model agnostic)
古典的な手法 & 最先端の手法
• 古典的な機械学習パイプライン
• 前処理、エンコーディング、学習、
ハイパーパラメータチューニングが実装済み
• サポートしているモデル
• scikit-learn の線形モデル (coefs_)
• Tree ベースのアンサンブルモデル (feature_importances)
• 上記モデルの係数や重要度を利用した説明性を提供
デフォルトの設定 : 1-gram bag-of-words
+ scikit-learn count vectorizer + Logistic regression
• 相互情報量をベースにした post-hoc の
アプローチ
• DNN モデルの隠れ層について、
統一された一貫性のある説明性を提供
• 現在は BERT をサポート
• 将来的に LSTM, RNN に対応予定
Towards A Deep and Unified Understanding of Deep Neural Models in NLP, Guan et al. [ICML 2019]
• モデル学習の仕組みに埋め込むタイプ
• 内省的生成器 (Introspective Generator) を前処理で利用
• 入力テキストを根拠 (rationales) と反根拠 (anti-rationales) に分岐
• 根拠 (rationales) のみを使って、精度が最大になるように学習
• モデルは入力テキストから生成された根拠 (rationales) しか見ないため、
何が予測に影響したのかを提示可能
Rethinking Cooperative Rationalization: Introspective Extraction and Complement Control, Yu et al. [EMNLP 2019]
内省的生成器
min-max ゲーム
予測器 補完的予測器
Classical Text Explainer Unified Information
Explainer
Introspective Rationale
Explainer
Input model support Scikit-learn linear models
and tree-based models
PyTorch PyTorch
Explain BERT No Yes Yes
Explain RNN No No Yes
NLP Pipeline
Support
Handles text pre-
processing, encoding,
training, hyperparameter
tuning
Uses BERT tokenizer
however user needs to
supply trained/fine-
tuned BERT model, and
samples of trained data
Generator and predictor
modules handle the required
text pre-processing.
Demo
• Webサイト
• interpret.ml
• Interpre-text 対話型ダッシュボード
• サンプル : https://github.com/interpretml/interpret-text/tree/master/notebooks
Azure Machine Learning NLP 最新動向 2020/07/02
ユーザーの入力 特徴量
エンジニアリング
アルゴリズム
の選択
ハイパーパラメータ
のチューニング
モデルの
リーダーボード
データセット
設定と制約
76% 34% 82%
41%
88%
72%
81% 54% 73%
88% 90% 91%
95% 68%
56%
89% 89% 79%
順位 モデル スコア
1 95%
2 76%
3 53%
…
自動機械学習は与えられたデータに対して
「高精度のモデル」を構築するために、
特徴量エンジニアリング、アルゴリズム選択、ハイパーパラメータ選択を
自動で効率的に探索します。
特徴量エンジニアリング
• 欠損値の自動補完
• 特徴量変換のカスタム指定
• 自動での特徴量変換
• 時系列データ前処理の自動化
• Lag, Rolling Windows etc
• BERT Embedding 対応
※参考;How BERT is integrated into Azure automated machine learning
https://techcommunity.microsoft.com/t5/azure-ai/how-bert-is-integrated-into-azure-
automated-machine-learning/ba-p/1194657
BERT の多言語対応
• これまでは英語のみの対応
• 日本語 に対応した BERT Embedding
が特徴量として利用可能に
Demo
AutoML 日本語データ
• livedoor ニュースの多クラス分類
※コードを公開しています。
- AutoML のBERT モデルによるテキスト分類
https://medium.com/@konabuta/automl-の-bert-モデルによるテキスト分類-5758d4456975
Azure Machine Learning NLP 最新動向 2020/07/02
Agenda
https://dllab.connpass.com/event/178714/
Azure Machine Learning NLP 最新動向 2020/07/02
Azure Machine Learning NLP 最新動向 2020/07/02

More Related Content

PDF
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
 
PDF
BERTに関して
Saitama Uni
 
PDF
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
Ginpei Kobayashi
 
PPTX
How to use in R model-agnostic data explanation with DALEX & iml
Satoshi Kato
 
PPTX
Solving Quantitative Reasoning Problems with Language Models
harmonylab
 
PPTX
[DL輪読会]Explainable Reinforcement Learning: A Survey
Deep Learning JP
 
PPTX
survey on math transformer 2023 0628 sato
satoyuta0112
 
PDF
STAIR Lab Seminar 202105
Sho Takase
 
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
 
BERTに関して
Saitama Uni
 
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
Ginpei Kobayashi
 
How to use in R model-agnostic data explanation with DALEX & iml
Satoshi Kato
 
Solving Quantitative Reasoning Problems with Language Models
harmonylab
 
[DL輪読会]Explainable Reinforcement Learning: A Survey
Deep Learning JP
 
survey on math transformer 2023 0628 sato
satoyuta0112
 
STAIR Lab Seminar 202105
Sho Takase
 

Similar to Azure Machine Learning NLP 最新動向 2020/07/02 (17)

PDF
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
 
PDF
[DL Hacks]Pretraining-Based Natural Language Generation for Text Summarizatio...
Deep Learning JP
 
PPTX
深層学習による自然言語処理の研究動向
STAIR Lab, Chiba Institute of Technology
 
PDF
An efficient framework for learning sentence representations
Yuya Soneoka
 
PDF
大規模データに基づく自然言語処理
JunSuzuki21
 
PDF
[DLLAB Engineer Days 講演資料] Automated ML & Model Interpretability
Keita Onabuta
 
PDF
Automated ml & model interpretability
Deep Learning Lab(ディープラーニング・ラボ)
 
PDF
広告文生成タスクの規定とベンチマーク構築
Masato Mita
 
PPTX
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
Hitomi Yanaka
 
PDF
BERT+XLNet+RoBERTa
禎晃 山崎
 
PDF
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
STAIR Lab, Chiba Institute of Technology
 
PDF
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
禎晃 山崎
 
PDF
ElectraとpQRNNについて
Itsuki Slide
 
PPTX
LLM は言葉の意味を理解しているのか?
Hide Koba
 
PDF
Hands on-ml section1-1st-half-20210317
Nagi Kataoka
 
PDF
東京大学2021年度深層学習(Deep learning基礎講座2021) 第8回「深層学習と自然言語処理」
Hitomi Yanaka
 
PDF
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
Hitomi Yanaka
 
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
株式会社メタップスホールディングス
 
[DL Hacks]Pretraining-Based Natural Language Generation for Text Summarizatio...
Deep Learning JP
 
深層学習による自然言語処理の研究動向
STAIR Lab, Chiba Institute of Technology
 
An efficient framework for learning sentence representations
Yuya Soneoka
 
大規模データに基づく自然言語処理
JunSuzuki21
 
[DLLAB Engineer Days 講演資料] Automated ML & Model Interpretability
Keita Onabuta
 
Automated ml & model interpretability
Deep Learning Lab(ディープラーニング・ラボ)
 
広告文生成タスクの規定とベンチマーク構築
Masato Mita
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
Hitomi Yanaka
 
BERT+XLNet+RoBERTa
禎晃 山崎
 
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
STAIR Lab, Chiba Institute of Technology
 
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
禎晃 山崎
 
ElectraとpQRNNについて
Itsuki Slide
 
LLM は言葉の意味を理解しているのか?
Hide Koba
 
Hands on-ml section1-1st-half-20210317
Nagi Kataoka
 
東京大学2021年度深層学習(Deep learning基礎講座2021) 第8回「深層学習と自然言語処理」
Hitomi Yanaka
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
Hitomi Yanaka
 
Ad

More from Keita Onabuta (9)

PDF
Azure における強化学習への取り組み
Keita Onabuta
 
PDF
Azure Machine Learning Build 2020
Keita Onabuta
 
PDF
DataDrift in Azure Machine Learning
Keita Onabuta
 
PDF
Azure ML - OpenVINO 師走の推論ナイト 20191211 講演資料
Keita Onabuta
 
PDF
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
Keita Onabuta
 
PDF
Azure Machine Learning アップデートセミナー 20191127
Keita Onabuta
 
PDF
品質管理 & 設備保全のための機械学習入門 2019年9月 (Quality Control and Predictive Maintenance App...
Keita Onabuta
 
PDF
Neural Network Intelligence 概要 (AutoML Platform)
Keita Onabuta
 
PDF
Azure machine learning service 最新の機械学習プラットフォーム
Keita Onabuta
 
Azure における強化学習への取り組み
Keita Onabuta
 
Azure Machine Learning Build 2020
Keita Onabuta
 
DataDrift in Azure Machine Learning
Keita Onabuta
 
Azure ML - OpenVINO 師走の推論ナイト 20191211 講演資料
Keita Onabuta
 
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
Keita Onabuta
 
Azure Machine Learning アップデートセミナー 20191127
Keita Onabuta
 
品質管理 & 設備保全のための機械学習入門 2019年9月 (Quality Control and Predictive Maintenance App...
Keita Onabuta
 
Neural Network Intelligence 概要 (AutoML Platform)
Keita Onabuta
 
Azure machine learning service 最新の機械学習プラットフォーム
Keita Onabuta
 
Ad

Recently uploaded (9)

PPTX
【Qlik 医療データ活用勉強会】第50回 日本医療マネジメント学会参加報告、DPCデータの活用等
QlikPresalesJapan
 
PPTX
BEIS ORIENTATION FOR S.Y2024 - 2025.pptx
AsmiraCo2
 
PPTX
PRESENTASI IZIN OPERASIONAL SMK ISLAM KARYA MANDIRI
BAHRULALAM27
 
PDF
ダイヤモンドスラリー市場規模の成長見通し:2031年には193百万米ドルに到達へ
yhresearch
 
PDF
RV車市場、CAGR2.60%で成長し、2031年には37640百万米ドル規模に
yhresearch
 
PDF
硫酸ナトリウム市場、CAGR0.50%で成長し、2031年には1520百万米ドル規模に
yhresearch
 
PDF
埋め込み型ドラッグデリバリーデバイスの成長予測:2031年には751百万米ドルに到達へ
2418867459
 
PDF
工業用ミストシステム調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
2418867459
 
PPTX
20250729_TechTalk_QlikTalendCloud_データ品質とデータガバナンス
QlikPresalesJapan
 
【Qlik 医療データ活用勉強会】第50回 日本医療マネジメント学会参加報告、DPCデータの活用等
QlikPresalesJapan
 
BEIS ORIENTATION FOR S.Y2024 - 2025.pptx
AsmiraCo2
 
PRESENTASI IZIN OPERASIONAL SMK ISLAM KARYA MANDIRI
BAHRULALAM27
 
ダイヤモンドスラリー市場規模の成長見通し:2031年には193百万米ドルに到達へ
yhresearch
 
RV車市場、CAGR2.60%で成長し、2031年には37640百万米ドル規模に
yhresearch
 
硫酸ナトリウム市場、CAGR0.50%で成長し、2031年には1520百万米ドル規模に
yhresearch
 
埋め込み型ドラッグデリバリーデバイスの成長予測:2031年には751百万米ドルに到達へ
2418867459
 
工業用ミストシステム調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
2418867459
 
20250729_TechTalk_QlikTalendCloud_データ品質とデータガバナンス
QlikPresalesJapan
 

Azure Machine Learning NLP 最新動向 2020/07/02