本スライドは、弊社の梅本により弊社内の技術勉強会で使用されたものです。
近年注目を集めるアーキテクチャーである「Transformer」の解説スライドとなっております。
"Arithmer Seminar" is weekly held, where professionals from within and outside our company give lectures on their respective expertise.
The slides are made by the lecturer from outside our company, and shared here with his/her permission.
Arithmer株式会社は東京大学大学院数理科学研究科発の数学の会社です。私達は現代数学を応用して、様々な分野のソリューションに、新しい高度AIシステムを導入しています。AIをいかに上手に使って仕事を効率化するか、そして人々の役に立つ結果を生み出すのか、それを考えるのが私たちの仕事です。
Arithmer began at the University of Tokyo Graduate School of Mathematical Sciences. Today, our research of modern mathematics and AI systems has the capability of providing solutions when dealing with tough complex issues. At Arithmer we believe it is our job to realize the functions of AI through improving work efficiency and producing more useful results for society.
Several recent papers have explored self-supervised learning methods for vision transformers (ViT). Key approaches include:
1. Masked prediction tasks that predict masked patches of the input image.
2. Contrastive learning using techniques like MoCo to learn representations by contrasting augmented views of the same image.
3. Self-distillation methods like DINO that distill a teacher ViT into a student ViT using different views of the same image.
4. Hybrid approaches that combine masked prediction with self-distillation, such as iBOT.
本スライドは、弊社の梅本により弊社内の技術勉強会で使用されたものです。
近年注目を集めるアーキテクチャーである「Transformer」の解説スライドとなっております。
"Arithmer Seminar" is weekly held, where professionals from within and outside our company give lectures on their respective expertise.
The slides are made by the lecturer from outside our company, and shared here with his/her permission.
Arithmer株式会社は東京大学大学院数理科学研究科発の数学の会社です。私達は現代数学を応用して、様々な分野のソリューションに、新しい高度AIシステムを導入しています。AIをいかに上手に使って仕事を効率化するか、そして人々の役に立つ結果を生み出すのか、それを考えるのが私たちの仕事です。
Arithmer began at the University of Tokyo Graduate School of Mathematical Sciences. Today, our research of modern mathematics and AI systems has the capability of providing solutions when dealing with tough complex issues. At Arithmer we believe it is our job to realize the functions of AI through improving work efficiency and producing more useful results for society.
Several recent papers have explored self-supervised learning methods for vision transformers (ViT). Key approaches include:
1. Masked prediction tasks that predict masked patches of the input image.
2. Contrastive learning using techniques like MoCo to learn representations by contrasting augmented views of the same image.
3. Self-distillation methods like DINO that distill a teacher ViT into a student ViT using different views of the same image.
4. Hybrid approaches that combine masked prediction with self-distillation, such as iBOT.
GPU の分析への応用などの基礎技術の進化とクラウドの爆発的な普及に伴い、だれもが使いたいときに使いたい時だけ高性能なマシンリソースを使える時代が到来し、家電、スマホ、ビジネスアプリケーションなどありとあらゆるものに AI が搭載されているとうたわれ、一部のデータサイエンティストが担っていた高度な分析や深層学習のフレームワークもエンドユーザーで使いこなす人も少なくありません。
一方で、AI や深層学習という言葉が独り歩きし、まず AI 導入ありきでプロジェクトが始まり、目的が失われ頓挫するようなケースや、予測した結果についての妥当性について説明がつかず、結果がうまく利用できないようなケースも見られるようになってきました。
今回のセミナーでは、AI や高度な分析についての最新トレンドと、その使いどころについて、実際の事例や経験などを踏まえお伝えします。
CV分野での最近の脱○○系論文3本を紹介します。
・脱ResNets: RepVGG: Making VGG-style ConvNets Great Again
・脱BatchNorm: High-Performance Large-Scale Image Recognition Without Normalization
・脱attention: LambdaNetworks: Modeling Long-Range Interactions Without Attention
Detect helmet impacts in NFL games using videos and player tracking data. A two-stage pipeline involves helmet detection followed by classification of detections as impacts or non-impacts. Post-processing includes temporal non-maximum suppression using tracking results to reduce false positives. Multiple models are ensembled and thresholds tuned on a validation set for best performance.
3D Perception for Autonomous Driving - Datasets and Algorithms -Kazuyuki Miyazawa
This document summarizes several 3D perception datasets and algorithms for autonomous driving. It begins with an overview of Kazuyuki Miyazawa from Mobility Technologies Co. and then covers popular datasets like KITTI, ApolloScape, nuScenes, and Waymo Open Dataset, describing their sensor setups, data formats, and licenses. It also summarizes seminal 3D object detection algorithms like PointNet, VoxelNet, and SECOND that take point cloud data as input.
5. Mobility Technologies Co., Ltd.
Model-Centric AIとData-Centric AI
5
Model-Centric AI
■ データを集め、データに含まれるノイズに耐えられるような良いモデルを開発する
■ データを固定し、コード/モデルを繰り返し改良していく
Data-Centric AI
■ データの一貫性を最重要とし、ツールを使ってデータの品質を改善する
■ コード/モデルを固定し、データを繰り返し改良していく
現在のパラダイム
新しいパラダイム
6. Mobility Technologies Co., Ltd.
Andrew Ng
■ xxxx 年 xx月 すごい経歴(略
■ 2017年12月 Landing AIというスタートアップを立ち上げ
■ 2020年10月 製造業向けの外観検査ツールLandingLensをローンチ
■ 2021年03月 Deeplearning.AIのイベントでData-Centric AIについて講演
■ 2021年06月 Data-Centirc AI Competition開催
■ 2021年12月 NeurIPSでData-Centric AI Workshop開催
Data-Centric AIの提唱者
6
https://en.wikipedia.org/wiki/Andrew_Ng
7. Mobility Technologies Co., Ltd.
■ 外観検査プロジェクトにおいて、ベースライン方式をどれだけ改善できるか
Model-CentricとData-Centricを比較
■ Model-Centricではベースライン性能をほとんど改善できなかったのに対し、
Data-Centricでは大きな改善が得られた
Model-Centric vs. Data-Centric
7
鉄製品の欠陥検査
ソーラーパネルの欠
陥検査
表面検査
Baseline 76.2% 75.68% 85.05%
Model-Centric 76.2% (+0%) 75.72% (+0.04%) 85.05% (+0%)
Data-Centric 93.1% (+16.9%) 78.74% (+3.06%) 85.45% (+0.4%)
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
8. Mobility Technologies Co., Ltd.
Data-Centricアプローチ
8
イグアナをBBOXで囲む
アノテータA アノテータB
アノテータC
■ アノテータによるラベルの偏りがない、一貫したデータセットの構築を目指す
■ データにおける問題の発見、解決を機械学習エンジニアのスキルに依存するのでは
なくシステマティックに行う
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
9. Mobility Technologies Co., Ltd.
1. 複数のアノテータに同一のサンプル画像を提示
2. アノテータ間のラベルの一貫性を定量化
3. アノテータ間でばらつきの大きいクラスについてアノテーションルールを見直し
4. 1. - 3. を収束するまで反復
一貫したラベルを得るための手法例
9
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
10. Mobility Technologies Co., Ltd.
データが少ないほど品質が重要
10
■ データ量が多ければある程度のノイズはキャンセルされるが、データ量が少ない場
合はその品質が極めて重要になる
■ 500枚の学習データの12%がノイズである場合、以下2つは同じ効果を持つ
■ ノイズを除去する
■ 追加で500枚を学習データに加える(データセットサイズを2倍にする)
データ量:少
データ品質:低
データ量:多
データ品質:低
データ量:少
データ品質:高
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
11. Mobility Technologies Co., Ltd.
従来のソフトウェア
機械学習ソフトウェア
従来のソフトウェアと機械学習ソフトウェアの違い
11
スコープ定義 コーディング デプロイ
スコープ定義 学習 デプロイ
データ収集
DevOps
MLOps
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
12. Mobility Technologies Co., Ltd.
MLOpsの役割
12
スコープ定義 学習 デプロイ
データ収集
MLOps
機械学習プロジェクトのライフサイクル全体を通じて高品質なデータを保証する
Q. どのようにデータを定義
し、集めればよいか?
Q. モデルの性能改善のた
めにどのようにデータを変
更すればよいか?
Q. コンセプト/データドリフト
を検知するためにどのよう
なデータをトラックすればよ
いか?
MLOpsチームは各フェーズでのこれらの問いに答えられる必要がある
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
13. Mobility Technologies Co., Ltd.
Good Data is:
■ 定義が一貫している(ラベル y の定義に曖昧さがない)
■ 重要なケースをカバーしている(入力 x の分布を十分にカバーしている)
■ 現在のデータがタイムリーにフィードバックされる(データ分布がデータドリフトやコン
セプトドリフトをカバーしている)
■ サイズが適切である
Big DataからGood Dataへ
13
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube
14. Mobility Technologies Co., Ltd.
まとめ
14
AI System = Code + Data
Model-Centric AI
性能を改善するためにどのようにモ
デル(コード)を変更するか
Data-Centric AI
性能を改善するためにどのようにシ
ステマティックにデータを変更するか
■ MLOpsの最重要タスクは、機械学習プロジェクトのライフサイクル全体を通じて
高品質なデータを保証すること
■ 今後はData-Centric AIを効率的かつシステマティックに実現するためのツール
が重要となる
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, YouTube