SlideShare a Scribd company logo
企業における統計学入門
1
@suruli
今日お話しすること
• 統計学が企業でどのように求められ、使
われているか
• 統計学を用いる際の注意点
• 主体的にデータ解析をしよう
2
自己紹介
3
• SNS企業でゲームやSNSの売上や面白さを
アップするための統計屋業に従事
• 現場の方が簡単に経営指標などを見られる
ような分析ツールのプログラミングしたり
面白さを分析するための手法の開発など
• 学生時代は統計学を専攻していました
統計学って何するの?
• データを集計(合計や平均を求める)したり
• グラフを描いたり
• アンケートなどでデータを集めたり
• 相関分析や回帰分析をしたり
• 自然言語処理や画像認識という分野も!
4
よく統計屋を募集している分野
5
• SNS
• ソーシャルゲーム
• ECサイト
• 広告
• マーケティング
• 品質管理
• 民間研究所
なぜ企業に統計学が必要なの?
1. サービスの改善点を知りたい
2. 売行予測をして在庫の無駄をなくしたい
3. サービスをより良くしたい
4. サービスを健全化したい
• どうやってやるの…?
• そこで統計学を活用します
6
改善点を知る
• ソーシャルゲームのチュートリアル解析
• チュートリアルはユーザが最も離脱し易い
• 特に離脱し易いステップはどこ?
• 離脱し易いステップ=改善ポイント!
• ユーザが主体的に選択するポイントで離脱
傾向→選択ポイントを減らす+後回し
• 新規翌日継続率が 45->56% にアップ!
7
売行予測
• 過去の売り上げデータを元に、売行がど
の程度になりそうか予測できる
• 例:ビールの売上は気温が1度上がるごと
に12%上がる→明日は3度上がる予報
• どれくらい仕入れればいいかわかるから
過剰在庫による廃棄や品切れを防げる
8
サービスをより良くしたい
• 「この商品説明ページは背景赤色のほう
がいいのか青色のほうがいいのか…?」
• ユーザによって青赤を出しわけ、より購
入される方の色はどちらかを明らかに
• A/Bテストというよく知られた手法
• 検定の重要性:赤の方がちょっとだけ売
れ易かったのはたまたまかもしれないよ
9
サービスを健全化する
• SNSで暴力的な言葉やグロテスクだった
り卑猥だったりな画像が溢れていると
ユーザが不愉快になる
• テキストや画像を統計的に処理すること
で、不愉快になるようなコンテンツを削
除したり未成年に見せないようにしたり
• 上記を手作業でやるのは限界があるので
統計学とプログラムを利用して自動化
10
統計学の資格:統計学検定
• 時期:春・秋頃
• 費用:3級4000円、4級3000円
• メリット:資格欄に書ける、体系的に統
計学を学べる、実力試しになる
• 本学の統計学の講義を真面目に受けて勉
強すれば3級は取れます
• 就活にも使える!
11
12
…ほんと?
13
統計学の注意点
1. データは真実を語るのか?
2. データは客観的なのか?
3. データを集計したりグラフを描いたりさ
えすれば何かわかるのか?
14
データは
真実を語るのか?
15
PVについて考えてみる
• Webサービスがどれくらい活発に使われて
るかを表すのに用いられるデータ
• 沢山のWeb企業で現在も使われている
• page viewの略
• 1画面表示したら1PV
16
1PVって何だろう?
• ポップ画像浮き上がったら1pv?
• 商品説明長くなって2ページになりました
→2pv?
• 「使い勝手を良くするために、あまり画
面遷移しないでも簡単に操作出来るよう
にしました!」
→PV激減
→上司「昇給無しね」
17
PVの問題点
• サービスの画面遷移の数によって同じ
ユーザ数でも値が大きく異なる
• ユーザによっても値が大きく異なる
• PVに応じて制作サイドにボーナス与える
と、制作サイドは売上とは関係無いPV稼
ぐためだけのページを作り出す可能性が
• そもそもPVで活性度は本当に測れるの?
18
ドリコムの対応策
• 「ソーシャルゲームにおいて、PVはあま
りにも不安定。もっと実質的な活性度を
測ることができるデータは?」
• 定着ユーザ:5日間連続ログインユーザ
– 5日間も連続してゲームを遊び続けてくれる
ユーザはやる気があるユーザに違いない!
– 実際に定着ユーザは継続率も課金額も高い
19
20引用:http://www.slideshare.net/TokorotenNakayama/dau-21559783
データは真実か?
• データはあくまでも対象をある一面から
切り取っただけのモノ
• データはある一面から見た事実ではあっ
ても真実ではない
• テストの点はある程度ヒトの頭の良さを
測ることはできるけれど、全てではない
21
データは
客観的なのか?
22
顧客単価を考える(1)
• 顧客単価を平均値|中央値どちらで求めるか
• 「高額商品を出して顧客単価アップだ!」
先月売上 [100, 200, 300, 400, 500]
今月売上 [100, 200, 300, 600, 800]
• 平均値:=各売上を足して総数で割った値
• 中央値:=各売上を順番に並べた真ん中の値
• 先月平均値 = 300円, 今月平均値 = 400円
• 先月中央値 = 300円, 今月中央値 = 300円
23
顧客単価を考える(2)
• 中央値だと先月も今月も顧客単価は変わら
ず、しかし平均値だと上昇してる
• 顧客単価として平均値を使うか中央値を使
うかで高額商品戦略の成功/失敗のとらえ方
が変わってしまう!
• 同じデータでも計算方法によって結果は変
わる。データ「さえあれば」客観的(全員
同じ結論を導く)というわけではない
24
データを集計したり
グラフにしたり…
それさえすれば
何かわかるのか?
25
26
引用:
http://www.atmarkit.co.jp/fwin2k/itpropower/admin-kun/051/adminkun051.html
ツールや手法に振り回されない
• Excel、R、SPSS、STATA…色々便利な
ツールや分析手法はあるけれど
• データをツールに放り込んだだけでは価
値がない。ツールから出てきた結果を解
釈し意味づけして初めて価値が出てくる
• 仕事でもレポートでもそれは同じ
27
28
引用:フジテレビ
スーパーニュース
シンプソンズ・パラドックス
• データをある軸で分割してみると、全体
とは違った傾向がみられる事象
29
例:PC保持台数と恋愛数
30
人数
PC
※仮想例です
相関なんて
無かった?
31
人数
PC
男女で分離してみた
女性 男性
ここまでのまとめ
• 統計学は様々なことを明らかにしてくれ
る強力な武器になる!
• でも、使い方を誤ると価値がなくなる
• 正しく統計学を使えるよう、今のうちに
全力で学び、研究にも就活にも仕事にも
活用しよう!
32
データ解析とは何か
33
John. W. Tukey
データ解析とは、
データを分析する手順,
その手順から得られた結果を解釈する技法,
解析をより容易かつ
高精度かつ高確度にする
データ収集のプランニング、
そしてデータの分析に適用された
統計学の手法と結果の全てである
34
統計屋心得
• 統計に関する全ての責任を負う
• 「依頼内容がダメだったんだ」
→良き依頼内容になるよう主体的に行動する
• 「俺の素晴らしい分析結果を依頼者が理
解できなかったから失敗したんだ」
→理解して頂くのも仕事のうちです
• 「データが悪くて上手く行かないんだ」
→データの設計や整備こそ統計屋の仕事です
35
36
分析事例紹介
~統計屋心得を踏まえて~
37
とあるRPG系ソシャゲ分析依頼
依頼主
「継続率落ちてないのにユーザ数が落ち続け
ている。広告費を削減したため、新規登録者
の数が落ちたせいだ。ユーザ数を元の状態に
戻したい。どの程度広告をすればいいだろう
か?」
38
統計屋がすべきこと
• 目的の明確化
• 事実と仮説の確認
• 定義の確認
• 手段の選定
• 言われるがままにそれだけやるのは、ど
んな高度な統計手法適用しようがただの
オペレータです
39
状況の明確化
事実:継続率落ちてないのにユーザ数が落ち
続けている
仮説:ユーザ数減少の主要因は、広告費を削
減による新規登録者減少(のみ)
目的:ユーザ数を元の状態に戻したい
手段:広告費を上げる
40
事実確認
• 確かに「提示された継続率」は落ちてな
い、新規登録者は減少
• 継続率の定義は?
– 全ユーザのうち翌週もプレイしている率
• この定義は妥当か?
→初級、中級、上級者で継続率全然違う
+初~上級者の定義を明確にしよう
• 本当に改善手段は広告費アップだけ?
41
検証してみる
• 初級者は継続率が低く、上級者は高いこ
とが明らかに
• この結果は経験・直観的にも妥当
• ユーザ全体のうち、広告切ったせいで初
級者層が減って上級者層が増えている
→割合として継続率が高い層が増えているのだ
から、ユーザ全体の継続率は上がる筈では?
42
さらに検証してみる
• 新事実:上級者層の継続率が最近下落し
ていた!
• 事実を組み合わせて検証してみる
• →「新規ユーザの減少に伴う低継続率層
の減少による全体継続率上昇」と「上級
者層の継続率低下による全体継続率低
下」を合わせた結果がたまたま±0に!
43
学び
• ユーザ減少の問題点は「広告減による新
規ユーザの減少」だけではなく「上級者
の継続率低下」もあった
• 正しく問題点を把握出来たのは、主体的
に事実と仮説を確認・検証したから
• 言われるがままに任せない、非専門家に
計画責任を負わせない
• 医者は患者に言われるままに薬を出すか
44
まとめ
• 研究でも仕事でも主体的に動こう
• ×「ゼミ飲み会の場所は毎回俺が決める」
• 「お客さんが言ったからやった」「先生
に言われたからやった」では学びも価値
もありません
• なぜ学ぶのか、なぜこの対象を分析する
のか、なぜこの手法を使うのか、人任せ
ではなく自分で説明できるようにしよう
45
最後に
• 統計学は難しいです、挫折も仕方ないです
• 学生時代、統計が役に立つのか半信半疑でした
• でも、今私が稼げてるのは統計学のお陰です
• 学部の統計学は基礎体力。成果に直結しなくても
気にしなくて良いです
• 統計学は正しく使うと、とてもお金になります
• プログラミングも出来るとなお良いが、焦らず
• 明確な目標(単位や就活)に向けて頑張って下さい
46

More Related Content

PDF
Webで使えるやさしい統計学
Mharu
 
PDF
インターネット調査による世論観測の試み ―「空気」の変化を詳細・迅速に捉えるための発想と実践
Masashi Hagihara
 
PPTX
データマイニング入門編 その2
takosumipasta
 
PDF
機械学習による積極的失業〜オウンドメディアの訪問予測
Teruyuki Sakaue
 
PPTX
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
 
PDF
[Music×Analytics]プロの音に近づくための研究と練習
Teruyuki Sakaue
 
PDF
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
Teruyuki Sakaue
 
PDF
20131114大阪itワークショップ
良威 日野
 
Webで使えるやさしい統計学
Mharu
 
インターネット調査による世論観測の試み ―「空気」の変化を詳細・迅速に捉えるための発想と実践
Masashi Hagihara
 
データマイニング入門編 その2
takosumipasta
 
機械学習による積極的失業〜オウンドメディアの訪問予測
Teruyuki Sakaue
 
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
 
[Music×Analytics]プロの音に近づくための研究と練習
Teruyuki Sakaue
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
Teruyuki Sakaue
 
20131114大阪itワークショップ
良威 日野
 

Viewers also liked (20)

PDF
DeNAの大規模データマイニング活用したサービス開発
Koichi Hamada
 
PDF
ABテスト・LPOのための統計学【社内向けサディスティックエディション】データアーティスト株式会社
Satoru Yamamoto
 
PDF
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
Ken'ichi Matsui
 
PDF
統計学の基礎の基礎
Ken'ichi Matsui
 
PDF
はじめての「R」
Masahiro Hayashi
 
PDF
Python東海Vol.5 IPythonをマスターしよう
Hiroshi Funai
 
PDF
Pythonで簡単ネットワーク分析
antibayesian 俺がS式だ
 
PDF
データマイニング入門
hrfm
 
PDF
全文検索入門
antibayesian 俺がS式だ
 
PDF
Credential twittorebiew v1.3
Social Media Live!
 
PDF
ガチャとは心の所作
antibayesian 俺がS式だ
 
PDF
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
 
PDF
第1回茶ッカソン in Tokyo プレゼンシート「FULLER」
kakusan40
 
PDF
SPSSで簡単テキストマイニング
antibayesian 俺がS式だ
 
PPTX
第1回茶ッカソン in Tokyo プレゼンシート「チームNifty」
kakusan40
 
PDF
チームラボ忘年会
antibayesian 俺がS式だ
 
PDF
テキストマイニングのイメージと実際
antibayesian 俺がS式だ
 
PDF
神の言語による自然言語処理
antibayesian 俺がS式だ
 
PDF
Credential social media_live_v1_3
Social Media Live!
 
DeNAの大規模データマイニング活用したサービス開発
Koichi Hamada
 
ABテスト・LPOのための統計学【社内向けサディスティックエディション】データアーティスト株式会社
Satoru Yamamoto
 
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
Ken'ichi Matsui
 
統計学の基礎の基礎
Ken'ichi Matsui
 
はじめての「R」
Masahiro Hayashi
 
Python東海Vol.5 IPythonをマスターしよう
Hiroshi Funai
 
Pythonで簡単ネットワーク分析
antibayesian 俺がS式だ
 
データマイニング入門
hrfm
 
全文検索入門
antibayesian 俺がS式だ
 
Credential twittorebiew v1.3
Social Media Live!
 
ガチャとは心の所作
antibayesian 俺がS式だ
 
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
 
第1回茶ッカソン in Tokyo プレゼンシート「FULLER」
kakusan40
 
SPSSで簡単テキストマイニング
antibayesian 俺がS式だ
 
第1回茶ッカソン in Tokyo プレゼンシート「チームNifty」
kakusan40
 
チームラボ忘年会
antibayesian 俺がS式だ
 
テキストマイニングのイメージと実際
antibayesian 俺がS式だ
 
神の言語による自然言語処理
antibayesian 俺がS式だ
 
Credential social media_live_v1_3
Social Media Live!
 
Ad

Similar to 企業における統計学入門 (15)

PDF
H231126 統計および確率を利用した予測と判断rev1
Kenichi Takara
 
PDF
なぜ統計学がビジネスの 意思決定において大事なのか?
Takashi J OZAKI
 
PPTX
Excelを使って学ぶ、統計の基礎
webcampusschoo
 
PDF
(道具としての)データサイエンティストのつかい方
Shohei Hido
 
PDF
あなたの業務に機械学習を活用する5つのポイント
Shohei Hido
 
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
 
PDF
確率統計-機械学習その前に v2.0
Hidekatsu Izuno
 
PDF
ビジネスマネージャとデータ分析
TOSHI STATS Co.,Ltd.
 
PDF
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
schoowebcampus
 
PDF
コース導入講義(荒木)
Faculty of Economics, Momoyama Gakuin University
 
PDF
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
Takashi J OZAKI
 
PDF
統計学超入門 アップロード用
w24nishi
 
PDF
Excelを使って学ぶ、統計の基礎(3限目) 先生:米谷 学
schoowebcampus
 
PDF
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
aitc_jp
 
PPT
Big data harvardbusiessreview20121112
Dennis Sugahara
 
H231126 統計および確率を利用した予測と判断rev1
Kenichi Takara
 
なぜ統計学がビジネスの 意思決定において大事なのか?
Takashi J OZAKI
 
Excelを使って学ぶ、統計の基礎
webcampusschoo
 
(道具としての)データサイエンティストのつかい方
Shohei Hido
 
あなたの業務に機械学習を活用する5つのポイント
Shohei Hido
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
BrainPad Inc.
 
確率統計-機械学習その前に v2.0
Hidekatsu Izuno
 
ビジネスマネージャとデータ分析
TOSHI STATS Co.,Ltd.
 
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
schoowebcampus
 
コース導入講義(荒木)
Faculty of Economics, Momoyama Gakuin University
 
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの
Takashi J OZAKI
 
統計学超入門 アップロード用
w24nishi
 
Excelを使って学ぶ、統計の基礎(3限目) 先生:米谷 学
schoowebcampus
 
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
aitc_jp
 
Big data harvardbusiessreview20121112
Dennis Sugahara
 
Ad

Recently uploaded (11)

PPTX
【Qlik 医療データ活用勉強会】第50回 日本医療マネジメント学会参加報告、DPCデータの活用等
QlikPresalesJapan
 
PPTX
20250729_TechTalk_QlikTalendCloud_データ品質とデータガバナンス
QlikPresalesJapan
 
PDF
RV車市場、CAGR2.60%で成長し、2031年には37640百万米ドル規模に
yhresearch
 
PDF
セットトップボックス市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
snow326214
 
PDF
ダイヤモンドスラリー市場規模の成長見通し:2031年には193百万米ドルに到達へ
yhresearch
 
PPTX
PRESENTASI IZIN OPERASIONAL SMK ISLAM KARYA MANDIRI
BAHRULALAM27
 
PDF
世界mPOSデバイス市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
yhresearch
 
PDF
埋め込み型ドラッグデリバリーデバイスの成長予測:2031年には751百万米ドルに到達へ
2418867459
 
PDF
工業用ミストシステム調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
2418867459
 
PPTX
BEIS ORIENTATION FOR S.Y2024 - 2025.pptx
AsmiraCo2
 
PDF
FeNO呼気分析装置市場、CAGR13.90%で成長し、2031年には290百万米ドル規模に
yhresearch
 
【Qlik 医療データ活用勉強会】第50回 日本医療マネジメント学会参加報告、DPCデータの活用等
QlikPresalesJapan
 
20250729_TechTalk_QlikTalendCloud_データ品質とデータガバナンス
QlikPresalesJapan
 
RV車市場、CAGR2.60%で成長し、2031年には37640百万米ドル規模に
yhresearch
 
セットトップボックス市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
snow326214
 
ダイヤモンドスラリー市場規模の成長見通し:2031年には193百万米ドルに到達へ
yhresearch
 
PRESENTASI IZIN OPERASIONAL SMK ISLAM KARYA MANDIRI
BAHRULALAM27
 
世界mPOSデバイス市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
yhresearch
 
埋め込み型ドラッグデリバリーデバイスの成長予測:2031年には751百万米ドルに到達へ
2418867459
 
工業用ミストシステム調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
2418867459
 
BEIS ORIENTATION FOR S.Y2024 - 2025.pptx
AsmiraCo2
 
FeNO呼気分析装置市場、CAGR13.90%で成長し、2031年には290百万米ドル規模に
yhresearch
 

企業における統計学入門