SlideShare a Scribd company logo
AWS  Search  Services
Eiji  Shinohara
(2014年年にA9のCloudSearchチームが来⽇日した時の飲み会の様⼦子)
⾃自⼰己紹介
{
        "Name"  :  "篠原英治",
        "Twitter"  :  "@shinodogg",
        "Profile"  :  {
                                                "Role"  :  "Solutions  Architect",
                                                "Market":  "Startup",
                                                "Services"  :  [  
                                                                                        "Amazon  CloudSearch",
                                                                                        "Amazon  Elasticsearch  Service",
                                                                                        "Amazon  Simple  Workflow  Service”,
                                                                                          "AWS  Elastic  Beanstalk”
                                                                                    ]
                                        }
}
New ☺
AWSの検索索サービス
•  Amazon  CloudSearch
–  https://aws.amazon.com/jp/cloudsearch/  
•  Amazon  Elasticsearch  Service
–  https://aws.amazon.com/jp/elasticsearch-‐‑‒service/  
Amazon  CloudSearch Amazon  Elasticsearch  Service
A9.com
•  CloudSearch/Amazon  ES  の開発拠点はパロアルト
•  Amazonの商品検索索もA9で作っています
A9.com
Amazon  CloudSearch
•  ⾃自動拡張するフルマネージド検索索サービス
–  2011  API
•  A9が作ったプロプライエタリな検索索エンジン
•  Amazon.comで使っているもの
•  東京リージョンは対象外
–  2013  API
•  on  top  of  Apache  Solr
•  多⾔言語対応
–  ⽇日本語の形態素解析、n-‐‑‒gram、カスタム辞書にも対応
•  東京リージョンは2014年年3⽉月からサービス提供中
Amazon  CloudSearch
•  Auto  Scaling  /  Auto  Partitining
Auto  Partitioning
Auto  Scaling
Amazon  CloudSearch
•  Amazon  EMRを利利⽤用した⾃自動ノード分割
Index
Index  P1
Index  P2Amazon  
EMR
Amazon  CloudSearch
•  ⽇日本でも様々な公開事例例
–  schoo
–  nanapi
–  ChatWork
–  サイタ
–  SnapDish
–  SmartInsight
–  Lancers
–  ごちクル
–  SmartNews
A9  x  SmartNews  in  Palo  Alto
CloudSearch  Meetup  at  Amazon  Meguro  Office
SourceFieldとDynamicField
•  SourceField
–  例例えば、形態素解析とBi-‐‑‒Gramの2つのフィールドを⽤用意
–  バッチファイルで全く同じものを⼆二つ⽤用意するのは無駄
–  よくあるのは、例例えば住所
Solrで⾔言うところのCopy  Fieldあります
SourceFieldとDynamicField
•  DynamicField
–  飲み会系、イベント系、、どんどんフィールド増やす??
–  フィールド定義は1つだけ
SourceFieldとDynamicField
•  DynamicField
–  bar_̲txt
*_̲txt  指定の検索索は出来ません
⇒⼊入れた時に指定したフィールド名でのみ検索索
•  形態素解析(Morphological  Analysis)
–  辞書のカスタマイズできます
Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
•  形態素解析(Morphological  Analysis)
–  辞書のカスタマイズできます:  AWS  CLI/SDKからも操作可能
{              
        "AnalysisSchemeName":  "jascheme",
        "AnalysisSchemeLanguage":  "ja",
        "AnalysisOptions":  {
                "JapaneseTokenizationDictionary":  "[
                        [“きゃりーぱみゅぱみゅ”,“きゃりー  ぱみゅぱみゅ”,“キャリー  パミュパミュ","名
詞,固有名詞,⼈人名”]
]"  
        }
}
$  aws  cloudsearch  define-‐‑‒analysis-‐‑‒scheme  -‐‑‒-‐‑‒region  us-‐‑‒east-‐‑‒1  -‐‑‒-‐‑‒domain-‐‑‒name  mydomain  
-‐‑‒-‐‑‒analysis-‐‑‒scheme  file://jascheme.txt
Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
•  シノニム・類義語(Synonym  Addition)
–  例例えば  Venice
•  ベニス
•  ベネチア
•  ヴェネチア
•  ヴェネツィア
–  Alias
•  Pupilで検索索  =>  Studentもヒット
•  Studentで検索索  =>  Pupilはヒットしない
–  Group
•  1st,  first,  one  =>  どれで検索索しても全てヒット
–  上記全て、マネージメントコンソールもしくはCLI/SDKで操作可能
http://ja.wikipedia.org/wiki/ヴェネツィア  
Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
•  A/Bテスト
–  マネージメントコンソール上で⽐比較
Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
Amazon  CloudSearch
•  CloudSearchにいただいたご要望
–  リアルタイムにデータを取り込んで可視化したい
•  CloudSearchは最⼤大で5MBのバッチファイルでの連携
•  細かいデータを⾼高頻度度でストアするのに強いストレージではない
–  Amazon  CloudSearchの独⾃自APIを習得するのに時間がかかる
•  Solrを使っているがSolrのAPIは利利⽤用できない
•  完全マネージドでスケールと低レイテンシを同時に満たすには
様々なSolrの機能をオープンにすることはできない
Elasticsearch
•  Google  Trends
ELK  stack
•  ELK  is  Elasticsearch,  Logstash,  and  Kibana
Elasticsearch  is  a  
distributed,  schema-‐‑‒
free  search  and  
analytics  engine
Logstash  is  a  tool  for  
collecting  and  
managing  events  and  
logs.
Kibana  is  a  browser-‐‑‒
based  analytics  and  
search  dashboard  for  
Elasticsearch.
Kibana
•  探索と可視化
http://www.binpress.com/blog/2014/10/21/binpress-‐‑‒podcast-‐‑‒episode-‐‑‒16-‐‑‒shay-‐‑‒banon-‐‑‒elasticsearch/  
Amazon  Elasticsearch  Service
Shayさんと私(篠原)ですw
Amazon  Elasticsearch  Service
•  Elasticsearchのマネージドサービス
–  AWSクラウド上で  Elasticsearch  を簡単に構築可能
•  Elasticsearchの分散/スケーリング機能はクラウドと相性が良良い
•  インスタンスタイプと台数を選択するだけでプロビジョニング
–  デフォルトでKibanaがインストール
•  Management  ConsoleにてURLをクリックするだけで直ぐ利利⽤用可能
–  使った分だけの従量量課⾦金金
•  ノードに利利⽤用するEC2の時間課⾦金金
•  EBSボリュームを使った場合はEBSの料料⾦金金
–  略略称はAmazon  ES
Amazon  Elasticsearch  Service
http://aws.typepad.com/aws_̲japan/2015/10/amazon-‐‑‒elasticsearch-‐‑‒service.html  
Amazon  Elasticsearch  Service
•  Elasticsearchの利利点
–  クエリは⾮非常に⾼高速でアドホックな集計や分析に強い
•  Apache  Luceneベース(Apache  SolrおよびCloudSearchと同様)
–  リアルタイムにデータを取り込んで検索索可能な状態にできる
•  Kibanaを活⽤用することでリアルタイムにデータを可視化
•  Amazon  Elasticsearch  Serviceの利利点
–  AWSのサービスと連携して⼀一気通貫な構成を簡単に構築できる
    例例1)  CloudWatch  Logs→Lambda→Elasticsearch→Kibana
    例例2)  DynamoDB  Streams→Logstash→Elasticsearch
–  複数AZへの分散配置もチェックボックスにチェックを⼊入れるだけ
•  Zone  Awareness機能
Amazon  Elasticsearch  Service
•  Amazon  ESの注意点
–  CloudSearchのように⾃自動的にスケーリングはしない
•  構成は後から変更更可能であるがダウンタイムはゼロではない
–  プラグインを⾃自由にインストールすることはできない
•  マネージドサービスである為、セキュリティや可⽤用性担保の必要性
•  Elasticの商⽤用プラグインに該当するような機能はIAMやCloudWatchで
–  各種メトリクスを⾒見見ながらユーザー⾃自⾝身で対応する必要がある
Amazon  Elasticsearch  Service
•  Amazon  ESのCloudWatch  Metrics
q  Cluster  status(Green/Yellow/Red)
q  Node  count
q  Searchable  documents
q  Deleted  documents
q  CPU  utilization
q  Free  storage  space
q  JVM  memory  pressure
q  Automatic  snapshot  failures
q  Master  CPU  utilization
q  Master  free  storage  space
q  Master  JVM  memory  pressure
q  Read  IOPS
q  Write  IOPS
q  Read  latency
q  Write  latency
q  Read  throughput
q  Write  throughput
q  Disk  queue  depth
Amazon  Elasticsearch  Service
Amazon  Elasticsearch  Service
•  IAM  Integration
–  IPアドレスベースの制限
•  例例)  Kibanaへのアクセスは社内のIPアドレスレンジからのみ
–  Signed  requests  with  SigV4
•  例例)  AWSのクレデンシャルを使ってセキュアにアクセス
•  Logstashプラグイン:  https://github.com/awslabs/logstash-‐‑‒output-‐‑‒amazon_̲es  
–  Fine-‐‑‒grainedアクセスコントロール
•  例例)  ドメイン内のIndex毎にアクセス権限を分ける
Logstash Amazon  ESData  Source
Amazon  Elasticsearch  Service
•  ⽇日本語解析
–  ICUとKuromojiプラグインはインストール済み
•  analysis-‐‑‒icu(ノーマライズ)
•  analysis-‐‑‒kuromoji(形態素解析)
–  但し、ユーザー辞書の追加機能は現在(2015年年10⽉月)開発中
•  その他ご要望があれば随時ご連絡ください
Amazon  Elasticsearch  Service
•  Deployment
node node
EBS EBS
node
node
node
Master  Nodes Data  Nodes
Cluster
Node
Shard  3
node
EBS
node
EBS
Shard  1
Shard  4
Shard  2
Amazon  Elasticsearch  Service
•  バックアップ&リストア
–  AWSが⾃自動で取得するもの
•  Daily:  1⽇日1回  Automated  snapshot  start  hourで指定
•  リストアはAWSサポートまで
–  お客さまがご⾃自⾝身で取得するもの  w/  _̲snapshot  API
•  Elasticsearchのフォーマットでお客さまのS3バケット
•  任意のタイミングでいつでもリストア可能
Amazon  Elasticsearch  Service
•  今後の予定
–  2016年年にはかなり多くの機能追加を予定
–  但し、お客さまからのご要望によって優先度度は変わってきます
例例)
•  Elasticsearch2.0は?Kibana4.2は?複数バージョンサポートして欲しい
•  9300番ポートを使ったElasticsearchのバイナリなプロトコルを利利⽤用したい
•  VPC内のエンドポイントが欲しい
–  是⾮非AmazonESをご利利⽤用いただき、フィードバックいただければと
思います!
AWS Search Services

More Related Content

PDF
Application Deployment on AWS
Eiji Shinohara
 
PDF
20151207 AWS re:invent 2015 ReCap
Kiyonori Kitasako
 
PDF
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
 
PDF
20160526 AWSサービスアップデート
Genta Watanabe
 
PDF
AWS Black Belt Online Seminar 2017 AWS X-Ray
Amazon Web Services Japan
 
PDF
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
Amazon Web Services Japan
 
PDF
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
Amazon Web Services Japan
 
PDF
[AWS Start-up ゼミ] よくある課題を一気に解説!〜御社の技術レベルがアップする 2017 夏期講習〜
Amazon Web Services Japan
 
Application Deployment on AWS
Eiji Shinohara
 
20151207 AWS re:invent 2015 ReCap
Kiyonori Kitasako
 
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
 
20160526 AWSサービスアップデート
Genta Watanabe
 
AWS Black Belt Online Seminar 2017 AWS X-Ray
Amazon Web Services Japan
 
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
Amazon Web Services Japan
 
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
Amazon Web Services Japan
 
[AWS Start-up ゼミ] よくある課題を一気に解説!〜御社の技術レベルがアップする 2017 夏期講習〜
Amazon Web Services Japan
 

What's hot (20)

PDF
AWS LambdaとDynamoDBがこんなにツライはずがない #ssmjp
Masahiro NAKAYAMA
 
PDF
CTO Night & Day Morning Session "Auto Scaling & Spot Instances Deep Dive"
akitsukada
 
PDF
Search Solutions on AWS
Eiji Shinohara
 
PDF
AWS Black Belt Techシリーズ Amazon CloudSearch
Amazon Web Services Japan
 
PDF
Amazon Elasticsearch Serviceを利用したAWSのログ活用
真司 藤本
 
PDF
AWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
Amazon Web Services Japan
 
PDF
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
 
PDF
Amazon s3へのデータ転送における課題とその対処法を一挙紹介
Tetsunori Nishizawa
 
PDF
AWS Black Belt Techシリーズ AWS Data Pipeline
Amazon Web Services Japan
 
PDF
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
都元ダイスケ Miyamoto
 
PDF
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
 
PDF
Tune Up AWS Lambda
Keisuke Nishitani
 
PPTX
Aurora新時代の幕開けとDynamoDBの進化
Classmethod,Inc.
 
PDF
AWS Black Belt Online Seminar 2017 AWS Storage Gateway
Amazon Web Services Japan
 
PPTX
AWS Batch Fargate対応は何をもたらすか
Shun Fukazawa
 
PDF
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
 
PDF
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
 
PDF
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
Amazon Web Services Japan
 
PDF
AWS Black Belt Online Seminar 2017 Deployment on AWS
Amazon Web Services Japan
 
PDF
AWS 初心者向けWebinar AWS上にWebサーバシステムを作ってみましょう~まずは仮想サーバーから[演習つき]
Amazon Web Services Japan
 
AWS LambdaとDynamoDBがこんなにツライはずがない #ssmjp
Masahiro NAKAYAMA
 
CTO Night & Day Morning Session "Auto Scaling & Spot Instances Deep Dive"
akitsukada
 
Search Solutions on AWS
Eiji Shinohara
 
AWS Black Belt Techシリーズ Amazon CloudSearch
Amazon Web Services Japan
 
Amazon Elasticsearch Serviceを利用したAWSのログ活用
真司 藤本
 
AWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
Amazon Web Services Japan
 
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
 
Amazon s3へのデータ転送における課題とその対処法を一挙紹介
Tetsunori Nishizawa
 
AWS Black Belt Techシリーズ AWS Data Pipeline
Amazon Web Services Japan
 
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
都元ダイスケ Miyamoto
 
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
 
Tune Up AWS Lambda
Keisuke Nishitani
 
Aurora新時代の幕開けとDynamoDBの進化
Classmethod,Inc.
 
AWS Black Belt Online Seminar 2017 AWS Storage Gateway
Amazon Web Services Japan
 
AWS Batch Fargate対応は何をもたらすか
Shun Fukazawa
 
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
 
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
 
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
Amazon Web Services Japan
 
AWS Black Belt Online Seminar 2017 Deployment on AWS
Amazon Web Services Japan
 
AWS 初心者向けWebinar AWS上にWebサーバシステムを作ってみましょう~まずは仮想サーバーから[演習つき]
Amazon Web Services Japan
 
Ad

Viewers also liked (12)

PDF
CTO Night & Day Morning Session "スタートアップCTOならおさえておきたいAWS基本構成"
akitsukada
 
PPTX
Expectation for cloudSearch
Minoru Osuka
 
PDF
CTO Night & Days 2015 Winter - AWS Mobile Development
崇之 清水
 
PPTX
Amazon CloudSearch
davtchev
 
PDF
CTO Night & Days 2015 Winter - AWS Mobile Testing
崇之 清水
 
PDF
Amazon EC2 Container Service Deep dive
Amazon Web Services Japan
 
PDF
セキュリティCDN: Imperva Incapsula
J-Stream Inc.
 
PDF
CDNによるInternet支配の現状とICNの可能性
J-Stream Inc.
 
PDF
AWS Lambda and Amazon API Gateway
Shinpei Ohtani
 
PDF
Amazon Aurora
Shinpei Ohtani
 
PDF
20151207 Streaming on AWS
Kiyonori Kitasako
 
PPT
Free Download Powerpoint Slides
George
 
CTO Night & Day Morning Session "スタートアップCTOならおさえておきたいAWS基本構成"
akitsukada
 
Expectation for cloudSearch
Minoru Osuka
 
CTO Night & Days 2015 Winter - AWS Mobile Development
崇之 清水
 
Amazon CloudSearch
davtchev
 
CTO Night & Days 2015 Winter - AWS Mobile Testing
崇之 清水
 
Amazon EC2 Container Service Deep dive
Amazon Web Services Japan
 
セキュリティCDN: Imperva Incapsula
J-Stream Inc.
 
CDNによるInternet支配の現状とICNの可能性
J-Stream Inc.
 
AWS Lambda and Amazon API Gateway
Shinpei Ohtani
 
Amazon Aurora
Shinpei Ohtani
 
20151207 Streaming on AWS
Kiyonori Kitasako
 
Free Download Powerpoint Slides
George
 
Ad

Similar to AWS Search Services (20)

PDF
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
Amazon Web Services Japan
 
PDF
aws blackbelt amazon elasticsearch service
Amazon Web Services Japan
 
PPTX
AWS Premier Night #2 in Osaka『Amazon Elasticsearch Serviceのおもしろい使い方』
Takayoshi Kobayashi
 
PDF
AWS 初心者抜けきれない私がAWS Samurai と AWS Community Builder の特権フル活用したらどんなものが作れるか挑戦する
Kahori Takeda
 
PDF
20200414 Advanced Features in Amazon Elasticsearch Service
Amazon Web Services Japan
 
PDF
AWS Black Belt Online Seminar 2018 re:Invent 2017 Recap Machine Learning / Da...
Amazon Web Services Japan
 
PPTX
re:invent2018 総ざらえ
真乙 九龍
 
PDF
エンジニアの為のAWS実践講座
Eiji Shinohara
 
PDF
Introducing the elastic 8.0 release a new era of speed, scale, relevance, and...
Shotaro Suzuki
 
PDF
2013 デブサミ 「SIの未来ってどうなのよ?」
Serverworks Co.,Ltd.
 
PDF
JJUG CCC リクルートの Java に対する取り組み
Recruit Technologies
 
PDF
Accelerating AdTech on AWS #AWSAdTechJP
Eiji Shinohara
 
PDF
はじめてのAmazon Web Services
SORACOM, INC
 
PDF
AWS AI Solutions
Amazon Web Services Japan
 
PDF
Elasticsearch入門 pyfes 201207
Jun Ohtani
 
PDF
【JAWS-UG東京発表資料】AWS Summit Tokyo 2018の振り返りと最新アップデート
Amazon Web Services Japan
 
PDF
AWS Update 2011/10
Akio Katayama
 
PDF
Global AWS AdTech use-cases
Eiji Shinohara
 
PDF
AWS Black Belt - AWS Glue
Amazon Web Services Japan
 
PPTX
2011年12月 八子クラウド「縦と横のクラウドインテグレーション」
Serverworks Co.,Ltd.
 
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
Amazon Web Services Japan
 
aws blackbelt amazon elasticsearch service
Amazon Web Services Japan
 
AWS Premier Night #2 in Osaka『Amazon Elasticsearch Serviceのおもしろい使い方』
Takayoshi Kobayashi
 
AWS 初心者抜けきれない私がAWS Samurai と AWS Community Builder の特権フル活用したらどんなものが作れるか挑戦する
Kahori Takeda
 
20200414 Advanced Features in Amazon Elasticsearch Service
Amazon Web Services Japan
 
AWS Black Belt Online Seminar 2018 re:Invent 2017 Recap Machine Learning / Da...
Amazon Web Services Japan
 
re:invent2018 総ざらえ
真乙 九龍
 
エンジニアの為のAWS実践講座
Eiji Shinohara
 
Introducing the elastic 8.0 release a new era of speed, scale, relevance, and...
Shotaro Suzuki
 
2013 デブサミ 「SIの未来ってどうなのよ?」
Serverworks Co.,Ltd.
 
JJUG CCC リクルートの Java に対する取り組み
Recruit Technologies
 
Accelerating AdTech on AWS #AWSAdTechJP
Eiji Shinohara
 
はじめてのAmazon Web Services
SORACOM, INC
 
AWS AI Solutions
Amazon Web Services Japan
 
Elasticsearch入門 pyfes 201207
Jun Ohtani
 
【JAWS-UG東京発表資料】AWS Summit Tokyo 2018の振り返りと最新アップデート
Amazon Web Services Japan
 
AWS Update 2011/10
Akio Katayama
 
Global AWS AdTech use-cases
Eiji Shinohara
 
AWS Black Belt - AWS Glue
Amazon Web Services Japan
 
2011年12月 八子クラウド「縦と横のクラウドインテグレーション」
Serverworks Co.,Ltd.
 

More from Eiji Shinohara (20)

PDF
Indexing with Algolia Ruby API Client
Eiji Shinohara
 
PDF
Getting Started Algolia with InstantSearch.js
Eiji Shinohara
 
PDF
Algolia introduction in Kanazawa - July 2019
Eiji Shinohara
 
PDF
Scalable and Cost Effective Systems Architecture on AWS
Eiji Shinohara
 
PDF
#AWSAdTechJP
Eiji Shinohara
 
PDF
Accelerating AdTech on AWS in Japan
Eiji Shinohara
 
PDF
AWS Summit New York 2017 Keynote Recap
Eiji Shinohara
 
PPTX
#CTONight powered by AWS
Eiji Shinohara
 
PDF
SolrCloud on Amazon ECS
Eiji Shinohara
 
PDF
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
Eiji Shinohara
 
PDF
IVS CTO Night and Day Recap - #CTONight 2016 Winter
Eiji Shinohara
 
PDF
Tips for getting the most out of AWS re:Invent IN ENGLISH
Eiji Shinohara
 
PDF
検索技術の活用による広告配信Relevance向上
Eiji Shinohara
 
PDF
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
Eiji Shinohara
 
PDF
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
Eiji Shinohara
 
PDF
IVS CTO Night and Day Recap - #CTONight 2016 Spring
Eiji Shinohara
 
PDF
Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Eiji Shinohara
 
PDF
Search on AWS - IVS CTO Night and Day 2016 Spring
Eiji Shinohara
 
PDF
Getting Started Japanese Search and Calculate Similarity with Apache Lucene
Eiji Shinohara
 
PDF
[要約] Building a Real-Time Bidding Platform on AWS #AWSAdTechJP
Eiji Shinohara
 
Indexing with Algolia Ruby API Client
Eiji Shinohara
 
Getting Started Algolia with InstantSearch.js
Eiji Shinohara
 
Algolia introduction in Kanazawa - July 2019
Eiji Shinohara
 
Scalable and Cost Effective Systems Architecture on AWS
Eiji Shinohara
 
#AWSAdTechJP
Eiji Shinohara
 
Accelerating AdTech on AWS in Japan
Eiji Shinohara
 
AWS Summit New York 2017 Keynote Recap
Eiji Shinohara
 
#CTONight powered by AWS
Eiji Shinohara
 
SolrCloud on Amazon ECS
Eiji Shinohara
 
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
Eiji Shinohara
 
IVS CTO Night and Day Recap - #CTONight 2016 Winter
Eiji Shinohara
 
Tips for getting the most out of AWS re:Invent IN ENGLISH
Eiji Shinohara
 
検索技術の活用による広告配信Relevance向上
Eiji Shinohara
 
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
Eiji Shinohara
 
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
Eiji Shinohara
 
IVS CTO Night and Day Recap - #CTONight 2016 Spring
Eiji Shinohara
 
Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Eiji Shinohara
 
Search on AWS - IVS CTO Night and Day 2016 Spring
Eiji Shinohara
 
Getting Started Japanese Search and Calculate Similarity with Apache Lucene
Eiji Shinohara
 
[要約] Building a Real-Time Bidding Platform on AWS #AWSAdTechJP
Eiji Shinohara
 

Recently uploaded (11)

PDF
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
PDF
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
PPTX
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
PDF
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
PDF
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
PDF
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
PPTX
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
PDF
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
PDF
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
PDF
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
PDF
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 
第三世代 ウェザーステーションキット v3 ー WSC3-L 日本語カタログ
CRI Japan, Inc.
 
20250729_Devin-for-Enterprise
Masaki Yamakawa
 
2025_7_25_吉祥寺_設計ナイト_ADR運用におけるデータ利活用の考え方.pptx
ssuserfcafd1
 
VMUG Japan book vsan 20250515 CPU/Memory vSAN
Kazuhiro Sota
 
20250726_Devinで変えるエンプラシステム開発の未来
Masaki Yamakawa
 
LoRaWAN ウェザーステーションキット v3 -WSC3-L 日本語ユーザーマニュアル
CRI Japan, Inc.
 
baserCMS『カスタムコンテンツ』徹底活用術〜あなただけの管理画面を自由自在に〜
Ryuji Egashira
 
TaketoFujikawa_ComicComputing12th_inKumamoto
Matsushita Laboratory
 
20250730_QiitaBash_LT登壇資料_PDC_Kurashina.pdf
pdckurashina
 
MahiroYoshida_セリフに着目したキャラクタロール推定に関する基礎検討_sigcc12th2025
Matsushita Laboratory
 
【学会聴講報告】CVPR2025からみるVision最先端トレンド / CVPR2025 report
Sony - Neural Network Libraries
 

AWS Search Services

  • 1. AWS  Search  Services Eiji  Shinohara (2014年年にA9のCloudSearchチームが来⽇日した時の飲み会の様⼦子)
  • 2. ⾃自⼰己紹介 {        "Name"  :  "篠原英治",        "Twitter"  :  "@shinodogg",        "Profile"  :  {                                                "Role"  :  "Solutions  Architect",                                                "Market":  "Startup",                                                "Services"  :  [                                                                                          "Amazon  CloudSearch",                                                                                        "Amazon  Elasticsearch  Service",                                                                                        "Amazon  Simple  Workflow  Service”,                                                                                          "AWS  Elastic  Beanstalk”                                                                                    ]                                        } } New ☺
  • 3. AWSの検索索サービス •  Amazon  CloudSearch –  https://aws.amazon.com/jp/cloudsearch/   •  Amazon  Elasticsearch  Service –  https://aws.amazon.com/jp/elasticsearch-‐‑‒service/   Amazon  CloudSearch Amazon  Elasticsearch  Service
  • 4. A9.com •  CloudSearch/Amazon  ES  の開発拠点はパロアルト
  • 6. Amazon  CloudSearch •  ⾃自動拡張するフルマネージド検索索サービス –  2011  API •  A9が作ったプロプライエタリな検索索エンジン •  Amazon.comで使っているもの •  東京リージョンは対象外 –  2013  API •  on  top  of  Apache  Solr •  多⾔言語対応 –  ⽇日本語の形態素解析、n-‐‑‒gram、カスタム辞書にも対応 •  東京リージョンは2014年年3⽉月からサービス提供中
  • 7. Amazon  CloudSearch •  Auto  Scaling  /  Auto  Partitining Auto  Partitioning Auto  Scaling
  • 8. Amazon  CloudSearch •  Amazon  EMRを利利⽤用した⾃自動ノード分割 Index Index  P1 Index  P2Amazon   EMR
  • 9. Amazon  CloudSearch •  ⽇日本でも様々な公開事例例 –  schoo –  nanapi –  ChatWork –  サイタ –  SnapDish –  SmartInsight –  Lancers –  ごちクル –  SmartNews A9  x  SmartNews  in  Palo  Alto CloudSearch  Meetup  at  Amazon  Meguro  Office
  • 10. SourceFieldとDynamicField •  SourceField –  例例えば、形態素解析とBi-‐‑‒Gramの2つのフィールドを⽤用意 –  バッチファイルで全く同じものを⼆二つ⽤用意するのは無駄 –  よくあるのは、例例えば住所 Solrで⾔言うところのCopy  Fieldあります
  • 12. SourceFieldとDynamicField •  DynamicField –  bar_̲txt *_̲txt  指定の検索索は出来ません ⇒⼊入れた時に指定したフィールド名でのみ検索索
  • 13. •  形態素解析(Morphological  Analysis) –  辞書のカスタマイズできます Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
  • 14. •  形態素解析(Morphological  Analysis) –  辞書のカスタマイズできます:  AWS  CLI/SDKからも操作可能 {                      "AnalysisSchemeName":  "jascheme",        "AnalysisSchemeLanguage":  "ja",        "AnalysisOptions":  {                "JapaneseTokenizationDictionary":  "[                        [“きゃりーぱみゅぱみゅ”,“きゃりー  ぱみゅぱみゅ”,“キャリー  パミュパミュ","名 詞,固有名詞,⼈人名”] ]"          } } $  aws  cloudsearch  define-‐‑‒analysis-‐‑‒scheme  -‐‑‒-‐‑‒region  us-‐‑‒east-‐‑‒1  -‐‑‒-‐‑‒domain-‐‑‒name  mydomain   -‐‑‒-‐‑‒analysis-‐‑‒scheme  file://jascheme.txt Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
  • 15. •  シノニム・類義語(Synonym  Addition) –  例例えば  Venice •  ベニス •  ベネチア •  ヴェネチア •  ヴェネツィア –  Alias •  Pupilで検索索  =>  Studentもヒット •  Studentで検索索  =>  Pupilはヒットしない –  Group •  1st,  first,  one  =>  どれで検索索しても全てヒット –  上記全て、マネージメントコンソールもしくはCLI/SDKで操作可能 http://ja.wikipedia.org/wiki/ヴェネツィア   Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
  • 16. •  A/Bテスト –  マネージメントコンソール上で⽐比較 Amazon  CloudSearch  -‐‑‒  Japanese  Text  Processing
  • 17. Amazon  CloudSearch •  CloudSearchにいただいたご要望 –  リアルタイムにデータを取り込んで可視化したい •  CloudSearchは最⼤大で5MBのバッチファイルでの連携 •  細かいデータを⾼高頻度度でストアするのに強いストレージではない –  Amazon  CloudSearchの独⾃自APIを習得するのに時間がかかる •  Solrを使っているがSolrのAPIは利利⽤用できない •  完全マネージドでスケールと低レイテンシを同時に満たすには 様々なSolrの機能をオープンにすることはできない
  • 19. ELK  stack •  ELK  is  Elasticsearch,  Logstash,  and  Kibana Elasticsearch  is  a   distributed,  schema-‐‑‒ free  search  and   analytics  engine Logstash  is  a  tool  for   collecting  and   managing  events  and   logs. Kibana  is  a  browser-‐‑‒ based  analytics  and   search  dashboard  for   Elasticsearch.
  • 24. Amazon  Elasticsearch  Service •  Elasticsearchのマネージドサービス –  AWSクラウド上で  Elasticsearch  を簡単に構築可能 •  Elasticsearchの分散/スケーリング機能はクラウドと相性が良良い •  インスタンスタイプと台数を選択するだけでプロビジョニング –  デフォルトでKibanaがインストール •  Management  ConsoleにてURLをクリックするだけで直ぐ利利⽤用可能 –  使った分だけの従量量課⾦金金 •  ノードに利利⽤用するEC2の時間課⾦金金 •  EBSボリュームを使った場合はEBSの料料⾦金金 –  略略称はAmazon  ES
  • 27. •  Elasticsearchの利利点 –  クエリは⾮非常に⾼高速でアドホックな集計や分析に強い •  Apache  Luceneベース(Apache  SolrおよびCloudSearchと同様) –  リアルタイムにデータを取り込んで検索索可能な状態にできる •  Kibanaを活⽤用することでリアルタイムにデータを可視化 •  Amazon  Elasticsearch  Serviceの利利点 –  AWSのサービスと連携して⼀一気通貫な構成を簡単に構築できる     例例1)  CloudWatch  Logs→Lambda→Elasticsearch→Kibana     例例2)  DynamoDB  Streams→Logstash→Elasticsearch –  複数AZへの分散配置もチェックボックスにチェックを⼊入れるだけ •  Zone  Awareness機能 Amazon  Elasticsearch  Service
  • 28. •  Amazon  ESの注意点 –  CloudSearchのように⾃自動的にスケーリングはしない •  構成は後から変更更可能であるがダウンタイムはゼロではない –  プラグインを⾃自由にインストールすることはできない •  マネージドサービスである為、セキュリティや可⽤用性担保の必要性 •  Elasticの商⽤用プラグインに該当するような機能はIAMやCloudWatchで –  各種メトリクスを⾒見見ながらユーザー⾃自⾝身で対応する必要がある Amazon  Elasticsearch  Service
  • 29. •  Amazon  ESのCloudWatch  Metrics q  Cluster  status(Green/Yellow/Red) q  Node  count q  Searchable  documents q  Deleted  documents q  CPU  utilization q  Free  storage  space q  JVM  memory  pressure q  Automatic  snapshot  failures q  Master  CPU  utilization q  Master  free  storage  space q  Master  JVM  memory  pressure q  Read  IOPS q  Write  IOPS q  Read  latency q  Write  latency q  Read  throughput q  Write  throughput q  Disk  queue  depth Amazon  Elasticsearch  Service
  • 30. Amazon  Elasticsearch  Service •  IAM  Integration –  IPアドレスベースの制限 •  例例)  Kibanaへのアクセスは社内のIPアドレスレンジからのみ –  Signed  requests  with  SigV4 •  例例)  AWSのクレデンシャルを使ってセキュアにアクセス •  Logstashプラグイン:  https://github.com/awslabs/logstash-‐‑‒output-‐‑‒amazon_̲es   –  Fine-‐‑‒grainedアクセスコントロール •  例例)  ドメイン内のIndex毎にアクセス権限を分ける Logstash Amazon  ESData  Source
  • 31. Amazon  Elasticsearch  Service •  ⽇日本語解析 –  ICUとKuromojiプラグインはインストール済み •  analysis-‐‑‒icu(ノーマライズ) •  analysis-‐‑‒kuromoji(形態素解析) –  但し、ユーザー辞書の追加機能は現在(2015年年10⽉月)開発中 •  その他ご要望があれば随時ご連絡ください
  • 32. Amazon  Elasticsearch  Service •  Deployment node node EBS EBS node node node Master  Nodes Data  Nodes Cluster Node Shard  3 node EBS node EBS Shard  1 Shard  4 Shard  2
  • 33. Amazon  Elasticsearch  Service •  バックアップ&リストア –  AWSが⾃自動で取得するもの •  Daily:  1⽇日1回  Automated  snapshot  start  hourで指定 •  リストアはAWSサポートまで –  お客さまがご⾃自⾝身で取得するもの  w/  _̲snapshot  API •  Elasticsearchのフォーマットでお客さまのS3バケット •  任意のタイミングでいつでもリストア可能
  • 34. Amazon  Elasticsearch  Service •  今後の予定 –  2016年年にはかなり多くの機能追加を予定 –  但し、お客さまからのご要望によって優先度度は変わってきます 例例) •  Elasticsearch2.0は?Kibana4.2は?複数バージョンサポートして欲しい •  9300番ポートを使ったElasticsearchのバイナリなプロトコルを利利⽤用したい •  VPC内のエンドポイントが欲しい –  是⾮非AmazonESをご利利⽤用いただき、フィードバックいただければと 思います!