SlideShare une entreprise Scribd logo
UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE
LE SEO FACE A UNE INTELLIGENCE
ARTIFICIELLE
- 1 -
PETIT DEJEUNER SEO
SEARCH FORESIGHT
11EME ÉDITION
LILLE le 28 janvier 2016
9h-12h
/ Et l’IA est maintenant au cœur de son algorithme
2
Google se met SERIEUSEMENT à l’IA
/ Les programmes utilisant de l’IA ne sont pas
forcément… intelligents au sens commun
- 3 -
« Intelligence Artificielle » est un faux ami
Définition de l’IA :
Au sens large, le domaine de
l’intelligence artificielle regroupe toutes
les techniques essayant de simuler les
capacités du cerveau humain dans un
programme informatique
 Aujourd’hui, deux de ces capacités
ont engendré des applications
particulièrement prolifiques, au point
que souvent, les informaticiens
confondent « IA » et ces domaines
de l’informatique
• Capacité de perception : réseaux de
neurones, deep learning et toutes les
variantes
• Capacité d’apprentissage automatique
 Un programme basé sur de l’IA n’est
pas un programme qui
« comprend » au sens commun
- 4 -
Utiliser de l’IA dans un outil de recherche
est une vieille idée
 Un exemple spectaculaire et ancien : YANDEX
 Son architecture Matrixnet est basée sur de l’apprentissage
automatique
- 5 -
Matrixnet en action
- 6 -
Créer des filtres grâce à de
l’apprentissage automatique
 Classifieurs : spam, ou non spam !
 De gros progrès ont été obtenus au niveau performance :
SVM : support vector machines
 Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se
résume à un problème de géométrie mis en équations
- 7 -
Et pour la machine, le travail de
classification devient simple
/ la clé du mystère dans une interview de wired
- 8 -
Panda et l’apprentissage automatique
http://www.wired.com/2011/03/the-panda-that-hates-farms/all/
Wired.com: But how do you implement that algorithmically?
Cutts: I think you look for signals that recreate that same intuition, that same
experience that you have as an engineer and that users have. Whenever we look at
the most blocked sites, it did match our intuition and experience, but the key is, you
also have your experience of the sorts of sites that are going to be adding value for
users versus not adding value for users. And we actually came up with a classifier to
say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality
sites are over on this side. And you can really see mathematical reasons …
Singhal: You can imagine in a hyperspace a bunch of points, some points are red,
some points are green, and in others there’s some mixture. Your job is to find a plane
which says that most things on this side of the place are red, and most of the things on
that side of the plane are the opposite of red.
Since the search engineers could not compute a signal for “would you trust this site
with your credit card” they had to look for other statistical measurements that would
correspond highly with the answers provided in the Quality Raters Survey.
Cela ne vous rappelle rien ?
- 9 -
Intégrer du machine learning dans l’algo?
Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz
- 10 -
Plus fort :
les réseaux de neurones dans l’algo
 Les approches « classiques » ont atteint leurs limites
 L’approche prometteuse : le « deep learning »
/ 2012 : Google brain
- 11 -
Google maîtrise le deep learning
 Google brain est capable de reconnaître un chat dans l’image en bas à droite !
 2015 : Google Deepmind bat le champion d’Europe de Go
- 12 -
L’analyse des textes permet d’associer
des termes à des vecteurs
/ Grâce aux vecteurs obtenus, on obtient des termes
proches par opérations simples entre vecteurs
- 13 -
Et… tada !
/ en place depuis début 2015
- 14 -
Application chez google : Rankbrain
 En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer
le vecteur d’une combinaison de mots clé : un syntagme, une phrase
/ l’ingénieur derrière l’implémentation de Rankbrain
- 15 -
Greg corrado
/ Premier niveau : expansion de requêtes
- 16 -
Word2vec est utilisé 2 fois dans l’algo
Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui
elle est connue et offrira des résultats de meilleure qualité:
 Exploitation de l’historique des sessions de requêtes sur la requête connue
 Reconnaissance de l’intention derrière la requête connue
/ Deuxième niveau : calcul de similarité
- 17 -
Word2vec est utilisé 2 fois dans l’algo
La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton.
Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision
Les résultats sont améliorés par un score supplémentaire similaire dans son mode de
calcul au pagerank.
- 18 -
Encore une fois, adieu les mots clés
 Indexation des concepts
 Vecteurs Word2vec
Illustration : Brafton.com
- 19 -
Quelles conséquences pour le SEO ?
 Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en
combinant les approches
 Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à
date : l’algo classique reste dominant
 Mais : les cas où une page remonte en tête du classement sur une requête alors
qu’elle semble ne pas être optimisée pour cette requête augmentent en
fréquence
Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se
classer, une page doit être avant tout une bonne réponse à la requête de
l’internaute, et même, un résultat en phase avec l’intention cachée derrière la
requête de l’internaute.
- 20 -
Pour en savoir plus
 https://code.google.com/archive/p/word2vec/
 https://scholar.google.com/citations?user=oBu8kMMAAAAJ
 http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-
lucrative-web-search-over-to-ai-machines
 http://research.google.com/pubs/GregCorrado.html
Merci !
- 21 -

Contenu connexe

PPTX
Comment l’intelligence artificielle réinvente la fouille de texte
PPTX
Antidot Content Classifier - Valorisez vos contenus
PPTX
Comment l'intelligence artificielle améliore la recherche documentaire
PPTX
Du Big Data à la Smart Information : comment valoriser les actifs information...
PPTX
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
PPTX
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
PDF
Créer une IA capable de reconnaître des fleurs (ou autres)
PDF
Hadoop en 1461 leçons
Comment l’intelligence artificielle réinvente la fouille de texte
Antidot Content Classifier - Valorisez vos contenus
Comment l'intelligence artificielle améliore la recherche documentaire
Du Big Data à la Smart Information : comment valoriser les actifs information...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Créer une IA capable de reconnaître des fleurs (ou autres)
Hadoop en 1461 leçons

En vedette (20)

PDF
Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...
PDF
Exploiter les données d'outils avancés pour optimiser ses textes pour le SEO
PPTX
Cluster Analysis - Keyword Clustering
PPTX
Le Futur des Moteurs de Recherche
PDF
Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017
PDF
Evolutions et nouveaux outils SEO
PDF
Seo camp2017 Marguerite Leenhardt
PDF
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
PPTX
SEO et ecommerce sur Magento: retour d’expérience
PPTX
SEO : comment obtenir des liens puissants grâce à un contenu décalé
PPTX
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
PDF
Machine Learning & SEO - SEO Camp'Us Paris 2016
PPTX
La mise en cache et ses secrets
PDF
Designing Creative Content: How visualising data helps us see
PPTX
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
PDF
Analyse de logs - Études de cas et best practices - SEO Campus 2017
PDF
HTTPS The Road To A More Secure Web / SEOCamp Paris
PPTX
Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX
PPTX
Google AMP 1 an après : quel bilan, quelles perspectives ?
PPTX
Position 0 seocampus 2017 (Featured Snippets)
Les outils du Search pour connaître les utilisateurs - Jean-François Loup & R...
Exploiter les données d'outils avancés pour optimiser ses textes pour le SEO
Cluster Analysis - Keyword Clustering
Le Futur des Moteurs de Recherche
Google Rankbrain, l’IA du search - Sylvain Peyronnet - YOODx 2017
Evolutions et nouveaux outils SEO
Seo camp2017 Marguerite Leenhardt
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
SEO et ecommerce sur Magento: retour d’expérience
SEO : comment obtenir des liens puissants grâce à un contenu décalé
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Machine Learning & SEO - SEO Camp'Us Paris 2016
La mise en cache et ses secrets
Designing Creative Content: How visualising data helps us see
Cocon, metamots et plus si affinités sémantiques. Seo campus-03-2017
Analyse de logs - Études de cas et best practices - SEO Campus 2017
HTTPS The Road To A More Secure Web / SEOCamp Paris
Seo camp paris - A chaque enjeu, sa stratégie - Tips & REX
Google AMP 1 an après : quel bilan, quelles perspectives ?
Position 0 seocampus 2017 (Featured Snippets)
Publicité

Similaire à En 2016 : Faire du SEO face à une intelligence artificielle (20)

PPTX
IA DANS L'ALGORITHME DE GOOGLE.pptx
PPTX
IMPACT DE L'IA SUR LE SEO.pptx
PDF
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
PPTX
google leaks : quels enseignements en tirer pour le SEO
PPTX
Matin Népérien Bordeaux - Google Leaks - quels enseignements ?
PPTX
Quels enseignements tirer des Google Leaks ? Conférence Matin Népérien Rennes...
PPTX
ChatGPT et IA : impacts sur le processus d'évaluation des étudiants
PPTX
AP 4 | Je suis assisté professionnellement par l’IA au quotidien
PDF
Webinar - La vérité sur les IA génératives.pdf
PDF
L’IA au service de la Gestion de Projet Améliorer votre Prod et celle de vot...
PDF
Lbv Dev Meetup #3
PPTX
Programmation en technologie (C.Blin)
PPTX
Synergies entre DEV et SEO (SeoCampus 2019)
PPTX
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
PDF
ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?
PDF
Core web vitals - Webinar Neper du 3 décembre 2020
PDF
Accompagner le lecteur aux usages du numérique 3/3
PPTX
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
PDF
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
PDF
Décryptage des LLMs au-delà de la hype - Lyon Data science
IA DANS L'ALGORITHME DE GOOGLE.pptx
IMPACT DE L'IA SUR LE SEO.pptx
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021
google leaks : quels enseignements en tirer pour le SEO
Matin Népérien Bordeaux - Google Leaks - quels enseignements ?
Quels enseignements tirer des Google Leaks ? Conférence Matin Népérien Rennes...
ChatGPT et IA : impacts sur le processus d'évaluation des étudiants
AP 4 | Je suis assisté professionnellement par l’IA au quotidien
Webinar - La vérité sur les IA génératives.pdf
L’IA au service de la Gestion de Projet Améliorer votre Prod et celle de vot...
Lbv Dev Meetup #3
Programmation en technologie (C.Blin)
Synergies entre DEV et SEO (SeoCampus 2019)
Synergie entre développeur et consultant SEO - Didier Sampaolo - SEOcamp'us P...
ALL4CUSTOMER: Comment adapter sa stratégie SEO à l'heure des IA génératives ?
Core web vitals - Webinar Neper du 3 décembre 2020
Accompagner le lecteur aux usages du numérique 3/3
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Décryptage des LLMs au-delà de la hype - Lyon Data science
Publicité

Plus de Peak Ace (20)

PPTX
SEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptx
PPTX
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
PDF
Guide shopify & seo: fausse bonne idée?
PDF
Petit dejeuner sf 180419 actualite seo sea
PDF
Event sf 180419 changement de marque et de domaine
PDF
Event sf 180419 gerer les contenus pagines
PDF
Event sf 180419 les bonnes pratiques en netlinking
PDF
Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...
PDF
Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...
PDF
Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...
PDF
Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...
PDF
Actualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 Paris
PDF
Comment optimiser votre site pour être visible sur les requêtes saisonnières ...
PDF
Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...
PDF
« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris
PDF
Comment exploiter et atteindre la position 0 ou featured snippets de Google ...
PDF
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
PDF
La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes
PDF
Comment tirer le meilleur parti possible du content marketing - petit déjeune...
PDF
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes
SEO CAMP'us Paris 2022 - CADOR EN SEO - Mathieu Chapon (1).pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
Guide shopify & seo: fausse bonne idée?
Petit dejeuner sf 180419 actualite seo sea
Event sf 180419 changement de marque et de domaine
Event sf 180419 gerer les contenus pagines
Event sf 180419 les bonnes pratiques en netlinking
Amazon : au cœur de votre stratégie SEO 2019 - Philippe Yonnet - Petit déjeun...
Contenu et SEO : quelles tendances pour 2019 ? - Julien Callaou - petit déjeu...
Comment privilégier l’expérience utilisateur (UX) au cœur de votre stratégie ...
Comment structurer ses campagnes adwords pour tirer le meilleur parti de l’au...
Actualités SEO SEA - Tiphaine Coupeau - Petit déjeuner 26-02-2019 Paris
Comment optimiser votre site pour être visible sur les requêtes saisonnières ...
Le futur du SEO : l’optimisation pour les moteurs de réponse (AEO) - petit dé...
« Le temps de chargement n’existe pas ! » - petit déjeuner 13 décembre paris
Comment exploiter et atteindre la position 0 ou featured snippets de Google ...
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
La nouvelle Google Search Console - petit déjeuner 15-11-2018 Nantes
Comment tirer le meilleur parti possible du content marketing - petit déjeune...
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes

En 2016 : Faire du SEO face à une intelligence artificielle

  • 1. UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE LE SEO FACE A UNE INTELLIGENCE ARTIFICIELLE - 1 - PETIT DEJEUNER SEO SEARCH FORESIGHT 11EME ÉDITION LILLE le 28 janvier 2016 9h-12h
  • 2. / Et l’IA est maintenant au cœur de son algorithme 2 Google se met SERIEUSEMENT à l’IA
  • 3. / Les programmes utilisant de l’IA ne sont pas forcément… intelligents au sens commun - 3 - « Intelligence Artificielle » est un faux ami Définition de l’IA : Au sens large, le domaine de l’intelligence artificielle regroupe toutes les techniques essayant de simuler les capacités du cerveau humain dans un programme informatique  Aujourd’hui, deux de ces capacités ont engendré des applications particulièrement prolifiques, au point que souvent, les informaticiens confondent « IA » et ces domaines de l’informatique • Capacité de perception : réseaux de neurones, deep learning et toutes les variantes • Capacité d’apprentissage automatique  Un programme basé sur de l’IA n’est pas un programme qui « comprend » au sens commun
  • 4. - 4 - Utiliser de l’IA dans un outil de recherche est une vieille idée  Un exemple spectaculaire et ancien : YANDEX  Son architecture Matrixnet est basée sur de l’apprentissage automatique
  • 5. - 5 - Matrixnet en action
  • 6. - 6 - Créer des filtres grâce à de l’apprentissage automatique  Classifieurs : spam, ou non spam !  De gros progrès ont été obtenus au niveau performance : SVM : support vector machines  Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se résume à un problème de géométrie mis en équations
  • 7. - 7 - Et pour la machine, le travail de classification devient simple
  • 8. / la clé du mystère dans une interview de wired - 8 - Panda et l’apprentissage automatique http://www.wired.com/2011/03/the-panda-that-hates-farms/all/ Wired.com: But how do you implement that algorithmically? Cutts: I think you look for signals that recreate that same intuition, that same experience that you have as an engineer and that users have. Whenever we look at the most blocked sites, it did match our intuition and experience, but the key is, you also have your experience of the sorts of sites that are going to be adding value for users versus not adding value for users. And we actually came up with a classifier to say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality sites are over on this side. And you can really see mathematical reasons … Singhal: You can imagine in a hyperspace a bunch of points, some points are red, some points are green, and in others there’s some mixture. Your job is to find a plane which says that most things on this side of the place are red, and most of the things on that side of the plane are the opposite of red. Since the search engineers could not compute a signal for “would you trust this site with your credit card” they had to look for other statistical measurements that would correspond highly with the answers provided in the Quality Raters Survey. Cela ne vous rappelle rien ?
  • 9. - 9 - Intégrer du machine learning dans l’algo? Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz
  • 10. - 10 - Plus fort : les réseaux de neurones dans l’algo  Les approches « classiques » ont atteint leurs limites  L’approche prometteuse : le « deep learning »
  • 11. / 2012 : Google brain - 11 - Google maîtrise le deep learning  Google brain est capable de reconnaître un chat dans l’image en bas à droite !  2015 : Google Deepmind bat le champion d’Europe de Go
  • 12. - 12 - L’analyse des textes permet d’associer des termes à des vecteurs
  • 13. / Grâce aux vecteurs obtenus, on obtient des termes proches par opérations simples entre vecteurs - 13 - Et… tada !
  • 14. / en place depuis début 2015 - 14 - Application chez google : Rankbrain  En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer le vecteur d’une combinaison de mots clé : un syntagme, une phrase
  • 15. / l’ingénieur derrière l’implémentation de Rankbrain - 15 - Greg corrado
  • 16. / Premier niveau : expansion de requêtes - 16 - Word2vec est utilisé 2 fois dans l’algo Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui elle est connue et offrira des résultats de meilleure qualité:  Exploitation de l’historique des sessions de requêtes sur la requête connue  Reconnaissance de l’intention derrière la requête connue
  • 17. / Deuxième niveau : calcul de similarité - 17 - Word2vec est utilisé 2 fois dans l’algo La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton. Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision Les résultats sont améliorés par un score supplémentaire similaire dans son mode de calcul au pagerank.
  • 18. - 18 - Encore une fois, adieu les mots clés  Indexation des concepts  Vecteurs Word2vec Illustration : Brafton.com
  • 19. - 19 - Quelles conséquences pour le SEO ?  Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en combinant les approches  Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à date : l’algo classique reste dominant  Mais : les cas où une page remonte en tête du classement sur une requête alors qu’elle semble ne pas être optimisée pour cette requête augmentent en fréquence Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se classer, une page doit être avant tout une bonne réponse à la requête de l’internaute, et même, un résultat en phase avec l’intention cachée derrière la requête de l’internaute.
  • 20. - 20 - Pour en savoir plus  https://code.google.com/archive/p/word2vec/  https://scholar.google.com/citations?user=oBu8kMMAAAAJ  http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its- lucrative-web-search-over-to-ai-machines  http://research.google.com/pubs/GregCorrado.html