SlideShare a Scribd company logo
Цвет настроения
серый
Всем привет :)
➔ SEO-team lead ЛУН & Flatfy
➔ Куратор курса Product SEO
➔ SEO-консультант
Это я
Сайт #1 по недвижимости
в Украине
Международный бренд ЛУН
Запущено 37 стран
> 5 млн. > 4 млн.
пользователей в месяц пользователей в месяц
Что такое Google?
Section
1
Google - тоже продукт
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
Типы апдейтов
Статистическая
значимость
В статистике величина(значение) переменной
называют статистически значимой, если мала
вероятность случайного возникновения этой или ещё
более крайних величин.
“Сезонность” апдейтов
Выводы:
● Все новые алгоритмы достаточно легко угадываются -
работаем на опыте
● Почему Google работает? Зарабатывает деньги.
● Сайты в ТОПе помогают заработать Google.
● Век удержания внимания и времени.
● Лучшие пользователи - которые проводят время.
Постоянно пользуются сервисом.
● Задал запрос - получил ответ.
“Вспомним все”
Section
2
Операторы:
● cache:
● intext:
● inposttitle:
● intitle:
● inurl:
● inanchor:
● filetype:
● around()
● or / and
● “ ”
● -  +
● site:  related:  info:
bit.ly/2IH5v0R - Power Searching
or
bit.ly/2KmWr74 - Courses list
Автоматизация
Section
3
SEO Цитатник :)
Масштабирование :)
SEO Цитатник :)
“Техническое доминирование”
Technical skills + Networking
bit.ly/semrush-experts-advices
John Mueller, Google Spokesman
You're going to run into significantly more JavaScript over
the next years than in the 2'ish decades in SEO before. If
you're keen on technical SEO, then past HTML you're
going to need to understand JS more and more.
Reddit: bit.ly/2AdU1B8
Что нужно знать SEOшнику?
1) HTML  CSS (CodeAcademy)
2) JS (learn.javascript.ru)
3) regex (regexr.com)  Bash Shell
4) HTTP (TutorialsPoint, Mozilla)
5) Python*
6) SQL
7) App Script*
8) git
bit.ly/2yl7q94 - выступление DVOMA
Тоже вариант
Примеры:
● Сбор семантики
● Разбор семантики (фильтрация 
кластеризация)
● Создание посадочных страниц
● Мониторинг (seo  доступность  изменения)
● Генерация текстов
● Автоматизация рутины
● Оценка доноров
● Ссылочное  аутрич
bit.ly/2PM17Wc - выступление WebPromo SEOday
Автоматизация:
ссылочноеSection
3.1
Машинное обучение
Класс методов искусственного интеллекта,
характерной чертой которых является не прямое
решение задачи, а обучение в процессе
применения решений множества сходных задач.
Примеры (способы):
● Обучение с учителем
(для каждого прецедента - «ситуация, требуемое решение»)
● Обучение без учителя
(для каждого прецедента задаётся только «ситуация»,
требуется сгруппировать объекты в кластеры, используя
данные о попарном сходстве объектов, и/или понизить
размерность данных)
● Обучение с подкреплением
(для каждого прецедента имеется пара «ситуация, принятое
решение»)
● ...
“Обучение на примерах”
Вид обучения, при котором интеллектуальной
системе предъявляется набор положительных и
отрицательных примеров, связанных с какой-
либо заранее неизвестной закономерностью.
Оценка доноров. Задача оптимизации
fdonor_quality
(a,b)=a1
fparam_1
(a,b)+a2
fparam_2
(a,b)+a3
fparam_3
(a,b)+...+an
1. Определение параметров для оценки
2. Апроксимация
3. Нормировка
4. Поиск коэффициентов
Полином
fdonor_quality
(a,b)=a1
fparam_1
(a,b)+a2
fparam_2
(a,b)+a3
fparam_3
(a,b)+...
+an
Апроксимация (линия тренда excel)
Нормирование
● Натуральный логарифм
● Оценка от 1 до 10
● Z-Score = ((измеренная величина) - (среднее
арифметическое))/среднеквадратическое
отклонение
Нахождение коэффициентов
Поиск решения
SOLVER.XLAM
Поиск решения
Поиск решения нелинейных задачи методом ОПГ
Оценка
Сайт серфер для оценок доноров
учителем
База сайтов
Оценка
доноров
Вывод
формулы
Авто оценка
Как разобраться?
https://ru.coursera.org/learn/machine-learning
https://developers.google.com/
machine-learning/crash-course/
Нейронные сети
Математическая модель, а также её
программное воплощение, построенная по
принципу организации и функционирования
биологических нейронных сетей —
последовательности нейронов, соединенных
между собой синапсами.
Нейронные сети
(по простому)
Нейрон – некая воображаемая чёрная коробка, у которой несколько
входных отверстий и одно выходное.
Как выходной сигнал формируется из кучи входных – определяет
внутренний алгоритм нейрона
Примеры (решения задач)
● Распознавание образов и классификация
● Принятие решений и управление
● Кластеризация
● Прогнозирование
● Аппроксимация
● Сжатие данных и Ассоциативная память
● Анализ данных
● Оптимизация
Платформа для соревнований по аналитике и
предсказательного моделирования.
Ирисы Фишера
● 3 вида ирисов
● Данные о 150 экземплярах ириса
● 50 экземпляров из трёх видов
● Требуется определить вид по измерениям
Ирисы Фишера в SEO
● Длина наружной доли околоцветника == Ahrefs DR
● Ширина наружной д.о. == SimilarWeb Traffic
● Длина внутренней д.о. == Trust Rank
● Ширина внутренней д.о. == SimilarWEb Organic Traffic
Как делать? ;)
Породы собак
https://www.kaggle.com/c/dog-breed-identification
Породы собак в SEO
● Колли == Партнёрские сайты
● Скотч-терьер == Конкуренты
● Комондор == Форумы
● Сенбернар == СМИ ресурсы
Как сделать?
● Собрать датасет
● Обучить нейронку
● Использовать
Собрать датасет?
● Установить Node.js (программная
платформа, превращающая JavaScript из
узкоспециализированного языка в язык
общего назначения)
● Через npm установить pageres (npm —
менеджер пакетов в Node)
● Написать .sh (или более сложное) с
командами
“pageres domain.com 1280x800 --format=jpg”
bit.ly/2SQ6odN
Обучить нейронку?
● Установить TensorFlow (открытая программная
библиотека для машинного обучения)
● Переобучить нейронку
● Протестировать
● Использовать
bit.ly/2RCnwST
Понимание разработки
Minimum:
https://codelabs.developers.google.com/
Результат
Автоматизация:
СЯ + текстыSection
3.2
Датасет (набор данных)
Использование данных
Использование данных
Доп. данные
http://wikimapia.org/api/
Известный метод
● Парсим Google
● Сохраняем Description
● Уникализируем
● Собираемсоздаем генеренные тексты
Проблема
ПАРСИМ GOOGLE
Решение
ГЕНЕРИМ Description САМИ
Ссылочный
Граф
Граф — абстрактный
математический объект,
представляющий собой
множество вершин
графа и набор рёбер, то
есть соединений между
парами вершин.
Google PageRank
PageRank (PR) — это вероятность перехода пользователя на
страницу, которая рассчитывается из анализа ссылочного
графа. Чем выше вероятность перехода на страницу, тем
выше авторитет данной страницы.
TextRank
● Пускай предложения - аналоги веб страниц
● Вероятность перехода от предложения A до B
эквивалентна схожести предложений
● Применим PageRank на граф предложений
Summary
Извлечение Обобщение
TextRank алгоритм
● Разбиваем текст на предложения (токенизатор)
● Поделим на слова
● Очистим от пробелов, знаков препинания…
● Обработаем стеммером (убираем окончания и префиксы)
● Уберем дубли слов из предложений
● Получим предложения в виде списков слов
● Для каждой пары предложений посчитаем похожесть
● Похожесть = одинаковые слова в предлож. / суммарная длина пр.
● Граф = вершины (номера предложений в тексте), ребра (схожесть)
● Считаем PageRank
● Берем по рейтингу
TextRank скачать
бесплатно, без
регистраций, без
смс
https://github.com/summanlp/textrank
Что умеет TextRank?
● Text summarization
● Keyword extraction
Особенности TextRank
● Зависит от языка
● Обучение без учителя
● Не “создает” контент
Логи
Section
4
-лось :)
НаДоске :)
bit.ly/2DrqAhG
Логи
Файл с записями о запросах (hit`ах), которые получил
сервер
Пример
192.168.1.11 - [03/Sep/2018:00:00:00 -0400] - "GET
/calendar/next HTTP/1.1" 200 - "Mozilla/5.0 (compatible;
Googlebot/2.1; +http://www.google.com/bot.html)"
Вопросы
1. Эффективно ли расходуется краулинговый бюджет?
2. Где идет утечка краулингового бюджета? (дубли, параметры и т.п.)
3. Были ли ошибки во время краулинга?
4. Какие есть области с недостатком краулинга?
5. Дата последнего краулинга?
Важно
Сколько прокрауленых страниц “non-compliant“?
(не подлежат попаданию в поиск)
Важно
1. Определить частоту сканирования страниц
2. Какие страницы не обходились ни разу за месяц?
3. Когда страницы прокраулены впервые после создания?
4. За какое время сканируются все страницы?
5. Какой тип файлов? %
6. Редиректы цепочки, ошибочные редиректы + кол-во
7. Количество заходов на не канонические страницы
8. Заходы на закрытые страницы в meta robots
9. Дублированный контент? (например, по тайтлам)
10. Сканирование нового контента
11. Миграция на HTTPS и работа с AMP
Kibana
SC
Сканирование закрытых
страниц
Пример dashboard
Приколюхи
Section
5
Определение географии
https://cloud.google.com/natural-language/
Определение ключевых фраз
bit.ly/2qAMRRz
Сохранение страниц в drive
https://github.com/hijonathan/google-scripts/blob/master/backup-url.j
s
● Бэкап HTML версий страничек
● Бэкап по датам
● Каждый день неделю  час
● Смотрим изменения у себя на сайте
● Смотрим изменения на других сайтах
● Скачиваем Google Support
Новое, а не лучше
Спасибо
за внимание!
Владислав Моргун
SEO Team-lead ЛУН & Flatfy
facebook.com/vladislav.morgun.3
t.me/m0r9un
vlad.morgun@lun.ua
instagram.com/m0r9un
О нас: team.lun.ua

More Related Content

PDF
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
PDF
Автоматизация SEO-процессов в продуктовых компаниях - DVOMA.pro 30.08
PDF
18.10.19 - WebPromo SEO day - Фазовый переход между стратами
PDF
Владислав Моргун
PDF
26.03.19 Collaborator.pro Webinar Эффективные паттерны выбора доноров
PDF
19.10 - WebPromo SEO Day - "SEO-автоматизатор: кто он?" - Владислав Моргун
PPT
Продвижение порталов и инфосайтов. Дмитрий Шахов
PDF
Никулин Павел. Machine learning для текстового анализа
15.03.19 WebPromo SEOday SEO-инсайты из логов: от WP блога до международного ...
Автоматизация SEO-процессов в продуктовых компаниях - DVOMA.pro 30.08
18.10.19 - WebPromo SEO day - Фазовый переход между стратами
Владислав Моргун
26.03.19 Collaborator.pro Webinar Эффективные паттерны выбора доноров
19.10 - WebPromo SEO Day - "SEO-автоматизатор: кто он?" - Владислав Моргун
Продвижение порталов и инфосайтов. Дмитрий Шахов
Никулин Павел. Machine learning для текстового анализа

What's hot (19)

PPTX
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
PPTX
Дмитрий Шахов. Эксперименты на тему распространённых методов в SEO
PDF
19.06.19 - MAD SEO Conf v.2.0 by Govitall - SEO-адаптация продуктов для выход...
PPTX
Q/A по PBN и западное SEO
PPT
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
PPTX
Дмитрий Мазурян. Пять методик нестандартного анализа и поиска новых ниш
PPTX
Артефакты эффективных SEOшников
PPTX
Текстовые факторы при создании сеток сайтов
PPT
Важность аналитики в SEO - доклад на 8p
PPTX
Как с помощью правильных PBN, получать ТОП 1 в самых высоко конкурентных ниша...
PPTX
Текстовый анализ - теория и практика
PDF
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
PDF
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
PPTX
Гайд по текстовому антиспаму
PPTX
Footprint Factory - Nazapad 4
PPTX
Data Driven SEO на западных рынках - Виктор Карпенко
PPTX
Необычные инструменты эффективных интернет-маркетологов
PPT
Tagconf 13 - SphinxSearch - 2
PDF
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Шахов. Эксперименты на тему распространённых методов в SEO
19.06.19 - MAD SEO Conf v.2.0 by Govitall - SEO-адаптация продуктов для выход...
Q/A по PBN и западное SEO
Рутинные операции в SEO, о которых забывают и спрашивают снова и снова
Дмитрий Мазурян. Пять методик нестандартного анализа и поиска новых ниш
Артефакты эффективных SEOшников
Текстовые факторы при создании сеток сайтов
Важность аналитики в SEO - доклад на 8p
Как с помощью правильных PBN, получать ТОП 1 в самых высоко конкурентных ниша...
Текстовый анализ - теория и практика
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Гайд по текстовому антиспаму
Footprint Factory - Nazapad 4
Data Driven SEO на западных рынках - Виктор Карпенко
Необычные инструменты эффективных интернет-маркетологов
Tagconf 13 - SphinxSearch - 2
Кутас Иван. Практика оптимизации сайтов на незнакомых языках bdd2017
Ad

Similar to 08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый (20)

PDF
20120226 information retrieval raskovalov_lecture03-04
PDF
20111002 information retrieval raskovalov_lecture3
PDF
20111001 information retrieval raskovalov_lecture2
PDF
Инструкция для SEO-специалиста: как расти, зарабатывать больше и не лажать
PDF
Практика оптимизации сайтов на незнакомых языках
PPTX
Виды QA: Всё что вы не знали и боялись спростить
PPTX
Владимир Лучанинов. Сделай сам анализатор SERP
PDF
Google Update Crash Test или как быстро вернуть доход сайту
ODP
Intelligent или сделай мне красиво
PPTX
Как работают поисковые системы
PDF
Максим Богуславский, Banki.ru, «Как вырастить в себе автоматизатора и разрабо...
PDF
Mail.ru: Как вырастить в себе автоматизатора и разработчика
PDF
SEO по-белому для больших сайтов
PDF
Serghei Iakovlev "Chaos engineering in action"
PPTX
Python Meetup
PPTX
Виталий Кравченко. Эксперименты в SEO: как извлечь пользу и не потратить врем...
PDF
School IT recruiting
PPTX
Developmentmanage1.0
PDF
BigData и Data Science: методы и инструменты
PPTX
Ранжирование: от строчки кода до Матрикснета
20120226 information retrieval raskovalov_lecture03-04
20111002 information retrieval raskovalov_lecture3
20111001 information retrieval raskovalov_lecture2
Инструкция для SEO-специалиста: как расти, зарабатывать больше и не лажать
Практика оптимизации сайтов на незнакомых языках
Виды QA: Всё что вы не знали и боялись спростить
Владимир Лучанинов. Сделай сам анализатор SERP
Google Update Crash Test или как быстро вернуть доход сайту
Intelligent или сделай мне красиво
Как работают поисковые системы
Максим Богуславский, Banki.ru, «Как вырастить в себе автоматизатора и разрабо...
Mail.ru: Как вырастить в себе автоматизатора и разработчика
SEO по-белому для больших сайтов
Serghei Iakovlev "Chaos engineering in action"
Python Meetup
Виталий Кравченко. Эксперименты в SEO: как извлечь пользу и не потратить врем...
School IT recruiting
Developmentmanage1.0
BigData и Data Science: методы и инструменты
Ранжирование: от строчки кода до Матрикснета
Ad

More from Vladislav Morgun (11)

PDF
02.03.21 Collaborator.pro Webinar Решение 10 главных задач технической оптими...
PDF
13.03.2020 - NaZapad - SEO-Шива: продвижение 1 продукта на 30 стран
PDF
21.02.2020 - WebPromo SEO Day - О чем мы постоянно забываем при работе с сема...
PDF
30.08.19 - DVOMA.pro - Фреймворки для выбора и анализа новых ниш
PDF
14.06.19 GuruConf 2019 - Human-centered Link building
PDF
SEO Battle #2: 26.01 SEOclub & EVO
PDF
SEO-data для маркетинг инсайтов - Владислав Моргун 16.06 PRJCTR.com.ua
PDF
SEMPRO 2018 - Олег Искевич и Владислав Моргун - Тех-оптимизация и внутренние ...
PPTX
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
PDF
WebPromo Experts Day - Олег Искевич и Владислав Моргун - Продвижение в высоко...
PDF
NaZapad 6 - Владислав Моргун - Семантическое ядро для 24 языков и 36 стран
02.03.21 Collaborator.pro Webinar Решение 10 главных задач технической оптими...
13.03.2020 - NaZapad - SEO-Шива: продвижение 1 продукта на 30 стран
21.02.2020 - WebPromo SEO Day - О чем мы постоянно забываем при работе с сема...
30.08.19 - DVOMA.pro - Фреймворки для выбора и анализа новых ниш
14.06.19 GuruConf 2019 - Human-centered Link building
SEO Battle #2: 26.01 SEOclub & EVO
SEO-data для маркетинг инсайтов - Владислав Моргун 16.06 PRJCTR.com.ua
SEMPRO 2018 - Олег Искевич и Владислав Моргун - Тех-оптимизация и внутренние ...
SEO-аналитика: находим, анализируем, используем, усовершенствуем - 07.11.17 -...
WebPromo Experts Day - Олег Искевич и Владислав Моргун - Продвижение в высоко...
NaZapad 6 - Владислав Моргун - Семантическое ядро для 24 языков и 36 стран

08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый