SlideShare uma empresa Scribd logo
Primeiros passos Machine Learning
no PostgreSQL
Dickson S. Guedes
twitter: guediz / github: guedes
Primeiros passos machine learning PostgreSQL
Apresentação Pessoal
• as pessoas me chamam de Guedes
• costumo usar
• PostgreSQL, Elasticsearch
• Python, Rust, Elixir, Ruby, R
• Emacs, Jupyter
• Ansible, Docker, Zabbix, Grafana, Logstash
• meetups
• Python Floripa, Devops, DBFloripa
• eventos
• FISL, PGBR, DBA Brasil 1.0, TDC
O que você vai ver hoje?
• introdução Machine Learning (ML)
• banco de dados PostgreSQL (BD ou Postgres)
• Python
• SQL’s
• notebooks
• um careca falando...
Machine Learning em um slide
• qual é a pergunta?
• o que eu quero descobrir?
• quero prever um valor? é regressão
• quero agrupar elementos com características comuns? é cluster
• quero classificar algo baseado em características? é classificação
• vou trabalhar com imagens? deep learning!
• posso usar os dados que eu tenho para o propósito que quero?
Machine Learning é burro
Oi?!
ML pode não diferenciar um cachorro de um biscoito
ML pode não diferenciar um cachorro de um esfregão
ML pode ser
trollado pelo
Saruman
Machine Learning em outro slide
• obtenha os dados com a melhor qualidade possível
• prepare e entenda os dados
• qual a pergunta? ela pode ser respondida pelos dados?
• escolha o algoritmo
• divida os dados em treino, teste e validação
• treine
• teste
• valide
• descubra (?) a resposta
O que virá pela frente?
• Linguagens como Python ou R
• Bibliotecas de Machine learning, como Sklearn, Tensorflow, Keras,
MADlib (nosso exemplo do dia)
• Necessidade de muito potencial de processamento
• Necessidade de muita memória
ML + BD
• você está mais próximo dos dados
• transferência apenas dos resultados entre o banco e cliente
• o banco gerencia bem memória quando os dados não cabem
• os modelos ficam disponíveis para todos que acessam o banco
• devem existir outros motivos...
Show me the code
• PostgreSQL 10
• Python 2.7
• MADlib 1.14
• Jupyter Notebook 4.4
• O código apresentado está disponível no Github:
• https://github.com/guedes/notebooks-exemplo/blob/master/Exemplo%20regressao%20linear%20c
om%20MADLib%20e%20PostgreSQL.ipynb
Comece a ler sobre...
• GPU
• TPU
• Cloud
E veja o que estão falando sobre...
• Computação quântica
• Blockchain + Machine learning
Referências
• PostgreSQL: o banco de dados que utilizamos
• https://www.postgresql.org/
• MADlib: a biblioteca que usamos para machine learning no PostgreSQL:
• http://madlib.apache.org
• um mapa dos algoritmos e quando utilizá-los:
• http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
• Jupyter Notebook
• http://jupyter.org/
• Scikit Learn: para aprender sobre algoritmos e
• http://scikit-learn.org
• para aprender mais:
• https://br.udacity.com/
• https://www.coursera.org/
Agradecimentos
• aos que se mantiveram atentos
• aos que não se mantiveram atentos mas estão aí firme e forte
• aos que não puderam ficar até agora e tiveram que sair
• às comunidades PostgreSQL, Python, DBA Brasil
• a Apache Software Foundation pela MADlib
Primeiros passos machine learning PostgreSQL
Anúncio

Recomendados

Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com Python
Roselma Mendes
 
Python e suas aplicações
Python e suas aplicações
Izabela Guerreiro
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciência
Sidney Roberto
 
Crawleando a web feito gente grande com o scrapy
Crawleando a web feito gente grande com o scrapy
Bernardo Fontes
 
O que podemos fazer com Python?
O que podemos fazer com Python?
Izabela Guerreiro
 
Novas Fronteiras
Novas Fronteiras
Rangel Torrezan
 
Capturando a web com Scrapy
Capturando a web com Scrapy
Gabriel Freitas
 
Curso JavaScript - Aula sobre DOM e Ajax
Curso JavaScript - Aula sobre DOM e Ajax
Tiago Antônio da Silva
 
Apresentção sobre machine learning, IA, inteligencia artificial
Apresentção sobre machine learning, IA, inteligencia artificial
ElberOliveira6
 
Machine learning
Machine learning
João Paulo Marinho Martins
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
Deep Tech Brasil
 
Introdução à aprendizado de máquina - ESX 2016
Introdução à aprendizado de máquina - ESX 2016
Charles Mendes de Macedo
 
First Big Data Week
First Big Data Week
Hélio Silva
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
Mauro Risonho de Paula Assumpcao
 
Machine Learning: introdução e aplicações
Machine Learning: introdução e aplicações
Luana da Silva
 
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Alex Camargo
 
Introdução ao Machine Learning para Hackers
Introdução ao Machine Learning para Hackers
Gabriel Cypriano Saca
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
Carlos Augusto Oeiras
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Tchelinux
 
Oficina PostgreSQL Básico Latinoware 2012
Oficina PostgreSQL Básico Latinoware 2012
Fabrízio Mello
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
tdc-globalcode
 
Data Science, Machine Learning and Big Data
Data Science, Machine Learning and Big Data
Fabrício Barth
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
Luca Bastos
 
Estatística VS. Machine Learning
Estatística VS. Machine Learning
Santa Catarina Federal University
 
Deep Learning do Zero ao Impossível: Qual o caminho?
Deep Learning do Zero ao Impossível: Qual o caminho?
Sandro Moreira
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
Ambiente Livre
 
Analise de Dados com Azure Machine Learning, R e Power BI
Analise de Dados com Azure Machine Learning, R e Power BI
Orlando Mariano
 
Big Query - Escalabilidade Infinita para os seus Dados
Big Query - Escalabilidade Infinita para os seus Dados
Alvaro Viebrantz
 
Ganhando tempo automatizando com SQL
Ganhando tempo automatizando com SQL
Dickson S. Guedes
 
O mínimo necessário que você precisa conhecer sobre computação quântica
O mínimo necessário que você precisa conhecer sobre computação quântica
Dickson S. Guedes
 

Mais conteúdo relacionado

Semelhante a Primeiros passos machine learning PostgreSQL (20)

Apresentção sobre machine learning, IA, inteligencia artificial
Apresentção sobre machine learning, IA, inteligencia artificial
ElberOliveira6
 
Machine learning
Machine learning
João Paulo Marinho Martins
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
Deep Tech Brasil
 
Introdução à aprendizado de máquina - ESX 2016
Introdução à aprendizado de máquina - ESX 2016
Charles Mendes de Macedo
 
First Big Data Week
First Big Data Week
Hélio Silva
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
Mauro Risonho de Paula Assumpcao
 
Machine Learning: introdução e aplicações
Machine Learning: introdução e aplicações
Luana da Silva
 
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Alex Camargo
 
Introdução ao Machine Learning para Hackers
Introdução ao Machine Learning para Hackers
Gabriel Cypriano Saca
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
Carlos Augusto Oeiras
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Tchelinux
 
Oficina PostgreSQL Básico Latinoware 2012
Oficina PostgreSQL Básico Latinoware 2012
Fabrízio Mello
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
tdc-globalcode
 
Data Science, Machine Learning and Big Data
Data Science, Machine Learning and Big Data
Fabrício Barth
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
Luca Bastos
 
Estatística VS. Machine Learning
Estatística VS. Machine Learning
Santa Catarina Federal University
 
Deep Learning do Zero ao Impossível: Qual o caminho?
Deep Learning do Zero ao Impossível: Qual o caminho?
Sandro Moreira
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
Ambiente Livre
 
Analise de Dados com Azure Machine Learning, R e Power BI
Analise de Dados com Azure Machine Learning, R e Power BI
Orlando Mariano
 
Big Query - Escalabilidade Infinita para os seus Dados
Big Query - Escalabilidade Infinita para os seus Dados
Alvaro Viebrantz
 
Apresentção sobre machine learning, IA, inteligencia artificial
Apresentção sobre machine learning, IA, inteligencia artificial
ElberOliveira6
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
Deep Tech Brasil
 
Introdução à aprendizado de máquina - ESX 2016
Introdução à aprendizado de máquina - ESX 2016
Charles Mendes de Macedo
 
First Big Data Week
First Big Data Week
Hélio Silva
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
Mauro Risonho de Paula Assumpcao
 
Machine Learning: introdução e aplicações
Machine Learning: introdução e aplicações
Luana da Silva
 
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Inteligência artificial - Uma introdução ao Deep Learning com Linux
Alex Camargo
 
Introdução ao Machine Learning para Hackers
Introdução ao Machine Learning para Hackers
Gabriel Cypriano Saca
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
Carlos Augusto Oeiras
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Tchelinux
 
Oficina PostgreSQL Básico Latinoware 2012
Oficina PostgreSQL Básico Latinoware 2012
Fabrízio Mello
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
tdc-globalcode
 
Data Science, Machine Learning and Big Data
Data Science, Machine Learning and Big Data
Fabrício Barth
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
Luca Bastos
 
Deep Learning do Zero ao Impossível: Qual o caminho?
Deep Learning do Zero ao Impossível: Qual o caminho?
Sandro Moreira
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
Ambiente Livre
 
Analise de Dados com Azure Machine Learning, R e Power BI
Analise de Dados com Azure Machine Learning, R e Power BI
Orlando Mariano
 
Big Query - Escalabilidade Infinita para os seus Dados
Big Query - Escalabilidade Infinita para os seus Dados
Alvaro Viebrantz
 

Mais de Dickson S. Guedes (20)

Ganhando tempo automatizando com SQL
Ganhando tempo automatizando com SQL
Dickson S. Guedes
 
O mínimo necessário que você precisa conhecer sobre computação quântica
O mínimo necessário que você precisa conhecer sobre computação quântica
Dickson S. Guedes
 
Porque aprender várias linguagens me tornou um DBA (e desenvolvedor) melhor
Porque aprender várias linguagens me tornou um DBA (e desenvolvedor) melhor
Dickson S. Guedes
 
Pattern matching - O que é? Onde vive? Do que se alimenta? Como se reproduz?
Pattern matching - O que é? Onde vive? Do que se alimenta? Como se reproduz?
Dickson S. Guedes
 
Dicas de sobrevivência de um DBA sem mouse
Dicas de sobrevivência de um DBA sem mouse
Dickson S. Guedes
 
Destistificando o EXPLAIN
Destistificando o EXPLAIN
Dickson S. Guedes
 
Falando "Postgrês"
Falando "Postgrês"
Dickson S. Guedes
 
Se meu elefante falasse
Se meu elefante falasse
Dickson S. Guedes
 
Curiosidades que você (talvez) não sabia e se sabia vale a pena lembrar
Curiosidades que você (talvez) não sabia e se sabia vale a pena lembrar
Dickson S. Guedes
 
O Elefante Poliglota
O Elefante Poliglota
Dickson S. Guedes
 
Como encontrar uma agulha num palheiro de logs
Como encontrar uma agulha num palheiro de logs
Dickson S. Guedes
 
Como encontrar uma agulha no palheiro de logs do PostgreSQL
Como encontrar uma agulha no palheiro de logs do PostgreSQL
Dickson S. Guedes
 
Gerenciando múltiplas versões do PostgreSQL com pgvm
Gerenciando múltiplas versões do PostgreSQL com pgvm
Dickson S. Guedes
 
PGXN - Como distribuir suas extensões com o PostgreSQL
PGXN - Como distribuir suas extensões com o PostgreSQL
Dickson S. Guedes
 
Pgxn.pgday
Pgxn.pgday
Dickson S. Guedes
 
Estripando o Elefante - (Trabalhando com extensões no PostgreSQL)
Estripando o Elefante - (Trabalhando com extensões no PostgreSQL)
Dickson S. Guedes
 
Plante uma árvore, escreva um livro, tenha um filho e contribua com software ...
Plante uma árvore, escreva um livro, tenha um filho e contribua com software ...
Dickson S. Guedes
 
Conhecendo Postgresql.- ENECOMP 2009
Conhecendo Postgresql.- ENECOMP 2009
Dickson S. Guedes
 
Minicurso Postgresql - Enecomp 2009
Minicurso Postgresql - Enecomp 2009
Dickson S. Guedes
 
Testes unitarios no PostgreSQL com pgTAP
Testes unitarios no PostgreSQL com pgTAP
Dickson S. Guedes
 
Ganhando tempo automatizando com SQL
Ganhando tempo automatizando com SQL
Dickson S. Guedes
 
O mínimo necessário que você precisa conhecer sobre computação quântica
O mínimo necessário que você precisa conhecer sobre computação quântica
Dickson S. Guedes
 
Porque aprender várias linguagens me tornou um DBA (e desenvolvedor) melhor
Porque aprender várias linguagens me tornou um DBA (e desenvolvedor) melhor
Dickson S. Guedes
 
Pattern matching - O que é? Onde vive? Do que se alimenta? Como se reproduz?
Pattern matching - O que é? Onde vive? Do que se alimenta? Como se reproduz?
Dickson S. Guedes
 
Dicas de sobrevivência de um DBA sem mouse
Dicas de sobrevivência de um DBA sem mouse
Dickson S. Guedes
 
Curiosidades que você (talvez) não sabia e se sabia vale a pena lembrar
Curiosidades que você (talvez) não sabia e se sabia vale a pena lembrar
Dickson S. Guedes
 
Como encontrar uma agulha num palheiro de logs
Como encontrar uma agulha num palheiro de logs
Dickson S. Guedes
 
Como encontrar uma agulha no palheiro de logs do PostgreSQL
Como encontrar uma agulha no palheiro de logs do PostgreSQL
Dickson S. Guedes
 
Gerenciando múltiplas versões do PostgreSQL com pgvm
Gerenciando múltiplas versões do PostgreSQL com pgvm
Dickson S. Guedes
 
PGXN - Como distribuir suas extensões com o PostgreSQL
PGXN - Como distribuir suas extensões com o PostgreSQL
Dickson S. Guedes
 
Estripando o Elefante - (Trabalhando com extensões no PostgreSQL)
Estripando o Elefante - (Trabalhando com extensões no PostgreSQL)
Dickson S. Guedes
 
Plante uma árvore, escreva um livro, tenha um filho e contribua com software ...
Plante uma árvore, escreva um livro, tenha um filho e contribua com software ...
Dickson S. Guedes
 
Conhecendo Postgresql.- ENECOMP 2009
Conhecendo Postgresql.- ENECOMP 2009
Dickson S. Guedes
 
Minicurso Postgresql - Enecomp 2009
Minicurso Postgresql - Enecomp 2009
Dickson S. Guedes
 
Testes unitarios no PostgreSQL com pgTAP
Testes unitarios no PostgreSQL com pgTAP
Dickson S. Guedes
 
Anúncio

Primeiros passos machine learning PostgreSQL

  • 1. Primeiros passos Machine Learning no PostgreSQL Dickson S. Guedes twitter: guediz / github: guedes
  • 3. Apresentação Pessoal • as pessoas me chamam de Guedes • costumo usar • PostgreSQL, Elasticsearch • Python, Rust, Elixir, Ruby, R • Emacs, Jupyter • Ansible, Docker, Zabbix, Grafana, Logstash • meetups • Python Floripa, Devops, DBFloripa • eventos • FISL, PGBR, DBA Brasil 1.0, TDC
  • 4. O que você vai ver hoje? • introdução Machine Learning (ML) • banco de dados PostgreSQL (BD ou Postgres) • Python • SQL’s • notebooks • um careca falando...
  • 5. Machine Learning em um slide • qual é a pergunta? • o que eu quero descobrir? • quero prever um valor? é regressão • quero agrupar elementos com características comuns? é cluster • quero classificar algo baseado em características? é classificação • vou trabalhar com imagens? deep learning! • posso usar os dados que eu tenho para o propósito que quero?
  • 6. Machine Learning é burro Oi?!
  • 7. ML pode não diferenciar um cachorro de um biscoito
  • 8. ML pode não diferenciar um cachorro de um esfregão
  • 9. ML pode ser trollado pelo Saruman
  • 10. Machine Learning em outro slide • obtenha os dados com a melhor qualidade possível • prepare e entenda os dados • qual a pergunta? ela pode ser respondida pelos dados? • escolha o algoritmo • divida os dados em treino, teste e validação • treine • teste • valide • descubra (?) a resposta
  • 11. O que virá pela frente? • Linguagens como Python ou R • Bibliotecas de Machine learning, como Sklearn, Tensorflow, Keras, MADlib (nosso exemplo do dia) • Necessidade de muito potencial de processamento • Necessidade de muita memória
  • 12. ML + BD • você está mais próximo dos dados • transferência apenas dos resultados entre o banco e cliente • o banco gerencia bem memória quando os dados não cabem • os modelos ficam disponíveis para todos que acessam o banco • devem existir outros motivos...
  • 13. Show me the code • PostgreSQL 10 • Python 2.7 • MADlib 1.14 • Jupyter Notebook 4.4 • O código apresentado está disponível no Github: • https://github.com/guedes/notebooks-exemplo/blob/master/Exemplo%20regressao%20linear%20c om%20MADLib%20e%20PostgreSQL.ipynb
  • 14. Comece a ler sobre... • GPU • TPU • Cloud E veja o que estão falando sobre... • Computação quântica • Blockchain + Machine learning
  • 15. Referências • PostgreSQL: o banco de dados que utilizamos • https://www.postgresql.org/ • MADlib: a biblioteca que usamos para machine learning no PostgreSQL: • http://madlib.apache.org • um mapa dos algoritmos e quando utilizá-los: • http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html • Jupyter Notebook • http://jupyter.org/ • Scikit Learn: para aprender sobre algoritmos e • http://scikit-learn.org • para aprender mais: • https://br.udacity.com/ • https://www.coursera.org/
  • 16. Agradecimentos • aos que se mantiveram atentos • aos que não se mantiveram atentos mas estão aí firme e forte • aos que não puderam ficar até agora e tiveram que sair • às comunidades PostgreSQL, Python, DBA Brasil • a Apache Software Foundation pela MADlib