0% encontró este documento útil (0 votos)
204 vistas36 páginas

Fundamentos Machine Learning

David Allende Quintana es un ingeniero estadístico con experiencia en banca, telecomunicaciones y consultoría. Actualmente trabaja como Lead Data Scientist en Tottus Corporativo y se desempeña como capacitador y consultor en analítica aplicada.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
204 vistas36 páginas

Fundamentos Machine Learning

David Allende Quintana es un ingeniero estadístico con experiencia en banca, telecomunicaciones y consultoría. Actualmente trabaja como Lead Data Scientist en Tottus Corporativo y se desempeña como capacitador y consultor en analítica aplicada.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 36

David Allende Quintana

Lead Data Scientist Tottus Corporativo

Capacitador de Analítica aplicada

Consultor Analítico

Experiencia profesional: Banca, Telecomunicaciones, Consultoría

Ingeniero Estadístico con especialización en Inteligencia de Negocios

Educación Ejecutiva
UTEC
Reglas

1 pausas activa

Mantener silenciado al micrófono de todos

Las preguntas se realizan por el chat / en caso sea necesario se


habilita el micrófono

Educación Ejecutiva
UTEC
Contenido de la sesión

1. Introducción al Machine Learning e Inteligencia Artificial


2. Tipos de aprendizaje de un algoritmo de Machine Learning.
3. Ciclo de vida de un modelo de Machine Learning.
4. Tipos de datos.
5. Plataformas y lenguajes de programación para el Machine Learning.

Educación Ejecutiva
UTEC
1. INTRODUCCIÓN A ML E IA

Educación Ejecutiva
UTEC
La ciencia de datos es un campo multidisciplinario que
utiliza un conjunto de herramientas para extraer
conocimiento de los datos y respaldar la toma de
decisiones.

El aprendizaje de máquina y el aprendizaje profundo


se encuentran entre las principales herramientas de la
Ciencia de Datos.

(*) Libro: Managing Data Science - Kirill Dubovikov


¿QUÉ ES
MACHINE LEARNING?

“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.

SAS Institute
¿QUÉ ES
MACHINE LEARNING?

“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.

SAS Institute
¿QUÉ ES
INTELIGENCIA ARTIFICIAL?
Inteligencia Artificial

“Es la búsqueda de la construcción de máquinas que puedan razonar, aprender y actuar de manera inteligente”.

MIT Tecnology Review

Educación Ejecutiva
UTEC
¿QUÉ ES
MACHINE LEARNING?

“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.

SAS Institute
Algunos algoritmos de Machine Learning

Capa de Capa Capa de


entrada oculta salida
No
Traf. Churner
Entrada 1 1 Offnet
1 >2h
Churner
2 Edad
Entrada 2
Salida <45
2 1 No
Factu Churner
Entrada 3 3 … >120
… m Churner

Entrada n n

Regresión Redes Neuronales Árbol de Decisión

“Un modelo es una “Los modelos son “A un modelo no se le exige absoluta


representación simplificada de errados pero útiles” veracidad, sino utilidad de acuerdo a
la realidad” los objetivos para los que fue creado”
¿QUÉ ES
MACHINE LEARNING?

Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico.
Objetivos

Educación Ejecutiva
UTEC
Objetivos

Educación Ejecutiva
UTEC
Beneficios del Aprendizaje Automático

“Los modelos son


errados pero útiles”

Error Modelo = Varianza + Sesgo

Modelos Estadísticos Modelos ML

Educación Ejecutiva
UTEC
Aprendizaje Estadístico
Lujuriosos

Indiferentes

Ahorradores

Educación Ejecutiva
UTEC
2. TIPOS DE APRENDIZAJE DE
UN ALGORITMO DE ML
Modelos en la Ciencia de Datos

Modelo Método Datos

Supervisado Estructurados
(Predicen futuro) DWH, archivos planos
-Clasificación (Var categórica)
-Predicción (Var numérica)
No estructurados
Habla, texto, imágenes
No Supervisado
(Describen pasado)
-Clustering
-Reglas de asociación
-Análisis componentes principales

Educación Ejecutiva
UTEC
Los algoritmos tienen el rol de aprender de los
datos y predecir

Accede Aprendizaje Automático Conocimiento Negocio


Algoritmo Datos Patrones, Predicciones
tendencias

APRENDIZAJE SUPERVISADO APRENDIZAJE NO SUPERVISADO

Existe evidencia directa del problema de No existe evidencia directa del problema de

negocio y de las variables que puedan explicar negocio pero si contamos con variables que
el problema. puedan explicar el problema.

Ejemplo: Predecir la venta de un producto Ejemplo: Segmentación por preferencias


PROBLEMA DE NEGOCIO EN MINERÍA –
OPTIMIZACIÓN DEL PROCESO DE MOLIENDA
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN TELECOM –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN CONSUMO MASIVO–
PRONOSTICAR LA DEMANDA FUTURA
ALGORITMOS DE REGRESIÓN

Busca entender y explicar el problema.


APRENDIZAJE
SUPERVISADO Para “estimar los ingresos de un cliente” los puedo hacer a través
de un modelo de regresión lineal.

Ingreso
Ingreso
Ingreso Edad Años educación

Linear No linear relationship


ÁRBOLES DE DECISIÓN
Busca entender el problema y se enfoca en la precisión y acierto
del modelo con la realidad.

Para “clasificar a los churners de los no churners” lo puedo hacer a


través de un Random Forest.

𝑥
𝜑1 𝜑𝑀
No
Traf. Churner
Offnet …
>2h Churner
Edad
<45
No 𝑝𝜑1(𝑌 = 𝑐|𝑋 = 𝑥) 𝑝𝜑𝑚 (𝑌 = 𝑐|𝑋 = 𝑥)
Factu Churner
>120 𝛴
Churner

𝑝𝛹 (𝑌 = 𝑐|𝑋 = 𝑥)

Árbol de Decisión Random Forest


Modelo ensamblado de varios
árboles de decisión
3. CICLO DE VIDA DE UN
MODELO DE ML
Ciclo de vida de un proyecto de ML
1 DISEÑO

4 DESPLIEGUE
ORGANIZACIÓN
2
DATOS

3 DESARROLLO
MODELOS

Educación Ejecutiva Foundational Methodology for Data Science


(IBM White Paper, 2016)
UTEC
4. TIPOS DE DATOS
TIPOS DE VARIABLES Y ESCALAS DE MEDICIÓN
5. PLATAFORMAS Y LENGUAJES
DE PROGRAMACIÓN PARA EL ML
Python y R en el
mundo empresarial…
Educación Ejecutiva
UTEC

También podría gustarte