0% encontró este documento útil (0 votos)

204 vistas36 páginas

Fundamentos Machine Learning

David Allende Quintana es un ingeniero estadístico con experiencia en banca, telecomunicaciones y consultoría. Actualmente trabaja como Lead Data Scientist en Tottus Corporativo y se desempeña como capacitador y consultor en analítica aplicada.

Cargado por

Jose Luis Mendoza Landaverry

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

204 vistas36 páginas

Fundamentos Machine Learning

Cargado por

Jose Luis Mendoza Landaverry

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 36

David Allende Quintana

Lead Data Scientist Tottus Corporativo

Capacitador de Analítica aplicada

Consultor Analítico

Experiencia profesional: Banca, Telecomunicaciones, Consultoría

Ingeniero Estadístico con especialización en Inteligencia de Negocios

Educación Ejecutiva
UTEC
Reglas

1 pausas activa

Mantener silenciado al micrófono de todos

Las preguntas se realizan por el chat / en caso sea necesario se

habilita el micrófono

Educación Ejecutiva
UTEC
Contenido de la sesión

1. Introducción al Machine Learning e Inteligencia Artificial

2. Tipos de aprendizaje de un algoritmo de Machine Learning.
3. Ciclo de vida de un modelo de Machine Learning.
4. Tipos de datos.
5. Plataformas y lenguajes de programación para el Machine Learning.

Educación Ejecutiva
UTEC
1. INTRODUCCIÓN A ML E IA

Educación Ejecutiva
UTEC
La ciencia de datos es un campo multidisciplinario que
utiliza un conjunto de herramientas para extraer
conocimiento de los datos y respaldar la toma de
decisiones.

El aprendizaje de máquina y el aprendizaje profundo

se encuentran entre las principales herramientas de la
Ciencia de Datos.

(*) Libro: Managing Data Science - Kirill Dubovikov

¿QUÉ ES
MACHINE LEARNING?

“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.

SAS Institute
¿QUÉ ES
MACHINE LEARNING?

SAS Institute
¿QUÉ ES
INTELIGENCIA ARTIFICIAL?
Inteligencia Artificial

“Es la búsqueda de la construcción de máquinas que puedan razonar, aprender y actuar de manera inteligente”.

MIT Tecnology Review

Educación Ejecutiva
UTEC
¿QUÉ ES
MACHINE LEARNING?

SAS Institute
Algunos algoritmos de Machine Learning

Capa de Capa Capa de

entrada oculta salida
No
Traf. Churner
Entrada 1 1 Offnet
1 >2h
Churner
2 Edad
Entrada 2
Salida <45
2 1 No
Factu Churner
Entrada 3 3 … >120
… m Churner

Entrada n n

Regresión Redes Neuronales Árbol de Decisión

“Un modelo es una “Los modelos son “A un modelo no se le exige absoluta

representación simplificada de errados pero útiles” veracidad, sino utilidad de acuerdo a
la realidad” los objetivos para los que fue creado”
¿QUÉ ES
MACHINE LEARNING?

Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico.
Objetivos

Educación Ejecutiva
UTEC
Objetivos

Educación Ejecutiva
UTEC
Beneficios del Aprendizaje Automático

“Los modelos son

errados pero útiles”

Error Modelo = Varianza + Sesgo

Modelos Estadísticos Modelos ML

Educación Ejecutiva
UTEC
Aprendizaje Estadístico
Lujuriosos

Indiferentes

Ahorradores

Educación Ejecutiva
UTEC
2. TIPOS DE APRENDIZAJE DE
UN ALGORITMO DE ML
Modelos en la Ciencia de Datos

Modelo Método Datos

Supervisado Estructurados
(Predicen futuro) DWH, archivos planos
-Clasificación (Var categórica)
-Predicción (Var numérica)
No estructurados
Habla, texto, imágenes
No Supervisado
(Describen pasado)
-Clustering
-Reglas de asociación
-Análisis componentes principales

Educación Ejecutiva
UTEC
Los algoritmos tienen el rol de aprender de los
datos y predecir

Accede Aprendizaje Automático Conocimiento Negocio

Algoritmo Datos Patrones, Predicciones
tendencias

APRENDIZAJE SUPERVISADO APRENDIZAJE NO SUPERVISADO

Existe evidencia directa del problema de No existe evidencia directa del problema de

negocio y de las variables que puedan explicar negocio pero si contamos con variables que
el problema. puedan explicar el problema.

Ejemplo: Predecir la venta de un producto Ejemplo: Segmentación por preferencias

PROBLEMA DE NEGOCIO EN MINERÍA –
OPTIMIZACIÓN DEL PROCESO DE MOLIENDA
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN TELECOM –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN CONSUMO MASIVO–
PRONOSTICAR LA DEMANDA FUTURA
ALGORITMOS DE REGRESIÓN

Busca entender y explicar el problema.

APRENDIZAJE
SUPERVISADO Para “estimar los ingresos de un cliente” los puedo hacer a través
de un modelo de regresión lineal.

Ingreso
Ingreso
Ingreso Edad Años educación

Linear No linear relationship

ÁRBOLES DE DECISIÓN
Busca entender el problema y se enfoca en la precisión y acierto
del modelo con la realidad.

Para “clasificar a los churners de los no churners” lo puedo hacer a

través de un Random Forest.

𝑥
𝜑1 𝜑𝑀
No
Traf. Churner
Offnet …
>2h Churner
Edad
<45
No 𝑝𝜑1(𝑌 = 𝑐|𝑋 = 𝑥) 𝑝𝜑𝑚 (𝑌 = 𝑐|𝑋 = 𝑥)
Factu Churner
>120 𝛴
Churner

𝑝𝛹 (𝑌 = 𝑐|𝑋 = 𝑥)

Árbol de Decisión Random Forest

Modelo ensamblado de varios
árboles de decisión
3. CICLO DE VIDA DE UN
MODELO DE ML
Ciclo de vida de un proyecto de ML
1 DISEÑO

4 DESPLIEGUE
ORGANIZACIÓN
2
DATOS

3 DESARROLLO
MODELOS

Educación Ejecutiva Foundational Methodology for Data Science

(IBM White Paper, 2016)
UTEC
4. TIPOS DE DATOS
TIPOS DE VARIABLES Y ESCALAS DE MEDICIÓN
5. PLATAFORMAS Y LENGUAJES
DE PROGRAMACIÓN PARA EL ML
Python y R en el
mundo empresarial…
Educación Ejecutiva
UTEC

También podría gustarte

111705musec03t4trab
0% (2)
111705musec03t4trab
3 páginas
Business Intelligence SQL Server 2019
Aún no hay calificaciones
Business Intelligence SQL Server 2019
3 páginas
3 GeneraciónVistaMinableComp PDF
Aún no hay calificaciones
3 GeneraciónVistaMinableComp PDF
31 páginas
Lectoescritura 3ro Proyecto
Aún no hay calificaciones
Lectoescritura 3ro Proyecto
42 páginas
Guia - de - Aprendizaje Adecuar El Sitio
Aún no hay calificaciones
Guia - de - Aprendizaje Adecuar El Sitio
9 páginas
Machine Learning Parte I
Aún no hay calificaciones
Machine Learning Parte I
87 páginas
UTP - Diseño Fisico de Un Data Mart PDF
Aún no hay calificaciones
UTP - Diseño Fisico de Un Data Mart PDF
53 páginas
Oltp y Olap
Aún no hay calificaciones
Oltp y Olap
11 páginas
00 Presentación
Aún no hay calificaciones
00 Presentación
34 páginas
Administración de Datos Maestros
Aún no hay calificaciones
Administración de Datos Maestros
2 páginas
Propuesta de Implementacion Qlik
Aún no hay calificaciones
Propuesta de Implementacion Qlik
10 páginas
00 Presentación
Aún no hay calificaciones
00 Presentación
12 páginas
Slides-Del-Curso-De-Analisis-De-Datos-Con-Power-Bi 3
Aún no hay calificaciones
Slides-Del-Curso-De-Analisis-De-Datos-Con-Power-Bi 3
23 páginas
Módulo 6: Diseño de Índices: Contenido
Aún no hay calificaciones
Módulo 6: Diseño de Índices: Contenido
50 páginas
BD 3 TDisenio DW
Aún no hay calificaciones
BD 3 TDisenio DW
42 páginas
Guia para Gui
Aún no hay calificaciones
Guia para Gui
7 páginas
Inteligencia de Negocios
Aún no hay calificaciones
Inteligencia de Negocios
5 páginas
Kit de Bienvenida - Herramientas de La Inteligencia de Negocios
Aún no hay calificaciones
Kit de Bienvenida - Herramientas de La Inteligencia de Negocios
22 páginas
Indicadores NO Financieros
Aún no hay calificaciones
Indicadores NO Financieros
220 páginas
Monografia Final RRHH
Aún no hay calificaciones
Monografia Final RRHH
66 páginas
Sesión 10 - Análisis de Procesos
Aún no hay calificaciones
Sesión 10 - Análisis de Procesos
31 páginas
Reingenieria de Software, Un Camino o El Camino PDF
Aún no hay calificaciones
Reingenieria de Software, Un Camino o El Camino PDF
13 páginas
PPT 2022 02 U01 T02 Base de Datos (4685)
Aún no hay calificaciones
PPT 2022 02 U01 T02 Base de Datos (4685)
15 páginas
Práctica3.Modelo Dimensional Ventas
Aún no hay calificaciones
Práctica3.Modelo Dimensional Ventas
9 páginas
Presentación 4 ETL
Aún no hay calificaciones
Presentación 4 ETL
10 páginas
Presentación Clase 1. Introducción Mineria Datos
Aún no hay calificaciones
Presentación Clase 1. Introducción Mineria Datos
26 páginas
Diferentes Metodologías DW
Aún no hay calificaciones
Diferentes Metodologías DW
11 páginas
Presentación SEMANA 2.1
Aún no hay calificaciones
Presentación SEMANA 2.1
29 páginas
Plan de Trabajo
Aún no hay calificaciones
Plan de Trabajo
10 páginas
Módulo 15: Administración de Transacciones y Bloqueos: Contenido
Aún no hay calificaciones
Módulo 15: Administración de Transacciones y Bloqueos: Contenido
50 páginas
Edgard Lucho 1 - SQL - Básico - cap07-V2-Vistas
Aún no hay calificaciones
Edgard Lucho 1 - SQL - Básico - cap07-V2-Vistas
13 páginas
I Business Intelligence Analytics Big Data
Aún no hay calificaciones
I Business Intelligence Analytics Big Data
8 páginas
Módulo 6: Copia de Seguridad de Bases de Datos: Contenido
Aún no hay calificaciones
Módulo 6: Copia de Seguridad de Bases de Datos: Contenido
76 páginas
Casos Modelación Comercial
Aún no hay calificaciones
Casos Modelación Comercial
105 páginas
Sesion 04.01 DataMart
Aún no hay calificaciones
Sesion 04.01 DataMart
29 páginas
Brochure Power BI Integral
Aún no hay calificaciones
Brochure Power BI Integral
22 páginas
Usabilidad Web - Investigación - Grupal
Aún no hay calificaciones
Usabilidad Web - Investigación - Grupal
11 páginas
EPS Python - Módulo 1
Aún no hay calificaciones
EPS Python - Módulo 1
49 páginas
Metodología de Kimball y Otros
Aún no hay calificaciones
Metodología de Kimball y Otros
5 páginas
Diferencias y Similitudes Entre El Modelo Tabular y El Multidimensional
100% (1)
Diferencias y Similitudes Entre El Modelo Tabular y El Multidimensional
2 páginas
Giinn U2 CN
Aún no hay calificaciones
Giinn U2 CN
78 páginas
Cubos OLAP
Aún no hay calificaciones
Cubos OLAP
34 páginas
La Volpe - Gestion y Costo
Aún no hay calificaciones
La Volpe - Gestion y Costo
19 páginas
Ciclo de Vida Big Data
Aún no hay calificaciones
Ciclo de Vida Big Data
18 páginas
PowerBI - Modelado de Datos
Aún no hay calificaciones
PowerBI - Modelado de Datos
21 páginas
Manual-Uso Avanzado de SSIS 2012
Aún no hay calificaciones
Manual-Uso Avanzado de SSIS 2012
25 páginas
5 Definición BigData
Aún no hay calificaciones
5 Definición BigData
18 páginas
Data Analytics para La Transformación Digital
Aún no hay calificaciones
Data Analytics para La Transformación Digital
24 páginas
Guía 9 Analisis Visual - Interfaz de Trabajo
Aún no hay calificaciones
Guía 9 Analisis Visual - Interfaz de Trabajo
11 páginas
Tesis Datamart
67% (3)
Tesis Datamart
65 páginas
Ciencia de Datos
Aún no hay calificaciones
Ciencia de Datos
19 páginas
Sesion 01 y 02
Aún no hay calificaciones
Sesion 01 y 02
105 páginas
Analítica de Datos
Aún no hay calificaciones
Analítica de Datos
50 páginas
Data Mining 1
Aún no hay calificaciones
Data Mining 1
61 páginas
S02.s2 - Ejercicios Data Mining y Balanced Scorecard
Aún no hay calificaciones
S02.s2 - Ejercicios Data Mining y Balanced Scorecard
4 páginas
Clase 4 Qlik Sense
Aún no hay calificaciones
Clase 4 Qlik Sense
10 páginas
Selección de Herramientas de Inteligencia de Negocios
Aún no hay calificaciones
Selección de Herramientas de Inteligencia de Negocios
3 páginas
Trabajo Practico #1 - Introduccion A Las Bases de Datos
100% (1)
Trabajo Practico #1 - Introduccion A Las Bases de Datos
3 páginas
Introduccionalml 180529132923 PDF
Aún no hay calificaciones
Introduccionalml 180529132923 PDF
43 páginas
Dgam 2023 - M4
Aún no hay calificaciones
Dgam 2023 - M4
34 páginas
Machine Learning Python
Aún no hay calificaciones
Machine Learning Python
48 páginas
Introduccion MachineLearning Fundamentos-de-ML
Aún no hay calificaciones
Introduccion MachineLearning Fundamentos-de-ML
26 páginas
Presentación Tema 3 Identificación Del Problema
Aún no hay calificaciones
Presentación Tema 3 Identificación Del Problema
103 páginas
SESIÓN 1 COMUNICACIÓN 21 AL 25 DE OCT. Historietas
Aún no hay calificaciones
SESIÓN 1 COMUNICACIÓN 21 AL 25 DE OCT. Historietas
8 páginas
Artículo para Infancia I - Espacios en Armonia
Aún no hay calificaciones
Artículo para Infancia I - Espacios en Armonia
7 páginas
Guía de Actividades y Rubrica de Evaluación - Unidad 4
Aún no hay calificaciones
Guía de Actividades y Rubrica de Evaluación - Unidad 4
7 páginas
LIBRO 2
Aún no hay calificaciones
LIBRO 2
18 páginas
Inventario Edaom
Aún no hay calificaciones
Inventario Edaom
4 páginas
Eje 2
Aún no hay calificaciones
Eje 2
23 páginas
U5 A5 Cartel
Aún no hay calificaciones
U5 A5 Cartel
1 página
Actividad Entregable 3
Aún no hay calificaciones
Actividad Entregable 3
3 páginas
REGISTROASISTENCI
Aún no hay calificaciones
REGISTROASISTENCI
12 páginas
FORMATOS de CONCLUSIONES DE LOS ANALISIS DE LOS RESULTADOS ANEXOS PEI PAT-INICIAL 2018 Virgen de Candelaria
100% (1)
FORMATOS de CONCLUSIONES DE LOS ANALISIS DE LOS RESULTADOS ANEXOS PEI PAT-INICIAL 2018 Virgen de Candelaria
2 páginas
Codigo de Etica
Aún no hay calificaciones
Codigo de Etica
10 páginas
Actividad de Taller 3 Años 29-10
Aún no hay calificaciones
Actividad de Taller 3 Años 29-10
4 páginas
Pauta Evaluación Esquema
Aún no hay calificaciones
Pauta Evaluación Esquema
1 página
Syllabus Etica Del Contador
Aún no hay calificaciones
Syllabus Etica Del Contador
6 páginas
comunicacion-sesion-la-coma-y-sus-clases-4to-primaria
Aún no hay calificaciones
comunicacion-sesion-la-coma-y-sus-clases-4to-primaria
9 páginas
Aide Cortez. Didáctica de la escritura, producto 2
Aún no hay calificaciones
Aide Cortez. Didáctica de la escritura, producto 2
2 páginas
1.1. Propuestas Muy Propias
Aún no hay calificaciones
1.1. Propuestas Muy Propias
10 páginas
Bases Curriculares Ed Parvularia 2018
100% (1)
Bases Curriculares Ed Parvularia 2018
136 páginas
Sesion EPT
100% (1)
Sesion EPT
2 páginas
2020 Proyecto Educacion en Transito y Seguridad Vial
Aún no hay calificaciones
2020 Proyecto Educacion en Transito y Seguridad Vial
8 páginas
Ensayo GVM Uane CP
Aún no hay calificaciones
Ensayo GVM Uane CP
8 páginas
Acompañamiento Escolar y Influencia en El R.A
Aún no hay calificaciones
Acompañamiento Escolar y Influencia en El R.A
35 páginas
TESIS_5
Aún no hay calificaciones
TESIS_5
6 páginas
Modelo de Informe Psicológico
100% (1)
Modelo de Informe Psicológico
4 páginas
Formato Sesión Taller Docentes enero 2025
Aún no hay calificaciones
Formato Sesión Taller Docentes enero 2025
23 páginas
Planeamiento Semanal 12 Año Ciencias Del 9 Al 13 de Marzo de 2020
0% (1)
Planeamiento Semanal 12 Año Ciencias Del 9 Al 13 de Marzo de 2020
1 página
ensayo critico 1
Aún no hay calificaciones
ensayo critico 1
4 páginas