0% encontró este documento útil (0 votos)
189 vistas

Plantilla de Un Proyecto Machine Learning en R y Python

Este documento presenta dos plantillas de proyectos de machine learning clasificadores, uno en R y otro en Python. Explica los pasos típicos de un proyecto de clasificación de machine learning, como la limpieza y análisis exploratorio de datos, el entrenamiento y validación de algoritmos, y la presentación de resultados. El autor invita al lector a usar estas plantillas como guía para sus propios proyectos y a unirse a un curso de formación para aprender más sobre el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
189 vistas

Plantilla de Un Proyecto Machine Learning en R y Python

Este documento presenta dos plantillas de proyectos de machine learning clasificadores, uno en R y otro en Python. Explica los pasos típicos de un proyecto de clasificación de machine learning, como la limpieza y análisis exploratorio de datos, el entrenamiento y validación de algoritmos, y la presentación de resultados. El autor invita al lector a usar estas plantillas como guía para sus propios proyectos y a unirse a un curso de formación para aprender más sobre el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 10

Tu plantilla (Código + Datos) de

presentación de análisis de los datos de tu


proyecto en R y Python

Notebook de dos proyectos


de Machine Learning
plantillas R y Python
Notebook de dos proyectos de Machine Learning

SOBRE
JORDI OLLÉ
CONCEPTOSCLAROS.COM

AUTOR DEL TRAINING ANALIZA TUS DATOS


Y EL BLOG CONCEPTOS CLAROS

Soy Jordi Ollé y estudié ingeniería industrial y al terminar me apunté a un máster en ingeniería
biomédica. Decidí presentar la tesis final sobre análisis de datos biomédicos en una base de datos
de pacientes.

Aunque el proyecto era muy ilusionante estaba totalmente perdido. No sabía interpretar los gráficos
ni usarlos para sacar valor de los datos, y mucho menos, modelizar mis datos con modelos o
algoritmos. Aunque estudié una carrera de números no tenía ni idea de cómo hacerlo. Me parecía
todo muy complejo.

Tuve la suerte de encontrar a mi primer mentor, empecé a ver todas las técnicas como herramientas
aplicables y no solo en ese proyecto sino en muchos otros de otras temáticas y sectores. Las utilicé
en proyectos I+D del sector eólico, en el sector médico, deportivo…. Lo mejor es que existe un
sistema, uno pasos, que se repiten en cualquier proyecto y se necesitan para trabajar los datos. Hoy
quiero que tú también los utilices para avanzar en tus proyectos y tu carrera profesional.

Todo el sistema y mi experiencia es el que trato de transmitir a mis alumnos y clientes para que ellos
lo puedan usar en sus proyectos.

2
plantillas R y Python
Notebook de dos proyectos de Machine Learning

ÍNDICE

1- ¿En qué consiste esta guía? 5

2- Los pasos de un proyecto de machine learning clasificador 6

3- ¿Cómo usar el material de esta guía de forma práctica? 8

¡Te invito a este training! 9

3
plantillas R y Python
Notebook de dos proyectos de Machine Learning

¡Te presento un pequeño documento para acompañar los materiales en R y Python disponibles.

Estos materiales están pensados para que puedas ejecutar un proyecto de machine learning
supervisado de un clasificador.

Te sirvan para poder trabajar tus propios datos y tengas material accionable para tus proyectos o
para crear tu portfolio de proyectos de datos.

¡Deseo que te sean útiles!

4
plantillas R y Python
Notebook de dos proyectos de Machine Learning

1- ¿En qué consiste esta guía?


A continuación tienes a tu disposición dos proyectos de machine learning resueltos.

Uno con R y otro con Python.

Son plantillas creadas con el código, los comentarios y los apartados del tipo de proyectos más
utilizado en la práctica: un clasificador.

Un clasificador es un proyecto con la estructura siguiente:

En este ejemplo puedes ver cómo las features o características nos dan información de diferentes
tiendas y la variable de salida es si hay ventas altas o no.

Se trata de poder entrenar un algoritmo que te permita clasificar una configuración de una nueva
tienda en ventas altas o ventas bajas.

Este proceso lo vas a ver paso a paso tanto en R como en Python

Ya habrás visto que tienes dos carpetas de R y otra de Python.

En la carpeta de R encontrarás:

- II_1102_Ejemplo_carseats.ipynb
- II_1102_Ejemplo_carseats.R
- II_1102_Ejemplo_carseats.zip

En la carpeta de Python encontrarás:

- III_103_ejemplo_paso_paso_stroke.ipynb
- III_103_ejemplo_paso_paso_stroke.py
- III_103_ejemplo_paso_paso_stroke.zip

Son dos proyectos diferentes con datos diferentes que te ayudarán a ver cómo ejecutar el paso a
paso con R y también con Python y también podrás analizar los resultados de dos proyectos
diferentes.

El archivo .ipynb es un archivo notebook que puedes abrir con Jupyter Notebook o Google Colab.

5
plantillas R y Python
Notebook de dos proyectos de Machine Learning

Te recomiendo que lo abras en google colab siguiendo este link: https://colab.research.google.com/


cargues el notebook y vas a ver los resultados sin necesidad de instalar nada.

Solo necesitas una cuenta de gmail.

2- Los pasos de un proyecto de machine learning clasificador


Los dos ejemplos que tienes en esta guía son de un clasificador.

Los pasos que se siguen en este proyecto son los estándares dentro de un proyecto de análisis de
datos:

- Etapas de un proyecto con datos:


- Problema, objetivos
- Obtención de datos (importación de datos)
- Limpieza y manipulación de datos para el análisis
- Análisis exploratorio de los datos. EDA
- Análisis:
- Análisis inferencial (modelado de datos estadístico)
- Machine learning y/o deep learning
- Presentación de resultados (informe, dashboard, herramienta)

En concreto un proyecto de machine learning clasificador sigue estos pasos:

● Plantear el problema
● Definir la estructura de datos
● Definición de Objetivos en cada fase (descriptiva, inferencial, reconocimiento de patrones)
● Lectura e importación de datos
● Limpieza de datos (Imputar valores perdidos, cambiar formatos de variables …)

6
plantillas R y Python
Notebook de dos proyectos de Machine Learning

● Exploración univariada
● Descripción / inferencia inteligente (en relación al target y evaluar correlaciones entre
variables)
● Modelado estadístico previo / selección de variables más importantes
● Training y validación de algoritmos:
○ Data partioning
○ Balanceo de los datos
○ Entrenamiento batería de algoritmos + transformación de variables
○ Selección del mejor algoritmo
○ Tunning / optimización del algoritmo
● Conclusión y resultados finales

En los ejemplos vas a ver cómo ejecutamos estos pasos paso a paso en dos proyectos diferentes
pero con la misma estructura.

7
plantillas R y Python
Notebook de dos proyectos de Machine Learning

3- ¿Cómo usar el material de esta guía de forma práctica?


Te he creado un vídeo para que veas cómo usar el material y puedas aprovecharlo para tus
proyectos tanto en R como en Python.

Link vídeo: https://vimeo.com/719890098/6069b0d998

8
plantillas R y Python
Notebook de dos proyectos de Machine Learning

¡Te invito a este training!


Gracias por descargar este material y deseo y espero que te ayude a la hora de esquematizar e
implementar el paso a paso de un proyecto de machine learning.

De hecho, esta guía es una de las muchas que ofrecemos dentro del programa Analiza tus Datos y
el grupo de mentoría Artist.

Si quieres más y quieres entender mucho mejor cómo interpretar los resultados y cómo aprender a
actuar como científico de datos te invito al siguiente training:

RESERVA TU PLAZA PARA EL TRAINING

Un fuerte abrazo y gracias por usar la guía.


Cualquier cosita me tienes en mi blog conceptosclaros.com
¡Hasta pronto!

9
plantillas R y Python
Notebook de dos proyectos de Machine Learning

Jordi Ollé

10

También podría gustarte