Guia - 1 - Preparación de Datos Tutorial WEKA
Guia - 1 - Preparación de Datos Tutorial WEKA
@relation aprobacion_curso
@attribute Id integer
@attribute Estrato{1,2,3,4,5}
@attribute Sexo{F,M}
@attribute Enfermedad{SI,NO}
@attribute Colegio_U{SI,NO}
@attribute Activo_Web{ALTA, MEDIA, BAJA}
@attribute Asistencia numeric
@attribute Entregas_Completas numeric
@attribute Trabaja{SI,NO}
@attribute Examen_Final{APROBADO, DESAPROBADO}
@data
1,3,F,SI,SI,BAJA,0.1,0.45,NO,APROBADO
2,2,M,NO,NO,MEDIA,0.45,0.6,NO,APROBADO
3,4,M,NO,NO,ALTA,0.5,0.75,SI,DESAPROBADO
4,3,F,NO,NO,ALTA,0,0.6,SI,DESAPROBADO
5,4,F,SI,NO,MEDIA,0.65,0.85,NO,APROBADO
6,4,M,NO,NO,BAJA,0.1,0,NO,DESAPROBADO
7,3,M,NO,NO,MEDIA,0.2,0.9,NO,APROBADO
8,2,M,NO,NO,MEDIA,0.3,0.8,SI,DESAPROBADO
9,2,F,NO,SI,BAJA,0.35,0.7,NO,APROBADO
10,2,M,SI,NO,BAJA,0.75,0.5,SI,DESAPROBADO
11,4,M,NO,SI,ALTA,0.7,0.6,NO,APROBADO
12,3,F,NO,NO,MEDIA,0.0,0.8,NO,APROBADO
13,2,F,NO,NO,ALTA,0.2,0.25,NO,DESAPROBADO
14,4,F,SI,NO,ALTA,0.2,0.2,NO,DESAPROBADO
15,3,F,NO,NO,BAJA,0.9,0.8,NO,APROBADO
16,2,M,NO,NO,MEDIA,1,1,NO,APROBADO
Eliminar
variables
3. Estadística descriptiva
Estadística
descriptiva
Ver
histogramas
4. Limpieza
8. Balanceo: Smote
Clase a balancear
9. Transformación: Discretize
Filtro: unsupervised/attribute/discretize
Cantidad de categorias
Niño -> 0
Adulto -> 1