Lenguaje R para Machine Learning: Introducción

TD-007

15 horas

Presencial

Objetivos

R es uno de los principales lenguajes existentes hoy en día para la realización de procesos de Inteligencia Artificial y Análisis de Datos. Sin embargo, para la realización de un proceso de análisis de datos es necesario conocer los fundamentos de la programación en dicho lenguaje, así como los fundamentos en el manejo de datos.
Por ello, en el presente curso se combinarán el conocimiento de los fundamentos básicos de R para realizar procesos de análisis de datos junto con transformaciones básicas de los datos.

SUBVENCION: Edicion julio 2024: Curso enmarcado en el Digital Tatent Hub. Gratuito para empresas socias de GAIA
Otro tipología de empresas pueden ponerse en contacto con Talio o indicarlo en comentarios

Temario

Operaciones básicas con R:
1.Cálculos simples.
2.Creación de variables.
3.Creación de vectores.
4.Consultas en vectores.
5.Transformación de formato.
6.Creación de listas.
7.Consultas enlistas.
8.Creación de matrices.
9.Consultas en matrices.
10.Manipulación de matrices creadas.
11.Creación de factores.
12.Consultas en factores.
13.Creación de “DataFrames”.
14.Consultas en “DataFrames”.
15.Ejercicios prácticos.

Manipulación básica de datos en R:
1.Carga de bases de datos.
2.Manipulación de datos.
3.Creación de nuevas columnas/variables.
4.Manipulación de columnas/variables.
5.Cálculo de estadísticos básicos.
6.Consultas cruzadas.
7.Unión de varias tablas.
8.Operaciones con variables.
9.Muestra de datos.
10.Ejercicios prácticos.


Análisis preliminar de las variables:
1.Conocimiento básico de los datos.
2.Análisis de las variables.
3.Determinación de las diferentes clases de datos existentes.
4.Gráficos básicos de las variables individuales.
5.Gráficos básicos sobre las relaciones de las variables.
6.Gráficos avanzados sobre las relaciones entre las variables.
7.Gráficos avanzados sobre la correlación entre variables.
8.Interpretación de los gráficos.

Trabajando con fechas y variables:
1.Transformar una variable en formato fecha.
2.Descomposición de la fecha.
3.Cambio del nombre de las variables.
4.Reordenar el Data Frame.

Corrección de errores tipográficos:
1.Creación de un diccionario con las opciones correctas.
2.Corrección masiva de los errores.
3.Comprobación de las correcciones