Curso Intermedio de R
instituto-desarrollo
Inscripción cerrada

Acerca de este curso
El objetivo principal de este curso es contribuir con el conocimiento sobre técnicas de Análisis de Datos. Para esto se estudiará el manejo de paquetes de R como: tidyverse, que es una colección de paquetes utilizados normalmente en Ciencia de Datos. La ventaja es que posee un lenguaje muy accesible para usuarios de nivel intermedio.
Prerrequisitos
Este curso asume conocimientos básicos de programación y conceptos fundamentales de R.
Modalidad
100% online
Instructor
M.Sc. Oscar González
Contenido del curso
Introducción
- Bienvenida
- Sobre el curso
- Sobre el Instructor
Sección 1: Depuración de bases de datos
- Importación y unión de bases
- Empezando a procesar datos
- Creación de un proyecto
- Importación de bases de datos (csv)
- Unión de bases de datos (Paso 1)
- Unión de bases de datos (Paso 2)
- Correción de datos
- Selección de variables a procesar
- Importancia de la depuración de base de datos
- Estructura de la base
- Extraer caracteres de variables no numéricas
- Corrección del tipo de variable (caso de carácter a fecha)
- Renombrar variables
- Corrección del tipo de variable (caso de carácter a factor)
- Corrección de variables numéricas
- Consistencia de una variable (Paso 1)
- Consistencia de una variable (Paso 2)
- Consistencia de una variable (Paso 3)
- Transformación de una variable numérica
- Transformar en distintas variables
- Corregir categorías vacías en una variable de tipo factor
- Ordenar casos de acuerdo a una o varias variables
Sección 2: Análisis exploratorio de datos
- Estadística Descriptiva
- Materiales
- Base de datos
- Encuesta vs Censo
- Cuadro 1 - Total País
- Cuadro 1 - Área Urbana y Rural
- Cuadro 4 - Total País
- Cuadro 4 - Área Urbana y Rural
- Medidas de resumen
- Tratamiento de valores atípicos
- Distribución de variables
- Gráficos con ggplot2
- Funciones en R
- Función de estadísticos básicos
- Una variable discreta y una variable continua
- Función de estadística descriptiva de una variable numérica
- Función de comprobación de normalidad de una variable numérica
- Bibliografía