Catálogo
Cursos Presenciales
Por temática
Por competencia
Cursos Online
Por temática
Por competencia
Calendario
Campus virtual
Contacto
Catálogo
Cursos Presenciales
Por temática
Por competencia
Cursos Online
Por temática
Por competencia
Calendario
Campus virtual
Contacto
Buscador de cursos
Buscador de cursos
Pentaho Kettle: Introducción a la gestión de procesos ETL
IG-002
10 horas
Presencial
Objetivos
El objetivo final de este curso es lograr que los alumnos sean capaces de desarrollar de forma autónoma procesos ETL a través de la herramienta Pentaho.
Pentaho Kettle es una poderosa herramienta de ETL (Extract, Transform, Load) diseñada para simplificar y optimizar el procesamiento de datos. Pentaho Kettle, también conocido como Pentaho Data Integration (PDI), es esencial para empresas que buscan gestionar grandes volúmenes de datos de manera eficiente y eficaz.
Pentaho Kettle se utiliza para extraer datos de diversas fuentes, transformarlos según las necesidades del negocio y cargarlos en un sistema de almacenamiento de datos. Esta herramienta permite manejar datos de múltiples formatos y orígenes, como bases de datos, archivos planos, servicios web, entre otros, facilitando la integración y limpieza de datos.
Entre los beneficios de utilizar Pentaho Kettle se encuentran su interfaz gráfica intuitiva, que permite diseñar flujos de trabajo de ETL sin necesidad de programación avanzada, y su capacidad para automatizar procesos repetitivos, reduciendo así el tiempo y esfuerzo requerido en el manejo de datos. Además, su flexibilidad y escalabilidad hacen posible su adaptación a las crecientes necesidades de datos de cualquier organización.
Las aplicaciones de Pentaho Kettle son diversas, abarcando desde la integración de datos para análisis y reportes hasta la migración de datos entre sistemas. Su uso es común en sectores como finanzas, salud, telecomunicaciones y retail, donde la calidad y precisión de los datos son críticas para la toma de decisiones estratégicas.
Solicitar más información
Descargar temario del curso
Competencias DigComp
Temario
1.Instalación y configuración del entorno.
2.Procesos de datos y ETL
3.Extracción de datos de diferentes fuentes
a.Estructurados (txt, excel, zip, sql)
b.No estructurados (xml, json)
4.Flujos de datos y su combinación
5.Transformación de datos
a.Limpieza
b.Normalización
c.Agregación
d.Enriquecimiento
e.Validación
f.Fuzzy Match
6.Fusionado de datos (join, unión)
7.Gestión de errores
8.Gestión de conexiones a fuentes internas/externas
9.Configuración de trabajos en PDI
Información y alfabetización digital
Almacenar y recuperar información
Evaluar información
Navegar, buscar y filtrar información
Comunicación y colaboración
Colaborar canales digitales
Compartir información y contenido
Gestión identidad digital
Interactuar con tecnologías
Netiquette
Transacciones en línea
Creación de contenidos digitales
Copyright and licencias
Desarrollo de contenidos
Integrar y reelaborar contenidos
Programación
Seguridad
Protección datos pers.
Protección de dispositivos
Protección de la salud
Protección del entorno
Resolución de problemas
Identificación de brechas
Identificar necesidades y resps. tec.
Innovación y uso creativo
Resolver problemas técnicos