Web Scraping con Python

PROG-159

12 horas

Presencial

0,00 €

Comienzo 7 de octubre Horario: 09:00 a 13:00 Presencial+Remoto

Objetivos

Construir herramientas para analizar código html y acceder a la información deseada y crear araña scrapy para rastrear la web a escala.

SUBVENCIÓN: Edicion 2024: Curso enmarcado en el Digital Tatent Hub. Gratuito para empresas socias de GAIA
Otro tipología de empresas consultar

Temario

Módulo 1: Introducción al Web Scraping
Introducción al Web Scraping
Fundamentos del Web Scraping

Módulo 2: Herramientas Básicas de Captura
Introducción a Requests
BeautifulSoup
Instalación y configuración.
Parsing de HTML y XML.
Métodos de navegación del DOM.
Extracción de datos: find, find_all, selectores CSS.
Ejemplos prácticos.

Módulo 3: Scrapy para Proyectos Complejos
Introducción a Scrapy
Instalación y configuración.
Creación de un proyecto Scrapy.
Estructura de un proyecto Scrapy.

Módulo 4: Selenium para Páginas Dinámicas
Introducción a Selenium
Instalación y configuración de Selenium.
Configuración de WebDrivers (ChromeDriver, GeckoDriver, etc.).
Automatización del Navegador con Selenium
Navegación básica: abrir páginas, hacer clic, enviar formularios.
Interacción con elementos: encontrar y manipular elementos web.
Esperas implícitas y explícitas.
Scraping de Páginas Dinámicas
Ejemplos prácticos de scraping con Selenium.