En este tutorial, te mostraremos cómo usar Octoparse para extraer datos de cada nivel de página, incluidos la URL de la página web, el título de la página, la meta descripción, las meta palabras clave y el código fuente HTML.
Cómo agregar los datos
1.En el panel de "Vista previa de datos", puedes hacer clic en el icono para ver las opciones del menú desplegable.
2. Haz clic en "Datos a nivel de página" para seleccionar los datos a nivel de página que desees.Los datos de nivel de página seleccionados se agregarán automáticamente en "Campo de datos".
3. Cambia el nombre del campo de datos según tus necesidades
Significados de los campos
URL de la página: agrega la URL de la página actual junto con los datos correspondientes
Es útil cuando deseas verificar los campos de datos que faltan en una página: ¿Qué hacer con esos campos en blanco que obtuve en el resultado extraído?
Título de la página: el contenido de la etiqueta del título.
Es una breve descripción de una página web y aparece en la parte superior de la ventana del navegador.
Meta descripción: el contenido de la etiqueta de la meta descripción
La etiqueta contiene un resumen del contenido de la página.
Meta palabra clave: el contenido de la meta etiqueta de palabra clave
Scrapea el título de la página, la meta descripción y las meta palabras clave son útiles cuando los usuarios necesitan mejorar tu SEO.
Código fuente HTML: el código HTML completo de la página web.