XPath est un langage qui permet de localiser des éléments spécifiques sur une page web. Modifier le XPath dans Octoparse offre plus de flexibilité et de précision que celui généré automatiquement lors de la configuration de la tâche.
Octoparse vous permet de personnaliser le XPath des éléments afin de localiser précisément les données ciblées. Cela aide à résoudre les problèmes tels que les données manquantes, les pages sautées, les champs vides et les doublons.
Où puis-je modifier XPath dans Octoparse ?
Modifier le XPath du champ
Cliquez sur Plus dans l'aperçu des données pour le champ que vous souhaitez personnaliser.
Sélectionnez Personnaliser le XPath
Saisissez le nouveau XPath dans la zone de texte XPath correspondant, et modifier le nom du champ si besoin.
Modifier le XPath de Élément de boucle / XPath de Cliquez sur l'élément
Pour les étapes Élément de boucle, Pagination ou Cliquez sur l'élément, vous pouvez trouver la zone de texte XPath sous les paramètres Général.
Entrez le nouveau XPath et cliquez sur Appliquer pour enregistrer vos modifications.
Comment rédiger un XPath ?
Si vous débutez avec XPath, vous devrez peut-être d'abord comprendre quelques bases du HTML. XPath localise les éléments en fonction des balises et des attributs. Ainsi, avant de rédiger votre propre XPath, vous devrez d'abord examiner la structure HTML de la page.
Nous avons également un tutoriel sur la manière de rédiger un XPath. Vous pouvez vous y référer : Qu'est-ce que XPath et comment l'utiliser dans Octoparse ?