Vous consultez un guide tutoriel pour la dernière version d’Octoparse.
Si vous utilisez une version plus ancienne, nous vous recommandons vivement de mettre à jour, car la nouvelle version est plus rapide, plus simple et plus performante !
Téléchargez et mettez à jour ici si ce n’est pas déjà fait !
Certains sites web (comme les sites e-commerce) nécessitent de faire défiler la page jusqu’en bas pour charger du contenu supplémentaire. Dans ce cas, vous pouvez configurer un défilement automatique de la page.
Cela est particulièrement utile pour extraire des pages web qui utilisent le défilement infini ou le chargement différé (lazy loading).
1. Configurez un défilement pour l’action Aller à la page web ou Cliquer sur un élément
Cliquez sur l’action Aller à la page web (ou sur une action Cliquer sur un élément) pour accéder au menu des paramètres >> puis ouvrez l’onglet Options.
Pour configurer le défilement automatique de la page, cochez la case Faire défiler la page vers le bas après son chargement.
Choisir la zone de défilement
Par défaut : Octoparse défilera automatiquement toute la page web.
Partiel : Certains sites comportent plusieurs zones de défilement, comme Google Maps. Pour cibler précisément la zone à faire défiler, vous pouvez choisir l’option Partiel et saisir le XPath exact de cette zone.
Astuce : Consultez ce tutoriel pour apprendre à utiliser la fonction de défilement partiel :
Faire défiler une zone précise d’une page web
Choisissez la manière dont vous souhaitez faire défiler la page
Il existe deux façons de défiler : défiler jusqu’en bas de la page ou défiler d’un écran à la fois.
Défiler jusqu’en bas de la page : Octoparse fait défiler directement jusqu’en bas sans s’arrêter au milieu. Utilisez cette option lorsque la page ne charge des éléments que lorsque vous atteignez le bas, comme par exemple les avis Google Play.
Défiler d’un écran à la fois : Octoparse défile d’un écran complet à chaque fois. Cette option est recommandée si la page charge du contenu au fur et à mesure du défilement continu.
Le défilement d’un écran à la fois fonctionne sur tous les sites, tandis que le défilement jusqu’en bas peut ne pas marcher sur certains sites spécifiques. Nous vous conseillons de tester manuellement les deux options sur votre page cible, puis de choisir celle qui fonctionne le mieux.
Configurer le temps d’attente et le nombre de défilements
Sélectionnez un temps d’attente approprié entre chaque défilement. Pour les pages qui mettent plus de temps à se charger, il est conseillé de choisir un temps d’attente plus long.
Ensuite, indiquez le nombre de fois que vous souhaitez répéter le défilement (c’est-à-dire le nombre de défilements). Il est recommandé de défiler manuellement sur la page cible au préalable afin de déterminer combien de défilements sont nécessaires pour charger toutes les informations souhaitées.
2. Ajouter directement une étape de défilement (Nouvelle fonctionnalité dans la version 8.7.6)
Cliquez sur « + » puis sélectionnez Défiler pour ajouter facilement une étape de défilement dans le flux de travail.
Configurez les options de défilement comme indiqué ci-dessus.