Lorsque vous exécutez une tâche plusieurs fois, Octoparse peut afficher des doublons sur le tableau de bord :
En effet, Octoparse stockera les données de toutes les séries ensemble et reconnaîtra les doublons. Les doublons seront automatiquement supprimés du nuage.
Les doublons sont des lignes de données qui sont identiques dans toutes les colonnes. Si vous souhaitez conserver toutes les lignes de données de chaque exécution, vous pouvez essayer d'ajouter la date et l'heure actuelles en tant que champ dans la tâche.
Allez dans l'aperçu des données, cliquez sur le bouton Ajouter un champ personnalisé et choisissez Date et heure actuelles.
Le champ sera ajouté comme suit :
Le champ indique la date et l'heure auxquelles cette ligne de données a été supprimée. Étant donné que chaque ligne est extraite à un moment différent, chaque ligne est différente aujourd'hui. Il n'y aura pas de doublons.