XPath è un linguaggio che consente di individuare elementi specifici da una pagina web. La modifica di XPath in Octoparse funziona molto bene con maggiore flessibilità e precisione rispetto all'XPath generato automaticamente facendo clic sugli elementi durante la configurazione dell'attività.
Octoparse ti consente di personalizzare l'elemento XPath in modo da poter individuare con precisione i dati che vuoi estrarre. Ciò aiuta a risolvere qualsiasi problema come dati mancanti, pagine saltate, campi vuoti e duplicati.
Dove posso modificare l'XPath in Octoparse?
Cliccare su l'icono altro del campo dati nell'anteprima dei dati dove vuoi fare la modifica
Selezionare Customize XPath
Inserire l'XPath modificato nella casella di testo Matching XPath
Anche sotto le azioni Loop Item, Pagination or Click Item, si può trovare la casella per XPath nelle impostazioni generali. Inserire il nuovo XPath e fare clic su Apply per salvare le modifiche.
Come scrivere un XPath?
Se non conosci XPath, potresti dover prima acquisire alcune conoscenze elementari sull'HTML. XPath individua gli elementi in base a tag e attributi. Quindi, prima di iniziare a scrivere il tuo XPath, dovresti prima ispezionare la struttura HTML della pagina. (Scopri di più sull'HTML)