Vai al contenuto principale

Guida AJAX

Aggiornato più di un anno fa

Molti siti web applicano la tecnica AJAX per creare pagine web migliori, più veloci e più interattive. Octoparse può gestire facilmente le pagine con AJAX. In questo articolo ti presenteremo come risolvere AJAX in Octoparse.


Cos'è AJAX

AJAX, che significa esattamente Asynchronous JavaScript And XML, consente a una pagina web di aggiornare le informazioni senza ricaricare l'intera pagina e di richiedere/ricevere dati dopo il caricamento della pagina. Quando viene utilizzato AJAX, solo parte della pagina viene aggiornata quando si premono pulsanti come il tasto "Pagina successiva" o "Carica altro" sulla pagina web.


Come faccio a sapere se a una pagina web viene il caricamento AJAX?

Quando si esegue un'azione di clic per caricare i dati sul web, è piuttosto semplice capire se viene utilizzato il caricamento AJAX. Quando viene applicato AJAX, la pagina web carica i contenuti nuovi senza ricaricare l'intera pagina. Pertanto, l'icona di ricarica è un buon indicatore per distinguere se è stato utilizzato AJAX.

  • Quando è coinvolto AJAX, la pagina non dovrebbe ricaricarsi quando viene caricato contenuto aggiuntivo. Quindi in questo caso NON dovrebbe esserci alcun segnale di ricarica.

walmart_page_loading.gif
  • Se non viene applicato il caricamento AJAX, dovresti vedere la pagina ricaricarsi con l'icona di ricarica in esecuzione quando fai clic per caricare ulteriori informazioni.

blog_page_loading.gif


Come gestire AJAX in Octoparse?

Octoparse utilizza il ricaricamento come segnale durante l'esecuzione dell'elemento cliccato. Se la pagina si ricarica dopo aver fatto clic su un elemento, verrà eseguita l'azione successiva al termine della ricarica. Ma poiché le pagine con AJAX non si ricaricano, Octoparse non riceve il segnale per agire e rimarrebbe bloccato. Quindi dobbiamo impostare un timeout per AJAX per l'azione Fai clic su elemento o Clicca per paginare per dire a Octoparse di passare all'azione successiva quando viene raggiunto il timeout. Esistono due modi in cui AJAX può essere gestito in Octoparse.

Rilevamento automatico AJAX

Octoparse imposterebbe automaticamente il timeout AJAX quando viene rilevato AJAX per la pagina.

Ad esempio, il sito web di Amazon utilizza il caricamento AJAX per caricare la pagina successiva. Pertanto, quando scegliamo di fare clic sul pulsante della pagina successiva, Octoparse imposta automaticamente il timeout AJAX per l'azione.

Se hai bisogno di un timeout più lungo o più breve, fai semplicemente clic sul menu a discesa e scegli quello che desideri.

Configura AJAX manualmente

Quando un'attività viene creata manualmente o se Octoparse non riesce a rilevare AJAX, è anche possibile configurarla manualmente facendo clic sulla casella Clicca elemento o Clicca per paginare. Puoi trovare le impostazioni AJAX nelle Opzioni e selezionare "Carica con AJAX" per impostare il timeout desiderato.

APPUNTO: Si prega di impostare un timeout per AJAX abbastanza lungo per caricare le informazioni necessarie.


Considera l'utilizzo del timeout AJAX per le pagine Web senza AJAX

Anche per le pagine che non utilizzano AJAX, il timeout AJAX può comunque essere utilizzato per migliorare il tempo di attesa prolungato per alcune pagine. Ad esempio, se hai una pagina che impiega un'eternità a caricarsi, molto tempo dopo che le informazioni necessarie sono state caricate, potresti voler utilizzare il timeout AJAX per "forzare" Octoparse a passare al passaggio successivo invece di fare in modo che Octoparse attenda fino a quando il caricamento della pagina termina.

Hai ricevuto la risposta alla tua domanda?