Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!
Online-Rezensionen können nicht nur dem Käufer helfen, das richtige Produkt zu wählen, sondern auch dem Verkäufer helfen, sein Produkt und seinen Service zu verbessern. In diesem Tutorial zeigen wir Ihnen, wie man die Daten von Amazon.com scrapen kann.
Für Produkte-Scraping in Amazon können Sie unsere vorgestellte Vorlage verwenden, die auf der Startseite liegt, oder diesem Tutorial folgen, um die Aufgabe von Anfang an zu erstellen.
Um anzuzeigen, würden wir diese URL als ein Beispiel verwenden: https://www.amazon.com/Kindle-Paperwhite-Waterproof-Storage-Special/dp/B07PS737QQ/ref=sr_1_2_sspa?dchild=1&keywords=Kindle+E-readers&pd_rd_r=b8c0eaa7-acb5-41d5-b8bc-cf91731b15f1&pd_rd_w=BdW2G&pd_rd_wg=eeTzE&pf_rd_p=b9deb6fa-f7f0-4f9b-bfa0-824f28f79589&pf_rd_r=2NWW91Z6XMD4KT7W8TM2&qid=1634004515&sr=8-2-spons&psc=1&spLa=ZW5jcnlwdGVkUXVhbGlmaWVyPUFVNDcwVDRSWENBVzImZW5jcnlwdGVkSWQ9QTAzMzA0NzIxRlc5V1FDM1NaQ0pKJmVuY3J5cHRlZEFkSWQ9QTA0ODM4NTAxVElDNUJKTFFaRFpWJndpZGdldE5hbWU9c3BfYXRmJmFjdGlvbj1jbGlja1JlZGlyZWN0JmRvTm90TG9nQ2xpY2s9dHJ1ZQ==
Hier sind die wichtigsten Schritte in diesem Tutorial. [Sie können hier die Aufgabendatei herunterladen]
Schritt 1: „Go To Web Page“ - Öffnen Sie die Ziel-Webseite
Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start“.
Schritt 2: Klicken Sie auf den Button „See all reviews“.
Scrollen Sie auf der Seite nach unten, um den Button „See all reviews“ zu finden
Klicken Sie darauf und wählen Sie „Klicken URL“ in den Aktion-Tipps.
Schritt 3: Detektieren die Webseite automatisch, um den Workflow zu generieren
Selektieren Sie „Auto-detect web page data“.
Warten Sie auf die Detektion - Kreuzen Sie nicht „Add a page scroll“ an - Klicken Sie auf „Create workflow“.
Tipps!
Manchmal kann es vorkommen, dass Sie sich mit einer Roboter-Detektion treffen, der die Eingabe eines Sicherheitscodes verlangt. In diesem Fall können Sie auf den „Neu laden„ Button klicken, um die Seite zunächst neu zu laden. Wenn es immer noch nicht funktioniert, können Sie versuchen, in den Browsermodus zu wechseln, indem Sie auf den Button oben rechts im integrierten Browser klicken. Und geben Sie dann den Code ein, um die Detektion zu bestehen. Klicken Sie abschließend auf , um wieder in den Auswahlmodus zu wechseln.
Schritt 4: Einstellung der AJAX-Wartezeit in der Aktion „Click to Paginate“
Klicken Sie auf „Click to Paginate“, um das Timeout als 10s einzustellen.
Schritt 5: Überprüfen Sie Daten und Workflow
Gehen Sie zur Datenvorschau, um zu überprüfen, ob die aktuellen Daten extrahiert werden. Klicken Sie doppelt auf die Kopfzeile, um das Feld umzubennen oder klicken Sie auf ... zum Löschen eines Feldes.
Der endgültige Workflow sieht wie folgend aus. Wenn alles in Ordnung ist, können Sie weiter gehen, um Ihre Aufgabe auszuführen.
Schritt 6: Extraktion ausführen - Ihre Aufgabe ausführen und Daten erhalten
Klicken Sie auf „Run task on your device“, um die Aufgabe auf Ihrem eigenen Gerät auszuführen, oder wählen Sie „Run task in the cloud“, um sie in der Cloud auszuführen (nur für Premium-Benutzer).
Hier sind Daten für die Beispielaufgabe.
Nach dem Sammeln von Bewertungen können Sie Ihre Erfahrung mit unserem neuen VOC-Produkt verbessern! Analysieren Sie einfach das Feedback und erstellen Sie schnell Berichte. Maximieren Sie Ihr Verständnis mühelos mit VOC.