Zum Hauptinhalt springen

Was ist Cloud-Extraktion?

Vor über 2 Wochen aktualisiert

Octoparse bietet eine leistungsstarke Cloud-Extraktion für Premium-Benutzer ( im Standard & Professional-Plan), um Ihre Aufgaben 24/7 auszuführen.

Mit Cloud-Extraktion sind Ihre Aufgaben geteiltet zu mehren Server-IPs auszuführen, ohne Octoparse auf dem Destkop oder Ihr Computer während der Extraktion geöffnet zu bleiben.Damit wird die Extraktion nimmer von den lokalen Internet oder Hardware-Bedingungen beschränkt. Die exhtrahierten Daten werden in der Cloud gespeichert und können jederzeit abgerufen werden.

Die Aufgabenplanung wird auch durch die Octoparse Cloud-Extraktion unterstützt. Um die aktuellsten Informationen abzurufen, können Sie Ihre Aufgabe so oft ausführen, wie Sie möchten.


1. Ausführung einer Aufgabe mit Cloud-Extraktion

Wenn Sie die Konfiguration Ihrer Aufgabe fertiggemacht haben, klicken Sie auf „Run” und wählen Sie „Run task in the Cloud”, um die Aufgabe in der Cloud auszuführen.

Sobald eine Aufgabe in der Cloud ausgeführt wird, ändert sich das Status im Dashboard in „Laufend”.


2. Batch-Ausführung von Aufgaben mit Cloud-Extraktion

Wählen Sie einen Batch von Aufgaben aus, klicken Sie auf „Cloud-Lauf starten” und die Aufgaben werden gemeinsam in der Cloud ausgeführt.


3. Einstellungen der Cloud Extraktion

Octoparse Cloud-Extraktion ermöglicht die gleichzeitige Ausführung mehrerer Aufgaben.

Im Standardplan können Sie bis zu 6 gleichzeitige Läufe in der Cloud ausführen (6 Cloud-Server verfügbar), und im Professional-Plan können Sie 20 gleichzeitige Aufgaben ausführen (20 Cloud-Server verfügbar). Um die maximale Anzahl der parallel ausgeführten Aufgaben festzulegen, klicken Sie auf und wählen Sie eine gewünschte Zahl aus den Dropdown-Optionen:

Tipps:

  • Wie ist die Leistung von Cloud-Extraktion?

Die Datenextraktion in der Cloud kann wesentlich schneller sein als die lokale Extraktion, vorausgesetzt, die Aufgabe ist teilbar (Nicht wissen, was teilbar bedeutet? Hier bekommen).

Eine aufteilbare Aufgabe kann in mehrere Teilaufgaben unterteilt werden, die gleichzeitig auf mehreren Knoten ausgeführt werden können, wodurch die Extraktion beschleunigt wird.

  • Kann ich mehr Aufgaben ausführen als die maximal zulässige Anzahl von Cloud-Knoten?

Ja, das ist möglich. Einige der Aufgaben werden jedoch in eine Warteschlange gestellt, bis nach Abschluss der früheren Aufgaben weitere Cloud-Knoten verfügbar sind.


4. Aufgabenplanung in der Cloud

  • Für eine einzige Aufgabe

Wenn Sie mit der Konfiguration Ihrer Aufgabe fertig sind, klicken Sie auf „Starten” und wählen Sie „Automatisierungszeitpläne”.

Wählen Sie aus, wie oft Sie es ausführen möchten: Einmal/ Wiederholen (Minuten, Stündlich, Täglich, Wöchentlich, Monatlich unterstützt). Stellen Sie die Uhrzeit und das Datum nach Ihrem Bedarf ein. Klicken Sie auf „Einschalten” und die Aufgabe wird wie geplant ausgeführt.

Die Zeit für die nächste Ausführung finden Sie im Dashboard in der Spalte „Nächster Lauf”.

Und wenn Sie eine geplante Aufgabe abbrechen möchten, klicken Sie auf „Mehr”, wählen Sie „Zeitplan AUS” unter „Cloud-Läufe”-Option.

  • Für eine Gruppe von Aufgaben

Um einen Zeitplan für eine Aufgabe-Gruppe festzulegen, wechseln Sie in den Modus „Aufgabengruppe”, wählen Sie eine Aufgabengruppe aus und dann klicken Sie auf das Uhr-Symbol, um einen Zeitplan für die Aufgabengruppe einzustellen.


5. Häufig gestellte Fragen

  • Was ist die Standardzeitzone für die Octoparse Cloud-Plattform?

Die nächste Ausführungszeit, die in der Aufgabenliste angezeigt wird, basiert standardmäßig auf Ihrer lokalen Zeitzone (gemäß Ihrem Betriebssystem). Wenn Sie jedoch die Aufgabe so erstellt haben, dass „aktuelles Datum und Uhrzeit“ in der Cloud extrahiert werden, werden das extrahierte Datum und die Uhrzeit unabhängig von Ihrem tatsächlichen Standort in UTC±00:00 angegeben.

Sie können die Zeitzone der Daten konvertieren, indem Sie dieser Anleitung folgen: Umwandlung des aktuellen Zeitfeldes in eine andere Zeitzone.

  • Warum erhalte ich immer Dupliakten, wenn eine Aufgabe mehrmals ausgeführt wurde?

Octoparse speichert die aus allen Durchläufen gesammelten Daten zusammen und erkennt Duplikate. Duplikate werden automatisch aus der Cloud gelöscht.

Beispiel: Octoparse sammelt beim ersten Lauf 100 Zeilen ohne Duplikate. Wenn Sie alle Daten für die Aufgabe überprüfen, sind 100 Zeilen vorhanden.

Wenn die Website beim zweiten Lauf der Aufgabe 5 neue Datenzeilen hinzufügt, erfasst die Aufgabe 105 Zeilen mit 100 Duplikaten, und nur die 5 neuen Zeilen werden gespeichert. Die 100 doppelten Zeilen werden automatisch gelöscht.

Wenn Sie alle Daten (aus dem ersten und zweiten Durchlauf) der Aufgabe überprüfen, sehen Sie insgesamt 105 Datenzeilen. Wenn Sie die Daten für den zweiten Durchlauf überprüfen, finden Sie nur 5 Zeilen.

Wenn Sie alle Duplikate behalten möchten, lesen Sie bitte dieses Tutorial: Wie behalte ich die Duplikaten in der Cloud-Läufe?

  • Was sind gleichzeitige Cloud-Läufe?

Gleichzeitige Cloud-Lauf bezeichnet die maximale Anzahl von Aufgaben, die Sie gleichzeitig ausführen können. Wenn Sie den Standard-Plan abonnieren, können Sie maximal 6 gleichzeitige Läufe in der Cloud ausführen, da Sie über bis zu 6 Cloud-Knoten verfügen (eine Aufgabe benötigt mindestens einen Knoten, um ausgeführt zu werden).

Bitte beachten Sie, dass es vorkommen kann, dass Ihre Aufgaben in eine Warteschlange gestellt werden, da eine aufteilbare Aufgabe möglicherweise mehr oder alle Knoten in Ihrem Konto belegt. Sobald eine Aufgabe alle Knoten belegt, müssen die anderen Aufgaben warten, bis die Cloud-Ressource für ihre Ausführung verfügbar ist.

  • Was beeinflusst die Anzahl der gleichzeitigen Läufe?

Die wichtigsten Faktoren, die Ihre gleichzeitigen Ausführungen beeinflussen, sind:

1) die Anzahl Ihrer Cloud-Knoten;

2) die Anzahl der Knoten, die Ihre ausgeführten Aufgaben belegen.

Beispiel: Sie haben den Standard-Plan, was bedeutet, dass Sie über bis zu 6 Cloud-Knoten verfügen. Wenn Sie 6 Aufgaben haben und diese Aufgaben bei der Ausführung jeweils nur 1 Knoten belegen, werden 6 Aufgaben gleichzeitig ausgeführt.

Wenn eine der Aufgaben 2 Knoten belegt (sie ist in 2 oder mehr Unteraufgaben aufgeteilt), werden nur 4 Aufgaben gleichzeitig ausgeführt. Wenn die Aufgabe 6 Knoten belegt, wird nur eine Aufgabe ausgeführt usw.

Hat dies deine Frage beantwortet?