こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
タスクを複数回実行する場合、Octoparseのダッシュボードに重複が表示されることがあります:
これは、Octoparseがすべての実行からスクレイピングされたデータをまとめて保存し、重複を認識するためです。重複はクラウドから自動的に削除されます。
重複は、すべての列で同じデータ行です。各実行からすべてのデータ行を保持したい場合は、タスクに現在の時刻をフィールドとして追加してみることができます。
データプレビューに移動し、「フィールドを追加」ボタンをクリックし、現在の時刻を追加を選択します。
次のようにフィールドが追加されます:
このフィールドは、このデータ行がスクレイピングされた日時を示しています。各行が異なる時間にスクレイピングされるため、各行は異なるものとなります。重複は発生しません。