これで、最初のスクレイピングタスクの構築が完了し、タスクを実行して必要なデータを取得する方法がわかりました。それを次のレベルに進め、データの定期抽出、自動データエクスポート、およびAPIを使用して、毎日のスクレイピングルーチンをより効果的かつ効率的にする方法を見つけましょう。
実行スケジュールの設定
定期的にデータを抽出したいとお考えであれば、「スケジュール設定」機能がまさに最適です。
この機能を使えば、タスクを一度だけ実行することも、繰り返し実行することも可能です。たとえば、1分、5分、10分、または30分ごとに自動で実行するようにスケジュールを設定することができます。これにより、手動操作の手間を省き、大幅な時間の節約が期待できます。
1.ダッシュボードで対象のタスクを見つけ、「次の実行」欄にある「未設定」をクリックします。上に表示されるのがクラウドスケジュール用、下がローカルスケジュール用の設定となります。
2.ご希望に応じて、タスクの実行頻度を選びます。
3.設定内容は保存して、後で再利用することも可能です。設定に名前を付けて「保存」をクリックすれば、他のタスクにもそのスケジュール設定を簡単に適用できます。
4.すべての設定が完了したら、「スケジュール起動」をクリックして、すぐにスケジュールに従ってタスクの実行を開始できます。
5.タスクがスケジュール設定されると、「次の実行」に次回の実行予定時刻が表示されます。
6.スケジュールを設定したら、ダッシュボードの「そのほか」アイコンをクリックして「ローカル収集」や「クラウド収集」を選択することで、簡単にオンとオフを切り替えることができます。ここで、「スケジュール開始」または「スケジュール停止」を選択できます。
自動データエクスポート(クラウドデータ)
データベースへのデータのエクスポートは、自動化してスケジュールすることもできます。定期的にデータをデータベースにエクスポートする必要がある場合、データエクスポートのスケジュールを設定すると、大量の作業を節約できます。
1.タスクのクラウドデータを読み込みます。
2.「エクスポート」をクリックします。
3.「データベースへの自動エクスポート」をクリックして開き、使用しているデータベースの種類を選択します。
4.データベースに接続するための情報を入力して、「接続テスト」をクリックして、データベースが正常に接続されているかどうかをテストします。。
そして、下にスクロールします。データ項目のマッピングに進み、エクスポートの希望間隔を選択することができます。(最大間隔は24時間となります。)
5.自動エクスポートモニターでタスクを見つけることができます。
API
Octoparse APIを使用すると、スクレイピングタスクを実行したり、抽出したデータを取得したり、独自のアプリケーションと連携してプログラムでタスクを編集したりすることもできます。
Zapier
Zapierを使えば、スクレイピングしたデータをGoogle Drive、Googleスプレッドシート、Dropboxなどの他のアプリケーションと簡単に連携できます。プログラミングは不要です。詳しくはこちらをご確認ください:Zapierに接続する方法
次へ
レッスン7:まとめ!最初のスクレイピングタスクを構築する