Google Playは、モバイルアプリのレビューを収集するのに適したウェブサイトです。レビューを通して、ユーザーはどのアプリを使うかについてより良い選択ができ、開発者はアプリの改善点を把握できます。
このチュートリアルでは、Google Playからアプリのレビューをスクレイピングする方法を紹介します。
Octoparseのホーム画面から、使いやすい「テンプレートタスク」をご利用いただけます。必要なのは、いくつかのパラメータを入力するだけで、タスクはすぐに実行できる状態になります。 詳細はこちらをご覧ください: テンプレートタスクとは?
チュートリアルに沿って作業する場合は、次のURLを使用してください:
Octoparseを使用して、各アプリの詳細ページからレビューしたユーザー名、投稿時間、レビュー内容などのデータをスクレイピングします。
主な手順は右のメニューに表示されています。サンプルのタスクファイルはこちらからダウンロードできます。
1. ウェブページを開く - ターゲットウェブページを開く
2. すべてのレビューを表示 をクリック - すべてのレビューを表示する
ワークフローは次のようになります:
3. ウェブページのデータを自動検出 - ワークフローを作成する
ウェブページのデータを自動検出をクリックします。
操作提案のワークフローを生成をクリックします。
データプレビューセクションのデータフィールドを確認します。不要なフィールドは削除したり、必要に応じてフィールド名を変更できます。
4. スクロールページのXPathを変更 - スクロールモードを正確に指定する
ページをスクロールをクリックします。
スクロールモードを子階層に設定します。
XPathに //div[@class='fysCi'] をします。
1画面ずつスクロールを選択し、繰り返し回数に 1000 を入力します。
新しい内容がない場合、ループを終了 にチェックします。
保存をクリックします。
最終的なワークフローは次のようになります:
注意: XPathの詳細は、以下のチュートリアルをご確認ください: XPathとは?OctoparseでXPathを利用する方法は?
5. 抽出を実行する - タスクを実行してデータを取得する
保存をクリックします。
右上の実行をクリックします。
コンピュータでタスクを実行する場合は、ローカル抽出の一つのモードを選択してください。クラウドでタスクを実行する場合(プレミアムユーザーのみ)は、クラウド抽出の一つのモードを選択してください。
こちらがサンプルの出力です。