メインコンテンツにスキップ

Google Playからレビューをスクレイピングする

2年以上前に更新

Google Playは、モバイルアプリのレビューを収集するのに適したウェブサイトです。レビューを通して、ユーザーはどのアプリを使うかについてより良い選択ができ、開発者はアプリの改善点を把握できます。

このチュートリアルでは、Google Playからアプリのレビューをスクレイピングする方法を紹介します。

Octoparseのホーム画面から、使いやすい「テンプレートタスク」をご利用いただけます。必要なのは、いくつかのパラメータを入力するだけで、タスクはすぐに実行できる状態になります。 詳細はこちらをご覧ください: テンプレートタスクとは?

チュートリアルに沿って作業する場合は、次のURLを使用してください:

Octoparseを使用して、各アプリの詳細ページからレビューしたユーザー名、投稿時間、レビュー内容などのデータをスクレイピングします。

主な手順は右のメニューに表示されています。サンプルのタスクファイルはこちらからダウンロードできます。


1. ウェブページを開く - ターゲットウェブページを開く

  • ホーム画面にページのURLを入力し、スタートをクリックします。

2. すべてのレビューを表示 をクリック - すべてのレビューを表示する

  • ウェブページのすべてのレビューを表示をクリックします。

  • 操作提案で選択した要素をクリックするを選択します。

ワークフローは次のようになります:


3. ウェブページのデータを自動検出 - ワークフローを作成する

  • ウェブページのデータを自動検出をクリックします。

  • 操作提案のワークフローを生成をクリックします。

  • データプレビューセクションのデータフィールドを確認します。不要なフィールドは削除したり、必要に応じてフィールド名を変更できます。


4. スクロールページのXPathを変更 - スクロールモードを正確に指定する

  • ページをスクロールをクリックします。

  • スクロールモードを子階層に設定します。

  • XPathに //div[@class='fysCi'] をします。

  • 1画面ずつスクロールを選択し、繰り返し回数に 1000 を入力します。

  • 新しい内容がない場合、ループを終了 にチェックします。

  • 保存をクリックします。

最終的なワークフローは次のようになります:

注意: XPathの詳細は、以下のチュートリアルをご確認ください: XPathとは?OctoparseでXPathを利用する方法は?


5. 抽出を実行する - タスクを実行してデータを取得する

  • 保存をクリックします。

  • 右上の実行をクリックします。

  • コンピュータでタスクを実行する場合は、ローカル抽出の一つのモードを選択してください。クラウドでタスクを実行する場合(プレミアムユーザーのみ)は、クラウド抽出の一つのモードを選択してください。

こちらがサンプルの出力です。

こちらの回答で解決しましたか?