こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
時には、ウェブサイトから画像のURLをスクレイプする必要がありますが、通常のサイズの画像ではなく、サムネイル画像のURLしか取得できないことがあります。
以下は、Amazonからスクレイプした画像です。ご覧の通り、画像は小さすぎて見えません。
通常のサイズの画像を取得するには、既に持っている画像のURLを修正するだけで済みます。以下の手順に従って修正します。
フルサイズの画像URLとサムネイルURLの違いを観察する
ほとんどの場合、異なるサイズのURLにはわずかな違いがあります。違いを見つけて、Octoparseの「データを再フォーマット」機能を使用してサムネイルURLをフルURLに再フォーマットします。
例えば、AmazonのサムネイルURLは次のようになっています。
フルサイズの画像URLは次のようになります。
サムネイルURLには 「SS36」が含まれていることがわかります。URLから削除できます。
「ほかのオプション(...)」ボタンをクリックし、「データを再フォーマット」をクリックします。
「置換」のステップを追加します。
「置換」ボックスに「SS36」と入力し、マッチをクリックして確認します。
結果が必要なURLであることがわかったら、「保存」をクリックして保存します。
設定を保存するために「保存」をクリックします。
これで必要なフルサイズの画像URLを取得できます。