本記事では、Octoparseを使用して、ウェブページのURL、ページタイトル、メタディスクリプション、メタキーワード、HTMLソースコードなどのページレベルのデータを抽出する方法についてご説明します。
ステップ1. ワークフローから「データを抽出」を選択する
ステップ2. 「データプレビュー」セクションに移動し、「フィールドを追加」ボタンをクリックする
ステップ3. 「該当ページの情報を追加」から対象のデータフィールドを選択する
ステップ4(任意). フィールド名をダブルクリックしてデータフィールドの名前を変更する