ヘルプセンター

該当ページのデータ(メタデータ、URL、タイトル、HTML)を取得する方法

2023年10月3日

本記事では、Octoparseを使用して、ウェブページのURL、ページタイトル、メタディスクリプション、メタキーワード、HTMLソースコードなどのページレベルのデータを抽出する方法についてご説明します。

ステップ1. ワークフローから「データを抽出」を選択する

ステップ2. 「データプレビュー」セクションに移動し、「フィールドを追加」ボタンをクリックする

ステップ3. 「該当ページの情報を追加」から対象のデータフィールドを選択する

ステップ4(任意). フィールド名をダブルクリックしてデータフィールドの名前を変更する

ページURL: 現在のページのURL
ページタイトル: 現在のページのタイトルで、ウェブページの短い説明で、ブラウザのウィンドウの上部に表示されます。
メタディスクリプション: 現在のページのメタディスクリプションタグで、ページの要約が含まれています。
メタキーワード: 現在のページのメタキーワードタグ
ソースコード: ウェブページの完全なHTMLコード

関連記事