すべてのコレクション
ヘルプ
該当ページのデータ(メタデータ、URL、タイトル、HTML)を取得する方法
該当ページのデータ(メタデータ、URL、タイトル、HTML)を取得する方法
一週間前以上前にアップデートされました

本記事では、Octoparseを使用して、ウェブページのURL、ページタイトル、メタディスクリプション、メタキーワード、HTMLソースコードなどのページレベルのデータを抽出する方法についてご説明します。

ステップ1. ワークフローから「データを抽出」を選択する

ステップ2. 「データプレビュー」セクションに移動し、「フィールドを追加」ボタンをクリックする

ステップ3.該当ページの情報を追加」から対象のデータフィールドを選択する

ステップ4(任意). フィールド名をダブルクリックしてデータフィールドの名前を変更する

  • ページURL: 現在のページのURL

  • ページタイトル: 現在のページのタイトルで、ウェブページの短い説明で、ブラウザのウィンドウの上部に表示されます。

  • メタディスクリプション: 現在のページのメタディスクリプションタグで、ページの要約が含まれています。

    mceclip3.png

  • メタキーワード: 現在のページのメタキーワードタグ

    mceclip4.png

  • ソースコード: ウェブページの完全なHTMLコード

こちらの回答で解決しましたか?