最近急増しているGoogleサーチコンソールによるインデックス未登録ですが、種類が2種類あるのはご存知ですか?
・クロール済み - インデックス未登録
・検出 - インデックス未登録
前者の「クロール済み - インデックス未登録」は先日出させていただいた記事(Google「インデックス未登録」が急増している!)でも取り扱ったもので、Googleのクローラーはサイトに来ているけれどインデックスは未登録になってしまうというものです。
一方で「検出 - インデックス未登録」という後者のインデックス未登録も増えており、別の対策が必要になっています。
検出 - インデックス未登録とは?
今回取り扱う「検出 - インデックス未登録」というのは、簡単に言うとGoogleのクローラーが見つけられていないページという事です。
・内部リンクが少なく孤立している
・サーバーへの負荷緩和
・URLや内容が重複している
・内容がヘルプフルではない
クローラーがページを見つけられない理由としては大きく4つの原因が考えられます。
1つ目は「内部リンクが少なくてページが孤立している」という理由です。
Google は、ページの関連性を判断し、クロールする新しいページを見つける際にリンクをシグナルとして使用します。
Googleはクロールするページを見つける時にリンクをシグナルとして使用するため、内部リンクが集中していないようなページの場合には、クローラーが気づかずにページがクロールされない場合があります。
そのため、ページが見落とされてインデックスされていないという事象が発生します。
2つ目は「サーバーへの負荷緩和」という理由です。
Google では、Googlebot によってご利用のサーバーに負担をかけることなく、サイトをクロールしたいと考えています。また、サーバーに過負荷をかけずに重要なコンテンツ全体をカバーするように配慮されます。
Googleはクロールする際にサイトのあるサーバーに対して負荷をかけないようにクロールするため、コンテンツ量が多かったりして負荷がかかりそうなケースでは負荷を考慮してクロールしないページが出てきたりします。
大規模なサイトに起こりやすく、一部の優先度が低いページがクロールの対象から漏れてしまっているという形です。
3つ目は「URLや内容が重複している」という理由です。
こちらはいわゆる「カニバリ」とは違って、例えば、意図せず似たようなURLが生成されてしまっていたりして、同じ内容のページが作られてしまっているようなケースです。
URLの末尾にパラメーターが付いたページだったり、大文字・小文字が違っていたり、過去に作成した古い固定ページを公開したまま、似た新しいページを公開してしまったり、様々な原因で類似の重複したページができてしまう可能性があります。
4つ目は「内容がヘルプフルではない」という理由です。
こちらは「クロール済み - インデックス未登録」になる理由としても挙げられますが、低品質なページの場合、そもそもクロールされないというケースもあります。
そのため、ヘルプフルではないコンテンツもこちらの「検出 - インデックス未登録」に入っている可能性は充分考えられます。
このように「検出 - インデックス未登録」は4つの要因で増えている可能性が高いです。
検出 - インデックス未登録の対策法
検出 - インデックス未登録に対しての対策法についてですが、原因によって対策方法も変わってきます。
①内部リンクが少なくてページが孤立している場合
インデックス未登録の原因が、リンクが少ない事に起因する場合、内部リンクを追加してインデックスの再登録を申請します。
内部リンクを追加する場合には、なるべく関連性の高いページに対してリンクを貼るのが望ましいですが、どのページ同士が関連があるかを探すのって意外と面倒な作業です。
パスカル(競合分析)→ SEO作業 (改善ページとキーワード入力)→ SEO作業レポート
そこで、パスカルを使ってリンクを張りたいページに対してSEO作業の「SEO作業-レポート」出してもらうと、おすすめの発リンク・被リンクが分かりやすいです。
SEO作業レポートを開いてもらうと「サイト内リンク」という項目があり、その中には発リンクの追加、被リンクの追加という項目が出てくる場合があります。
もちろん出てこない場合もありますが、内部リンクが充分ではないページに関してはサイト内リンクの修正項目も出やすいはずなので、チェックしておすすめのページ同士でリンクを追加していきましょう。
内部リンクを追加したら、サーチコンソールにURLを入れてページを検索し「インデックス登録をリクエスト」でクロールしてもらうように忘れずに呼びかけましょう。
②サーバーへの負荷緩和
サーバーの負荷緩和が原因になっている事については、サーバーの性能やサイト自体のコンテンツ量が多いというのが根本の要因なので、サーバーを増強したり、コンテンツを厳選する事が根本解決を目指すためには必要な対策法です。
ただし、Googleにもクロールの限界があって、一時的にクロールできていないだけというケースもあるため、サーチコンソールで「インデックス登録をリクエスト」を申請するだけでもインデックスされるケースがあります。
③URLや内容が重複している
URLや内容が重複しているケースは、特にインデックスさせる必要もないので、似たURLやページができてしまう原因を突き止めて対策を行い、既にできてしまっているURLについては削除するのが望ましいです。
④内容がヘルプフルではない
内容がヘルプフルではない場合の対策法としては、記事内容を修正するかページを削除するかという選択になるかと思います。
ただし、そもそも内容が少なかったり、記事の内容が薄かったりするケースが多いので、修正しようと思うと意外と工数がかかることも多いです。
そのため、そういった場合は記事を削除してしまい、新規で記事を作った方が余計な手間がかからず、パスカルの記事作成レポートに沿って書けばいいので楽だと思います。
実際に対策してみた結果...
当社でも「検出 - インデックス未登録」となっていたページがあったので、実際に対策してみました。
ページを見たところ、URLは独立したもので、中身はしっかりと書いてあるページだったので、恐らく内部リンクの貼り方が適切ではない事が原因だと判断して、それぞれのページに発リンクと被リンクを設定して貼り付けました。
リンクは発リンク・被リンクともに3件程度増やしています。
対策を行った結果としては、ほとんどのページがインデックス登録をされ、サイトへの流入も戻りました。インデックスされたのは申請してから2〜3日後です。
ただし、この辺りの再クロールやインデックスにかかる時間はサイトによるため、あくまで目安として参考にしていただければと思います。