クローラビリティとインデクサビリティについて

クローラビリティとはページが検索エンジンにクロールされやすいかのことを言います。

同じような用語にインデクサビリティがあります。これはクロールされた後にインデックスされやすいかのことです。

クローラビリティを高めるために

満たすべき最低条件

Googlebot がブロックされていないこと(1)

これは以下が該当します。

  • robots.txtでブロックしている
  • BASIC認証などアクセスするためにログインが必要

サイトマップをサーチコンソールに送信

サーチコンソールのサイトマップ送信画面

サーチコンソールにログインしてサイドバーの「サイトマップ」からサイトマップを送信します。

ワードプレスであれば /wp-sitemap.xml にサイトマップが自動的に作成されます。カスタマイズしたい場合はプラグインを用いると良いでしょう。

内部リンクをする

内部リンクに使用するアンカー テキストにより注意を払うと、ユーザーや Google がサイトの内容を簡単に把握できるようになるとともに、サイト上の別のページを見つけやすくなります。(2)

検索エンジンは内部リンクを辿ってページを見つけることもあります。リンク元のページがインデックスされていることが前提ですが、正しく内部リンクを張ることでクロールされやすくなります。

ただし、無関係の記事からリンクを張るのは避けてください。ユーザも検索エンジンも混乱してしまいます。

インデクサビリティを高めるために

満たすべき最低条件

ページが機能していること(1)
Google は、HTTP 200 (success) ステータス コードが返ってくるページのみをインデックスに登録します。

インデックス登録可能なコンテンツがページに含まれていること(1)

  • テキスト コンテンツが Google 検索でサポートされているファイル形式である。
  • コンテンツがスパムに関するポリシーに違反していない。

どちらも普通にWEBページを公開していてアクセスできる(つまりHTTPステータスコードが200)のなら気にしなくて良いです。

グーグルは一般的なファイル形式をサポートしていますし、過剰なSEO手法を用いなければスパムになることもありません。

サーチコンソールでインデックス登録をリクエスト

サーチコンソールのインデックス登録リクエスト画面

サーチコンソールにログインしてサイドバーの「URL検査」または上部の「***内のすべての URL を検査」(***はそのプロパティのURL) にインデックス登録を促したいURLを入力。その後、「インデックス登録リクエスト」をクリックします。

インデックスを促すだけですので保証はできません。リクエストしてもダメだったとしたら低品質な記事だと判断されたと思った方が良いでしょう。その場合はコンテンツを見直してください。

HTMLタグを正しく使う

  • hタグを順番に使う
  • 並列にはulタグ、順序にはolタグを使う
  • 表形式の見出しにはthタグを使う

上記のようなことが該当します。上記を守らずとも認識してくれますが、検索エンジンの理解を助けるものがタグですので正しく使った方が良いに決まっています。

正しいHTMLタグはwebアクセシビリティにとっても重要です。神経質になる必要はありませんが、気に掛けるとより良いサイトになります。

 


参考サイト
  1. https://developers.google.com/search/docs/essentials/technical?hl=ja
  2. https://developers.google.com/search/docs/crawling-indexing/links-crawlable?hl=ja