私たちは、Googleの検索エンジンの働きによって、WEB上で必要とする情報を発見することができます。
そして、検索エンジンの仕組みを理解することは、SEO(検索エンジン最適化)を実現するためには必要不可欠です。ですので、この記事では、検索エンジンの仕組みについて、SEOの観点から見ていきたいと思います。
そもそも検索エンジンについて知らない方は、「検索エンジンとは?」をご確認ください。
目次
1. 検索エンジンの働き
1-1.クロール
検索エンジンによるランキングは、このクロールから始まります。
世界には数十億のWEBサイトがあると言われています。この果てしない数のWEBページをクローラー(スパイダーとも呼ばれます)と呼ばれるロボットが、サイト上のリンクをたどって収集しています。
つまり、検索エンジンにランキングされるには、まずクローラーに、 WEBサイトに訪問してもらう必要があるのですね。
また、クローラーは、リンクを辿って情報収集をします。
そのため、クローラーにより多く来てもらおうとするなら、自分のサイトが、他のサイトからリンクされている必要があります。
さらに、自分のサイト内のページ同士もお互いにリンクされている必要があります。
クローラーの訪問頻度は、Googleのプログラムによって決定されますが、一般的には、検索ランキングが高かったり、他の評価の高いサイトからリンクされているサイトほど頻繁にクローラーが訪れる傾向にあります。
クローラーの訪問頻度については、Googleサーチコンソールの統計情報で確認することができます。
1-2.インデックス
クローラーが集めた膨大なWEBサイトに関する情報は、データベースに格納され、保存されます。これを「インデックス」と呼びます。
実際に、googleのデータベースにページがインデックスされているのかどうかは、検索エンジンで、
「site:確認したいサイトやページのURL」
と検索することで確認することができます。
正常なWEBページであれば、クロールされたら正常にインデックスされますが、
- WEBページの品質が著しく低い場合
- スパム攻撃を受けている場合
- 同一のページがインデックスされている場合
等の場合にはインデックスされないことがあります。
参照サイト:サイトの検索時の掲載結果を確認する
また、インデックスにはクロールされた後すぐにインデックスされるファーストインデックスと、その後の正式なプライマリーインデックスという2つのインデックスがあります。
- ファーストインデックス = クロールされてすぐの一時的なインデックス
- プライマリーインデックス = 正式なインデックス
引用元:Google Fast Track Indexing Vs. Normal Indexing
ページを公開してすぐにインデックスされていたものの、その後インデックスから消えてしまうことがあるのはこのためです。
1-3.ランキング
検索エンジンは、インデックスされた数十億ものページの中から、検索ユーザーに対して、より良い検索結果となるように、それぞれのページの順位づけを行なっています。
このことを「ランキング」といいます。
ランキングは、Google が独自のルールに基づいて、日々改善している「ランキングアルゴリズム」と呼ばれるものでが決定されます。
Googleによると、アルゴリズムは、「200を超える独自のシグナル」をもとに作っているようです。
そのシグナルは、例えば、
- WEBサイト上の語句(キーワード)
- コンテンツの新しさ
- お住まいの地域
=どこで検索しているのかによって検索結果が異なる - PageRank
=Googleが10段階でWEBページを評価したランク。非公開
が正式に挙げられていますが、それ以外の要因については非公開です。
この点について、世界的なSEO専門家のBrian DeanがCEOを務めるBACKLINKOでは、下記の205のランキング要素を推論しています。
参照サイト:Google’s 200 Ranking Factors: The Complete List
2.検索エンジン最適化(SEO)に必要な3つの施策
以上のように、検索エンジンの仕組みは、
- クロール
- インデックス
- ランキング
の3つの段階で成り立っています。つまり、これら3つに対して対策を行うことが、SEO(検索エンジン対策)ということですね。
それぞれ、詳しく説明します。
2-1. クローラー対策
クローラー対策に必要な施策を挙げていきます。
①ページを頻繁に更新する
googlebotは、新鮮な情報が大好きです。ページを更新とクローラーの回遊頻度は比例する傾向にあります。できる限り、頻繁に更新するようにしましょう。
②Fetch as googleを使う
Googleサーチコンソール内の Fetch as google という機能があります。これを使うと、まだどこからもリンクされていないサイトでも、クローラーを呼び込むことができます。1日に10回まで利用することができ、作ったばかりのサイトには力強い味方となるツールです。
参照サイト:ウェブサイト用 Fetch as Google を使用する
③ページの階層を3階層以内にする
googlebotにはクロールバジェットという、クロールに関する上限があるようです。あまりにWEBサイトの構造が深いとクロールバジェットの上限を超え、全てのページをクロールしてもらえない可能性があります。サイト内のどのページからでも、全てのページに、3クリック以内で、アクセスできるような構造の場合、クローラーに効率よく、サイト内を巡回してもらうことができます。
④リンク構造をきちんと作る
クローラーはリンクを辿ります。サイト内のリンク構造ができていなければ、たとえWEBサイトにクローラーが来たとしても全てのページをクロールしてもらえないことになります。
⑤「nofollowタグ」や「robots.txt」によりクローラーを制御する
クロールしてもらいたくないページ、例えば404エラーページやテストページ等は「nofollow」や「robot.txt」などでクローラーにリンクを辿らせないようにしなければなりません。こうすることで、重要なページにクローラーを誘導することができます。
2-2. インデックス対策
検索エンジンに正しく情報をインデックスしてもらうためには、
- 検索エンジンに、正しく読み取ってもうためにサイトのHTML構造や論理構造を整える。
- インデックスして欲しくないページについては、そのことを伝える。
ことが必要です。そのために行える対策は次の通りです。
①titleタグ・h1タグを使い、サイトのテーマを明確に伝える
titleタグ・h1タグはHTMLタグの中で最重要のものです。これらは、検索エンジン側も、ページの内容を表す重要な情報だと考えています。ページを作るときは、必ず使って、検索エンジンに、そのページが、何について書いてあるのかをわかりやすく伝えるようにしましょう。
②titleタグやh1タグ等にキーワードを入れる
そのページで上位表示を目指している検索キーワードを、ページ内に入れることも重要です。これも、検索エンジンが、サイトの情報を正しく理解することに役立ちます。キーワードを入れる際には、下記の記事も併せて確認しておきましょう。
③正しいHTMLを使用する
検索エンジンはHTMLというソースを見ることでサイトの内容を理解しています。例えばh1タグを入れるべきところにh2タグを入れたり、tableタグをサイトのデザインに使用するなど、本来のHTMLの用法と異なる使い方すると、検索エンジンが、ページの情報を正しく読み取るための妨げとなります。
④サイト内の論理構造を適切にする
動物がテーマのサイトに植物の話を書いたり、ファイル名やドメイン名がコンテンツと異なる内容になっていると検索エンジンは正しくサイトのを理解することができません。
⑤「noindexタグ」によりインデックスを制御する
インデックスしてほしくない箇所は、noindexタグにより検索エンジンがインデックスしないようにします。
2-3. ランキング対策
それではGoogleで検索結果を上位表示してもらうためのテクニックはあるのでしょうか。
Googleの検索エンジンは進化を遂げ、小手先のテクニックで検索エンジンを騙すような、いわゆるブラックハットと呼ばれる手法が通用する時代は終わりました。その流れについては、「検索エンジンの歴史」で解説しています。
結局、ランキング対策で最も重要なのは、「最高のUX(ユーザーエクスペリエンス)」を提供することです。
ユーザーに本当に役に立つコンテンツ(情報や知識・ノウハウ、ニュース、娯楽等)を提供すること以外に、検索上位を勝ち取る方法はありません。この傾向は、今後も、より推進されていくことでしょう。
それでは、最高のUXを提供するには、どうすれば良いのでしょうか?
以下、Googleの品質に関するガイドラインからの抜粋です。
- 検索エンジンではなく、ユーザーの利便性を最優先に考慮してページを作成する。
- ユーザーをだますようなことをしない。
- 検索エンジンでの掲載位置を上げるための不正行為をしない。ランクを競っているサイトや Google 社員に対して自分が行った対策を説明するときに、やましい点がないかどうかが判断の目安です。その他にも、ユーザーにとって役立つかどうか、検索エンジンがなくても同じことをするかどうか、などのポイントを確認してみてください。
- どうすれば自分のウェブサイトが独自性や、価値、魅力のあるサイトといえるようになるかを考えてみる。同分野の他のサイトとの差別化を図ります。
引用元:ウェブマスター向けガイドライン(品質に関するガイドライン)
私たちは、このガイドラインを次のように解釈しています。
- オリジナル性があること
他のページの盗用(いわゆるパクリ)ではないこと - コンテンツの質と量が充実していること
WEBページのユーザーにとって役に立つ質と量を兼ね備えていること
最低限、この2点を守って頂きながら、粘り強くサイト運営を続けると、少しずつ成果が出ていきます。そして、時間をかければかけるほど、より大きな成果になっていきます。
3.まとめ
改めて、重要な内容を振り返ってみましょう。
検索エンジンの仕組みは、
- クロール
- インデックス
- ランキング
という 3 つの要素で成り立っています。そのため、SEO(検索エンジン対策)も、
- クロール対策
- インデックス対策
- ランキング対策
に細分化することができます。そして、それぞれの対策のためにできる方法を、一つずつ地道に行いながら、成果を検証していくことが、本当のSEOと言えるでしょう。