AI、機械学習に関するニュース報道が過熱している昨今ですが、そのAIを活用したサービスを提供する代表的な企業がGoogleです。
Googleは、AIを用いた様々なサービスを提供していますが、事業の柱である検索エンジンにもRankBrainという機械学習のアルゴリズムを取り入れており、検索ランキングを決める要素としてその割合が増しています。
そして機械学習の精度が増すなか「検索キーワードから検索する人の意図や目的を理解する」能力が高まっています。検索ユーザーのニーズに合った最適なコンテンツを検索結果に表示できる日が近づいていると言えるでしょう。
しかし、ただでさえ複雑で分かりにくいGoogleアルゴリズムに機械学習というブラックボックスな要素が加わることで「何がどうなるんだ…」と不安に感じるウェブマスターも多いと思います。また、「SEOではどのような対応が必用なのか…」という疑問もわくのではないでしょうか。
ここでは、機械学習とはどのようなものか簡単な用語解説をおこない、さらにSEOに必用な対応について解説します。
GoogleのAIファースト宣言
2015年8月にGoogleのCEOとなったピチャイ氏は「モバイルファーストから次はAIファーストを推進する」という強いメッセージを打ち出しました。(2016年4月28日)
Looking to the future, the next big step will be for the very concept of the “device” to fade away. Over time, the computer itself?whatever its form factor?will be an intelligent assistant helping you through your day. We will move from mobile first to an AI first world. @google
https://blog.google/topics/inside-google/this-years-founders-letter/
Googleは、すでに自社のさまざまなWEBサービスでAI(人工知能)による機械学習を導入しており、音声アシスタントの「Google Assistant」、写真ストレージの「Googleフォト」、リアルタイム翻訳が可能な「Google翻訳」などが代表例としてあげられます。
また、多くの利用者がいるGmailにおいてもスパムフィルターなどに機械学習を取り入れているというのは広く知られています。
これから、検索エンジン含めさらにAIの活用が加速することでしょう。
AI用語解説
難解で複雑なイメージがあるAIですが、ここではSEOに関連する主要な用語について簡単に解説します。概念だけでもつかんでもらえればと思います。
機械学習とは
機械学習とは、人工知能を実現するために人間の持つ学習能力をコンピュータで実現するというものです。人間が作った条件式などのプログラムなしでコンピュータが学習し独力でタスクを実行できるようにします。
具体的にはコンピュータに学習するための材料や考え方を与え、入力と出力を用意します。そして、テキスト、画像、音声などのデータを大量にコンピュータに読み込ませて学習させていくというものです。Googleは毎日増えていく世界中の検索データを読み込ませて機械学習の能力を高めています。
ディープラーニングとは
別名、深層学習とも言いますが、ディープラーニングはニューラルネットワークという人間の脳の神経回路を参考にした機械学習の種類です。入力と出力の中間層を多層に構成して、大量のデータを読み込ませ、機械学習の精度と能力を高めていくというものです。
昔からニューラルネットワーク、ディープラーニングの研究はされていましたが、コンピュータの処理スピードの向上、大量なビッグデータの蓄積などにより、ようやくディープラーニングが可能になったと言われています。
人工知能(AI)では、自動運転、音声認識などがクローズアップされますが、これからの社会では、すべてのビジネスがディープラーニングにより変化を余儀なくされると言われています。
自然言語処理とは
人間の会話や話し言葉をコンピュータに理解させて処理させるAIの技術です。
将来的に自然言語処理が向上すればプログラム言語が必要なくなる可能性があると言われる技術です。
トピックモデルとは
機械学習におけるトピックモデルとは、自然言語で書かれた文章からトピック(関連ワードの集まり)を抽出して意味を学習する技術です。
文章のテーマに関するトピックを抽出し整理することで何について書かれた文章かを学習していくことです。
TF IDFとは
TF IDFは文章における単語の重み付けのことです。
TFはTerm Frequencyの略です。文章内におけるそれぞれの単語の出現頻度を表し、たくさん出てくる単語(特に名詞)ほど重要というように数値化します。
IDFはInverse Document Frequencyの略です。いくつかの文章において、それぞれの単語が共通して使われているかを表します。複数の文章で頻ぱんに使われている単語の重みづけは低くするという考え方です。
つまり出現する単語から独自性、差別化をフィルタリングするという部分でも用いられるということでしょうか。
QDFとは
QDFとはQuery Deserves Freshnessの略です。検索クエリに対して新鮮な情報を表示するという意味あいになります。Googleの検索結果にニュース、速報などが出ることがよくありますが、QDFのアルゴリズムによるものです。
ニュース性が高い記事は検索結果からすぐに消えることもありますが、そのまま検索結果に残ることもあります。新しいキーワード、フレーズなども機械学習により理解力が向上されています。
コンテンツ担当者としては新鮮な情報提供も意識したコンテンツ開発が必用と言えるでしょう。
RankBrainとは
RankBrain(ランクブレイン)とは、ディープラーニングの技術を用いたGoogleの検索アルゴリズムです。
Googleの検索ランキングのアルゴリズムは200以上もありますが、このRankBrainは今では3番目に重要なアルゴリズムと言われています。(その他の2つはPageRank(リンク)?とコンテンツ?でしょうか)
機械学習でサイトの評価が変わる
このようにGoogleは検索ランキングで機械学習を用いたアルゴリズムの比重を高めていますが、その目的は「検索ユーザー体験の向上」にあることは間違いありません。ユーザーファーストの考え方が根底にあります。
RankBrainのアルゴリズムは、コンテンツ解析だけではなく、ユーザーの検索結果のデータ(クリック、離脱、滞在など)を機械学習させているとも言われています。
そのためGoogleの機械学習においてSEOで対応すべきは、検索ユーザー体験を高めるユーザーライクなサイト設計(UI/UX、コンテンツなど)が求められます。もし現在、WEBサイトにユーザー体験を損なう要素があればそこは改善ポイントと言えるでしょう。
【WEBサイトのチェックポイント】
- 使いやすいサイト構造
- 離脱させないコンテンツ導線
- ユーザーライクなデザイン
- 文字サイズ、改行
- 表示スピード
- SSL化
機械学習でコンテンツの評価が変わる
また、コンテンツも検索ユーザーのニーズに適切に応えるとともに問題解決に役立つコンテンツを用意する必用があります。
機械学習によりコンテンツ解析力が向上し、さらにユーザー検索のトレーニングデータ(離脱、滞在など)の要素がランキングに反映されるため、これまで以上にコンテンツ設計を緻密におこなう必用があります。
【コンテンツのチェックポイント】
- 検索クエリに対する適切なコンテンツ
- 独自性が高いコンテンツ
- 読みやすいコンテンツ構成
- タイトル、見出しの最適化
- タイトルとコンテンツの最適化
ユーザーエンゲージメントを評価する
ユーザーエンゲージメントとは「愛着」、「つながり」などを意味するワードです。このユーザーエンゲージメントも機械学習のアルゴリズムのシグナルの一つと言われています。
これをアルゴリズムがどこで判断しているかですが、「商品・サービス名」、「ブランド名」での検索数の多さがあげられます。人気企業・人気商品・人気サービスはブランド名で多くの人に検索されるため、検索ユーザーのニーズが高いことになります。
人気サイトは「有益な情報」、「新鮮な情報」、「ブランド力」があるから繁盛するわけですが、このような人気サイトはGoogleも検索結果で高位置にしようということでしょう。
ですので、このユーザーエンゲージメント、ブランド力を持たないサイトは、SEO以外の広告、PRなどによりブランド力を高める努力が必用ということになります。
機械学習を見据えてSEOでこれから成すべきこと
機械学習というワードを聞いただけで、何か未知のアルゴリズムが導入されて大変なことが起きると思われる方も多いのではないでしょうか。
しかし、現段階ではサイト全体が検索エンジン最適化できているならばことさら過敏になる必要はありません。
機械学習においてSEOで成すべきことはまだはっきりと分からないことが多いのですが、一つ言えるのはこれまで以上にユーザーに親切なWEBサイト設計にする必用があるということでしょうか。
そのためには、ご自身のWEBサイトを放置するようなことはせずに、コンテンツの品質・鮮度、サイトのメンテンスにもこれまで以上に気を配る必用があるでしょう。