漏洩した文書がGoogle検索がインターネットをゲートキーピングしている実態を明らかに

May 30 2024
SEO の専門家は、14,000 のランキング要素の大規模な漏洩により、Google が秘密裏にインターネットを管理する青写真が明らかになったと述べている。
アルファベット社とグーグル社のCEOであるサンダー・ピチャイ氏は、2024年2月15日にパリで行われたグーグル人工知能(AI)ハブの開設式で演説した。

Google 検索は 、インターネットへの入り口と呼ばれることが多く、ほとんどの人がオンラインで情報を探す最初の場所です。しかし、Google はインターネットをどのように整理しているかについてはあまり語っておらず、検索は私たちが知っていることと知らないことを指示する巨大なブラック ボックスとなっています。今週、検索エンジン最適化 (SEO) のベテランであるRand Fishkin氏によって最初に報告された 2,500 ページに及ぶリークにより、 26 年にわたる Google 検索の謎が世界に明らかになりました。

関連性のあるコンテンツ

Googleは検索結果に散らばるAIゴミをすべて削除すると発表
Google はウェブサイト所有者向けの提案から「人が書いた」という項目をひっそりと削除

「グーグルの代表者が言うこととグーグルの検索エンジンが実際にやっていることは別物だというのが最大のポイントだと思う」とフィッシュキン氏はギズモード宛ての電子メールの声明で述べた。

関連性のあるコンテンツ

Googleは検索結果に散らばるAIゴミをすべて削除すると発表
Google はウェブサイト所有者向けの提案から「人が書いた」という項目をひっそりと削除
Googleの反トラスト訴訟はAIにとって史上最高の出来事だ
共有
字幕
  • オフ
  • 英語
この動画を共有します
Facebook Twitterメール
Redditリンク
Googleの反トラスト訴訟はAIにとって史上最高の出来事だ

これらの文書は、Google 検索が私たちが消費する情報をどのように制御しているかをより詳細に示しています。適切な Web ページをコンピューターに表示することは受動的な作業ではありません。何千もの編集上の決定が、秘密主義の Google 社員グループによってユーザーに代わって行われているからです。Google のアルゴリズムによって成否が決まる業界である SEO にとって、漏洩した文書は大きな衝撃です。NFL の審判がシーズン半ばでフットボールのルールを書き換え、スーパーボウルの試合中にそれを知ったようなものなのです。

複数の SEO 専門家が Gizmodo に語ったところによると、このリークには 14,000 のランキング要素がリストされており、少なくとも、Google が Web 上のあらゆる情報を整理する方法の青写真となる。これらの要素には、特定の主題に関する Web サイトの権威の Google による判断、Web サイトの規模、Web ページが受けるクリック数などが含まれる。Google はこれまで、検索でこれらのランキング要素の一部を使用していることを否定していたが、同社はこれらの文書が、不完全ではあるものの、本物であることを確認した。

「文脈から外れた、古い、または不完全な情報に基づいて検索について不正確な推測をしないように注意したい」とGoogleの広報担当者はGizmodoへのメールで述べた。「検索の仕組みやシステムが重視する要素の種類について広範な情報を共有し、検索結果の完全性を操作から守るためにも取り組んでいる」

Google の「警告」に関して、同社はこれらの文書の何が正しいのか、何が間違っているのかを明らかにしていない。Google は、これが検索に関する包括的な情報であると想定するのは間違いだと述べ、情報を公開しすぎると悪意のある行為を助長する可能性があると Gizmodo に伝えている。結局のところ、これらの要素の決定に何が影響するのか、あるいは Google 検索が各要素にどの程度の重み付けをしているのかはわからない。

「我々は彼らが検討しているさまざまな変数を見ているだけだ」と、漏洩情報を最初に分析した一人であるSEO専門家のマイク・キング氏はギズモードのインタビューで語った。「これが[Google]がウェブサイトを見る粒度だ」

この漏洩に最初に気づいたのは、API ドキュメントを GitHub で公開しているのを発見した SEO 専門家の Erfan Azimi 氏でした。これらのドキュメントが本当に「漏洩」されたのか、あるいは Google が Web の静かな片隅で偶然公開したのかは不明です。Azimi 氏は先週、これらのドキュメントを Fishkin 氏に持ち込み、公開しようとしました。Fishkin 氏は King 氏に、ドキュメントの意味を理解するよう依頼しました。

キング氏は、ランキング機能の 1 つである「homepagePagerankNs」は、ウェブサイトのホームページの知名度がそのウェブサイトが公開するすべてのコンテンツの支えになり得ることを示唆していると指摘している。フィッシュキン氏は、このリークは NavBoost と呼ばれるシステムに言及していると書いている。これは、Google 検索のランキングを上げるためにクリック数を計測するというシステムで、Google の検索担当副社長であるパンドゥ・ナヤック氏が司法省での証言で初めて言及したものだ。SEO 業界の多くの人々は、これらの文書を、業界が長らく疑っていた事実の裏付けと受け止めている。つまり、あまり知られていないサイトの方がより良い情報を持っている可能性があるにもかかわらず、Google が人気があると判断したウェブサイトは、クエリに対してより高い検索ランキングを獲得する可能性があるということだ。

ここ数カ月、いくつかの小規模なパブリッシャーの Google 検索トラフィックが消えている。先週、The Verge の Nilay Patel が Google CEO の Sundar Pichai にこの件について質問したところ、Pichai は「それが一様な傾向かどうかは分からない」と述べた。King が指摘するランキング機能の 1 つは、これらの小規模サイトを一様に分類しているようだ。

「Google には『smallPersonalSite』という機能があり、もちろんそれがどのように使われているのかはわかりませんが、これは [Google] がこれらが小規模サイトであるかどうかを把握しようとしていることを示しています」とキング氏は語った。「現在、多くの小規模サイトが潰されつつあることから、これらの大手ブランドのシグナルを相殺するために [Google] が何もしていないことがわかります。」

注目すべきことに、ピチャイ氏はその後、The Verge とのインタビューで、Google が小規模サイトにトラフィックを集中させている時期もあると述べている。これらのランキング機能は、Google が利用できる手段を示している可能性がある。ChatGPT にコンテンツを掲載するライセンスを付与する全国規模のメディア組織が増えるにつれ、Google 検索も大手出版社に偏っているようにみえる。概して、これは抑圧効果をもたらし、ほとんどの人が耳にする情報を主流メディア組織だけに圧縮する可能性がある。

漏洩したGoogle文書の影響は広範囲に及んだ。デジタル広報とSEOに15年以上携わってきたRuby Media GroupのCEO、クリステン・ルビー氏は、月曜の夜に不吉なテキストメッセージを受け取ったとギズモードに語っている。「明日はGoogleに大変なことが起きる」

ルビーはすぐにリークを見つけ、彼女の目に留まった2つのランキング機能、「isElectionAuthority」と「isCovidLocalAuthority」に気づいた。これらの機能は、それぞれ選挙とCOVID-19に関する適切な情報を提供するウェブページの信頼性をGoogleがランク付けする方法のようだ。2019年にルビーは、Googleの信頼できるウェブページの尺度(Googleは経験、専門知識、権威、信頼の頭文字をとってEEATと呼んでいる)が本質的に政治的である理由について広範囲に書いている。彼女は、Googleのこれらの要素の尺度は政治的な方向に偏りがちであると指摘している。

「グーグルが『isElectionAuthority』や『isCovidLocalAuthority』など、データ内の重要な項目についてコンテキストを提供していないのは問題だ。グーグルはこうした重要な領域における権威をどのように定義しているのだろうか」とルビー氏は電子メールで述べた。「答えが何なのか推測する必要はないはずだ。グーグルは率直に答えを教えてくれるべきだ」

Google は企業であり、個人情報に対する権利を有しているが、ルビー氏は、Google には私たちの周りの世界を形作るこれらのランキング機能に関する質問に答える義務があると主張している。キング氏とフィッシュキン氏はまた、漏洩に関する記事の中で「isCovidLocalAuthority」と「isElectionAuthority」に注目し、どちらも検索エンジンが質の高い情報を高める上で重要であることを指摘している。

「好むと好まざるとにかかわらず、Google は事実上公共サービスなので、彼らが情報に対してそのような識別力を提供することは非常に重要だと思います」とキング氏は言う。「私がそう言うと彼らは抵抗するかもしれませんが、私たちは Google をウェブ上で情報を得るための主な情報源だと考えています。」

これらの例で Google が情報をランク付けする方法は、検索エコシステム全体の縮図です。どの情報を増幅し、どの情報を黙らせるかについて、毎日何百万もの疑問が生じます。Google やいくつかのテクノロジー企業は、長い間、意見のないアルゴリズムとして自らをアピールしようとしてきましたが、これらのランキング機能は、そうではないことを示しています。2,500 ページに及ぶリークでは、ランキング機能の例がさらに多く明らかにされています。

Googleのアルゴリズムの中で答えを探す

Google はこれらの文書について詳細を語らず、Gizmodo に対して、情報を公開しすぎると悪意のある行為を助長する可能性があると述べているため、Google 検索を使用するすべてのユーザーに代わって SEO の専門家がこれを解明することになります。先週特定された 14,000 のランキング機能のいくつかは、Google が長年にわたって使用していないと明確に主張していたものです。

2016 年のビデオで、Google 検索の担当者は「当社にはウェブサイトのオーソリティ スコアはありません」と明言しました。2015 年のインタビューでは、別の Google 社員が「クリック数を直接ランキングに反映させるのは間違いです」と発言しました。漏洩した文書と Google の対応を考えると、これらのコメントの意味を理解するのは困難です。

「この回答は、人々がグーグルを嫌ったり信用しなかったりする理由の完璧な例だ」とフィッシュキン氏は語った。「これは、漏洩について言及しておらず、何の価値も提供していない、無意味な声明であり、過去10年間で最も魂のない企業メッセージで訓練されたAIによって書かれたものである可能性が高い」

AI による回答の時代において、Google が Web ページをランク付けする方法はこれまで以上に重要になっていると Ruby 氏は指摘する。さまざまな視点へのリンクが並ぶ代わりに、Google の新しい AI 概要 のおかげで、1 つの明確な回答が得られるかもしれない。しかし、10 年前の Reddit の投稿が奇妙なほど権威を持ち、一部のユーザーにピザに接着剤を入れるように勧めているのを目にしたこと がある。Google が権威を選択する方法はますます重要になっている。なぜなら、トップの結果が今や唯一発言力を持つものかもしれないからだ。

「私たちは方向転換をしています。ある検索システムから別の検索システムに移行しています」とルビー氏は言う。「AIは検索結果に大きな影響を与えています。」

結局のところ、Google がこれらのランキング機能で実際に何をしているのかは分かりません。はっきりしているのは、Google がこれらの分類子を作成し、さらにインターネット上のウェブサイトをランク付けするためにさらに多くの分類子を作成している可能性があるということです。これらのランキングには明らかに判断が必要であり、Google 検索が客観的な体験ではなく、Google 社内の人々が行う一連の編集上の選択であるというさらなる証拠となります。