유출된 문서는 Google Search Gate가 인터넷을 어떻게 유지하는지 보여줍니다.

Google 검색은 종종 인터넷의 문이라고 불리며, 대부분의 사람들이 온라인에서 정보를 찾는 여정의 첫 번째 정거장입니다. 그러나 Google은 인터넷을 어떻게 구성하는지에 대해 많이 언급하지 않으며 검색을 우리가 아는 것과 모르는 것을 지시하는 거대한 블랙박스로 만듭니다. 이번 주 검색 엔진 최적화(SEO) 베테랑인 Rand Fishkin이 처음 보고한 2,500페이지의 유출 사건은전 세계에 26년 된 Google 검색의 미스터리에 대한 통찰력을 제공했습니다.
관련된 컨텐츠
Fishkin은 Gizmodo에 보낸 이메일 성명에서 “가장 큰 시사점은 Google의 공개 담당자가 말하는 것과 Google 검색 엔진이 수행하는 작업이 서로 다르다는 것입니다.”라고 말했습니다.
관련된 컨텐츠
- 끄다
- 영어
이 문서는 Google 검색이 우리가 소비하는 정보를 어떻게 제어하는지에 대한 자세한 정보를 제공합니다. 수천 가지의 편집 결정이 비밀스러운 Google 직원 그룹에 의해 귀하를 대신하여 이루어지기 때문에 올바른 웹페이지를 귀하의 컴퓨터로 가져오는 것은 수동적인 작업이 아닙니다. 구글 알고리즘에 생사를 건 SEO 업계에 유출된 문서는 지진이다. 이는 마치 NFL 심판이 시즌 중반에 축구 규칙을 다시 쓴 것과 같습니다. 슈퍼볼을 플레이하면서 알게 됩니다.
몇몇 SEO 전문가들은 Gizmodo에 유출된 내용에 대해 14,000개의 순위 기능이 나열되어 있으며 이는 최소한 Google이 웹의 모든 것을 구성하는 방법에 대한 청사진을 제시한다고 말했습니다. 이러한 요소 중 일부에는 특정 주제에 대한 웹사이트의 권한에 대한 Google의 결정, 웹사이트의 크기 또는 웹페이지에서 수신되는 클릭 수가 포함됩니다. Google은 이전에 검색에서 이러한 순위 기능 중 일부를 사용한다는 사실을 부인했지만 회사는 비록 불완전하기는 하지만 이러한 문서가 실제임을 확인했습니다.
구글 대변인은 기즈모도(Gizmodo)에 보낸 이메일에서 "맥락에 맞지 않거나 오래되었거나 불완전한 정보를 기반으로 검색에 대해 부정확한 가정을 하지 않도록 주의할 것"이라고 밝혔습니다. “우리는 검색이 작동하는 방식과 시스템에서 평가하는 요소의 유형에 대한 광범위한 정보를 공유하는 동시에 검색결과의 무결성을 조작으로부터 보호하기 위해 노력했습니다.”
Google의 '주의사항'과 관련하여 회사는 이러한 문서에 대해 무엇이 옳고 그른지 확인하지 않습니다. Google은 이것이 검색에 대한 포괄적인 정보라고 가정하는 것은 틀렸다고 말하며 너무 많은 정보를 제공하면 악의적인 행위자가 발생할 수 있다고 Gizmodo에 알립니다. 궁극적으로 우리는 이러한 요소를 결정하는 데 무엇이 영향을 미치는지, 또는 Google 검색이 각 요소에 어느 정도의 비중을 두는지 알 수 없습니다.
유출을 최초로 분석한 SEO 전문가 Mike King은 Gizmodo와의 인터뷰에서 “우리는 그들이 고려하고 있는 다양한 변수를 살펴보고 있을 뿐입니다.”라고 말했습니다. "이것은 [Google]이 웹사이트를 보는 세부사항입니다."
이 유출은 GitHub에서 공개적으로 API 문서를 발견한 SEO 실무자인 Erfan Azimi에 의해 처음 발견되었습니다. 이러한 문서가 실제로 "유출"되었거나 Google이 웹의 조용한 구석에 우연히 게시한 것인지는 확실하지 않습니다. Azimi는 지난주에 Fishkin에게 이 문서를 가져와서 공개하는 것을 목표로 했고, Fishkin은 King에게 문서를 이해하는 데 도움을 요청했습니다.
King은 순위 기능 중 하나인 "homepagePagerankNs"를 통해 웹사이트 홈페이지의 악명이 웹사이트 에서 게시하는 모든 것을 뒷받침 할 수 있음을 암시한다고 지적합니다 . Fishkin은 Google 검색 부문 부사장인 Pandu Nayak이 법무부 증언에서 처음 언급한 NavBoost라는 시스템에 대한 유출 내용을 기록했습니다. 이 시스템은 Google 검색 순위를 높이기 위해 클릭수를 측정하는 것으로 알려졌습니다 . SEO 업계의 많은 사람들은 이 문서를 업계가 오랫동안 의심해 왔던 사실을 확인하는 것으로 간주하고 있습니다. 즉, 덜 알려진 사이트가 더 나은 정보를 가지고 있더라도 Google에서 인기 있는 것으로 간주하는 웹 사이트는 검색어에 대해 더 높은 검색 순위를 받을 수 있습니다.
최근 몇 달 동안 몇몇 소규모 게시자 의 Google 검색 트래픽이 사라졌습니다 . The Verge의 Nilay Patel이 지난 주 Google CEO Sundar Pichai에게 이에 대해 물었을 때 Pichai는 "그것이 통일된 추세인지는 확실하지 않습니다." 라고 말했습니다. ” King이 언급한 순위 기능 중 하나는 이러한 작은 사이트를 균일하게 분류하는 것 같습니다.
King은 “그곳에는 'smallPersonalSite'라는 기능이 있는데 그것이 어떻게 사용되는지는 모르지만 이는 [Google]이 이 사이트가 소규모 사이트인지 이해하려고 한다는 의미입니다.”라고 King은 말했습니다. "이러한 소규모 사이트 중 상당수가 지금 무너지고 있다는 사실은 [Google]이 이러한 큰 브랜드 신호를 상쇄하기 위해 어떤 조치도 취하지 않고 있음을 보여주는 것입니다."
특히 Pichai는 나중에 The Verge와의 인터뷰에서 Google이 소규모 사이트에 더 많은 트래픽을 발생시켰다고 언급했습니다. 이러한 순위 기능은 Google이 활용할 수 있는 수단을 나타낼 수 있습니다. 점점 더 많은 국내 미디어 조직이 ChatGPT에 콘텐츠를 표시하도록 라이선스를 부여함에 따라 Google 검색도 대규모 게시자 쪽으로 기울고 있는 것으로 보입니다. 대체로 이는 대부분의 사람들이 듣는 내용을 주류 미디어 조직으로 압축하는 압축 효과를 가져올 수 있습니다.
이번 구글 문서 유출의 파급력은 널리 느껴졌다. 15년 이상 디지털 홍보 및 SEO 분야에서 일해 온 Ruby Media Group의 CEO인 Kristen Ruby는 Gizmodo에 월요일 밤에 "내일 Google에 문제가 생길 것입니다."라는 불길한 문자를 받았다고 말했습니다.
Ruby는 신속하게 누출을 발견하고 그녀에게 눈에 띄는 두 가지 순위 기능인 "isElectionAuthority"와 "isCovidLocalAuthority"를 언급했습니다. 이러한 기능은 각각 선거와 코로나19에 대한 적절한 정보를 제공하는 웹페이지의 신뢰성을 평가하는 Google의 방법인 것 같습니다. 2019년에 Ruby는 신뢰할 수 있는 웹 페이지에 대한 Google의 척도 (Google에서 EEAT (경험, 전문성, 권위, 신뢰를 나타냄) 라고 함 )가 본질적으로 어떻게 정치적인지에 대해 광범위하게 썼습니다. 그녀는 이러한 요소에 대한 Google의 측정이 정치적 노선에 따라 왜곡되는 경향이 있다고 지적합니다.
“Google이 'isElectionAuthority' 또는 'isCovidLocalAuthority'와 같은 데이터의 중요한 항목에 대한 맥락을 제공하지 않는다는 것이 나에게는 문제가 됩니다. Google은 이러한 중요한 영역에서 권한을 어떻게 정의하고 있나요?” 루비는 이메일로 보낸 성명에서 이렇게 말했습니다. “답이 무엇인지 추측할 필요는 없습니다. 구글이 나서서 답이 무엇인지 말해줄 것입니다.”
Google은 개인 정보에 대한 권리를 가진 기업이지만 Ruby는 Google이 우리 주변 세계를 형성하는 이러한 순위 기능에 대한 질문에 답할 의무가 있다고 주장합니다. King과 Fishkin은 또한 유출 글에서 'isCovidLocalAuthority'와 'isElectionAuthority'를 발견했는데, 둘 다 품질 정보를 높이는 데 있어 검색 엔진의 중요성을 지적했습니다.
King은 “좋든 싫든 Google은 사실상 공공 서비스이기 때문에 정보에 대한 그러한 종류의 식별력을 제공하는 것이 정말 중요하다고 생각합니다.”라고 말했습니다. "그들은 아마도 내가 그런 말을 하면 반발할 것입니다. 하지만 우리는 그것이 웹에서 정보를 얻는 방법의 주요 소스라고 생각합니다."
Google이 이러한 예에서 정보의 순위를 매기는 방식은 전체 검색 생태계의 축소판입니다. 어떤 정보를 확대하고 어떤 정보를 침묵시켜야 하는지에 대한 질문은 매일 수백만 가지에 이릅니다. Google과 여러 기술 회사는 오랫동안 스스로를 의견이 없는 알고리즘으로 위장하려고 노력해 왔지만 이러한 순위 기능은 그렇지 않다는 것을 보여줍니다. 2,500페이지 분량의 유출에서 밝혀진 순위 기능의 더 많은 예가 있습니다.
구글의 알고리즘 속에서 답을 찾는다
Google은 이러한 문서에 대해 자세히 설명하지 않고 Gizmodo에 너무 많은 정보를 제공하면 악의적인 행위자가 발생할 수 있다고 말하므로 SEO 전문가는 Google 검색을 사용하는 모든 사람을 대신하여 이를 이해해야 합니다. 지난 주에 확인된 14,000개의 순위 기능 중 일부는 Google이 수년 동안 사용하지 않았다고 명시적으로 주장한 기능입니다.
2016년 영상에서 구글 검색 담당자는 “우리는 웹사이트 권위 점수가 없다. 2015년 인터뷰에서 또 다른 구글러는 “ 클릭을 직접 순위에 활용하는 것은 실수가 될 것”이라고 말했다. ” 유출된 문서와 구글의 대응으로 볼 때 현재 이러한 의견은 이해하기 어렵습니다.
Fishkin은 “이번 답변은 사람들이 Google을 좋아하지 않거나 신뢰하지 않는 이유를 보여주는 완벽한 예입니다.”라고 말했습니다. "이것은 유출을 해결하지 않고, 아무런 가치도 제공하지 않으며, 지난 10년간 가장 영혼 없는 기업 메시지에 대해 훈련받은 AI에 의해 작성되었을 수도 있는 비진술입니다."
AI 답변 시대에 Ruby는 Google이 웹페이지 순위를 매기는 방식이 그 어느 때보다 중요하다고 지적합니다. 다양한 관점에 대한 일련의 링크 대신 Google의 새로운 AI 개요 덕분에 하나의 명확한 답변을 얻을 수도 있습니다 . 그러나 우리는 10년 된 Reddit 게시물이 이상한 권한을 얻어 일부 사용자에게 피자에 접착제를 바르라고 지시하는 것을 보았습니다 . Google이 권한을 선택하는 방법은 점점 더 중요해지고 있습니다. 이제 최고의 결과가 목소리를 낼 수 있는 유일한 결과일 수 있기 때문입니다.
“우리는 기어를 바꾸고 있습니다. 우리는 한 검색 시스템에서 다른 검색 시스템으로 이동하고 있습니다.”라고 Ruby는 말했습니다. “AI는 검색 결과에 심오한 방식으로 영향을 미치고 있습니다.”
궁극적으로 Google이 이러한 순위 기능을 통해 실제로 무엇을 하고 있는지 말하기는 어렵습니다. 분명한 것은 Google이 인터넷에서 웹사이트 순위를 매기기 위해 이러한 분류자를 만들었고 잠재적으로 더 많은 분류자를 만들었다는 것입니다. 이러한 순위에는 Google 검색이 객관적인 경험이 아니라 Google 내부 사람들이 내린 일련의 편집상의 선택이라는 더 많은 증거를 추가하는 판단이 필요합니다.