Dokumen yang Bocor Mengungkapkan Bagaimana Google Search Gatemenjaga Internet

May 30 2024
Pakar SEO mengatakan kebocoran besar-besaran pada 14.000 fitur peringkat mengungkap cetak biru bagaimana Google diam-diam mengatur Internet.
Alphabet Inc. dan CEO Google Sundar Pichai berbicara saat peresmian pusat Kecerdasan Buatan (AI) Google di Paris pada 15 Februari 2024.

Google Penelusuran sering disebut sebagai pintu masuk ke internet—ini adalah perhentian pertama perjalanan kebanyakan orang menuju informasi online. Namun, Google tidak banyak bicara tentang cara mereka mengatur internet, menjadikan Penelusuran sebagai kotak hitam raksasa yang menentukan apa yang kita ketahui dan apa yang tidak. Minggu ini, kebocoran sebanyak 2.500 halaman, pertama kali dilaporkan oleh veteran optimasi mesin pencari (SEO) Rand Fishkin , memberi dunia wawasan tentang misteri Google Penelusuran yang berusia 26 tahun.

Konten Terkait

Google Mengatakan Telah Membersihkan Semua Sampah AI yang Mengotori Hasil Pencariannya
Google Diam-diam Menghapus 'Ditulis Oleh Orang' Dari Saran untuk Pemilik Situs Web

“Saya pikir kesimpulan terbesarnya adalah apa yang dikatakan perwakilan publik Google dan apa yang dilakukan mesin pencari Google adalah dua hal yang berbeda,” kata Fishkin dalam pernyataan email kepada Gizmodo.

Konten Terkait

Google Mengatakan Telah Membersihkan Semua Sampah AI yang Mengotori Hasil Pencariannya
Google Diam-diam Menghapus 'Ditulis Oleh Orang' Dari Saran untuk Pemilik Situs Web
Kasus Antitrust Google Adalah Hal Terbaik yang Pernah Terjadi pada AI
Membagikan
Subtitle
  • Mati
  • Bahasa inggris
Bagikan video ini
Email Facebook Twitter
Tautan Reddit
Kasus Antitrust Google Adalah Hal Terbaik yang Pernah Terjadi pada AI

Dokumen-dokumen ini memberikan gambaran lebih detail tentang bagaimana Google Penelusuran mengontrol informasi yang kami gunakan. Membawa halaman web yang tepat ke komputer Anda bukanlah tugas yang pasif karena ribuan keputusan editorial dibuat atas nama Anda oleh sekelompok Googler yang penuh rahasia. Bagi SEO, sebuah industri yang hidup dan mati oleh algoritma Google, dokumen yang bocor adalah sebuah gempa bumi. Ini seperti wasit NFL menulis ulang peraturan sepak bola di pertengahan musim, dan Anda baru mengetahuinya saat bermain Super Bowl.

Beberapa pakar SEO memberi tahu Gizmodo bahwa kebocoran tersebut mencantumkan 14.000 fitur peringkat yang, setidaknya, memberikan cetak biru tentang bagaimana Google mengatur segala sesuatu di web. Beberapa faktor ini mencakup penentuan Google atas otoritas situs web pada subjek tertentu, ukuran situs web, atau jumlah klik yang diterima laman web. Google sebelumnya membantah bahwa mereka menggunakan beberapa fitur pemeringkatan ini di Penelusuran, namun perusahaan tersebut mengonfirmasi bahwa dokumen-dokumen ini asli, meskipun tidak sempurna.

“Kami akan berhati-hati agar tidak membuat asumsi yang tidak akurat tentang Penelusuran berdasarkan informasi yang di luar konteks, ketinggalan jaman, atau tidak lengkap,” kata juru bicara Google melalui email ke Gizmodo. “Kami telah berbagi banyak informasi tentang cara kerja Penelusuran dan jenis faktor yang menjadi pertimbangan sistem kami, sekaligus berupaya melindungi integritas hasil kami dari manipulasi.”

Sehubungan dengan “kehati-hatian” Google, perusahaan tidak akan mengkonfirmasi apa yang benar atau tidak tentang dokumen-dokumen ini. Google mengatakan salah jika menganggap ini adalah informasi komprehensif tentang Penelusuran, dan memberi tahu Gizmodo bahwa memberikan terlalu banyak informasi dapat memungkinkan pelaku kejahatan. Pada akhirnya, kami tidak tahu apa yang menentukan faktor-faktor ini, atau seberapa besar bobot yang diberikan Google Penelusuran pada masing-masing faktor, jika ada.

“Kami hanya melihat variabel berbeda yang mereka pertimbangkan,” kata Mike King, pakar SEO yang merupakan salah satu orang pertama yang menganalisis kebocoran tersebut, dalam sebuah wawancara dengan Gizmodo. “Ini adalah rincian yang [Google] lihat di situs web.”

Kebocoran ini pertama kali diketahui oleh Erfan Azimi, seorang praktisi SEO yang menemukan dokumentasi API secara publik di GitHub. Tidak jelas apakah dokumen-dokumen ini benar-benar “bocor” atau diterbitkan oleh Google di sudut web yang sepi, mungkin secara tidak sengaja. Azimi bertujuan untuk mempublikasikan dokumen-dokumen ini dengan membawanya ke Fishkin minggu lalu, yang meminta King membantu memahaminya.

King mencatat bahwa salah satu fitur pemeringkatan “homepagePagerankNs” menunjukkan bahwa ketenaran beranda situs web dapat menopang semua yang dipublikasikannya . Fishkin menulis kebocoran tersebut merujuk pada sistem yang disebut NavBoost—yang pertama kali dirujuk oleh Wakil Presiden Penelusuran Google, Pandu Nayak, dalam kesaksiannya di Departemen Kehakiman—yang konon mengukur klik untuk meningkatkan peringkat di Google Penelusuran . Banyak orang di industri SEO menganggap dokumen-dokumen ini sebagai konfirmasi atas apa yang telah lama dicurigai oleh industri ini: Situs web yang dianggap populer oleh Google mungkin menerima peringkat Penelusuran yang lebih tinggi untuk sebuah kueri meskipun situs yang kurang dikenal mungkin memiliki informasi yang lebih baik.

Dalam beberapa bulan terakhir, beberapa penerbit kecil mengalami penurunan lalu lintas Google Penelusuran . Ketika Nilay Patel dari The Verge bertanya kepada CEO Google Sundar Pichai tentang hal ini minggu lalu, Pichai mengatakan dia tidak yakin “apakah itu tren yang seragam. Salah satu fitur pemeringkatan yang disebutkan King tampaknya mengkategorikan situs-situs kecil tersebut secara seragam.

“Mereka mempunyai fitur yang disebut 'smallPersonalSite', dan kami tidak tahu bagaimana fitur tersebut digunakan, tapi itu merupakan indikasi bahwa [Google] sedang mencari tahu apakah ini adalah situs yang lebih kecil,” kata King. “Karena begitu banyak situs kecil yang dihancurkan saat ini, hal ini menunjukkan bahwa [Google] tidak melakukan sesuatu untuk mengimbangi sinyal merek besar tersebut.”

Khususnya, Pichai kemudian menyebutkan dalam wawancara dengan The Verge bahwa, di lain waktu, Google telah mengarahkan lebih banyak lalu lintas ke situs-situs kecil. Fitur pemeringkatan ini dapat menunjukkan pengaruh yang dapat dimanfaatkan oleh Google. Karena semakin banyak organisasi media nasional yang melisensikan konten mereka untuk ditampilkan di ChatGPT, Google Penelusuran juga tampaknya condong ke penerbit yang lebih besar. Secara umum, hal ini dapat berdampak buruk, menekan apa yang didengar sebagian besar orang ke dalam organisasi media arus utama saja.

Dampak dari kebocoran dokumen Google ini sangat terasa. Kristen Ruby, CEO Ruby Media Group yang telah bekerja di bidang hubungan masyarakat digital dan SEO selama lebih dari 15 tahun, memberi tahu Gizmodo bahwa dia menerima pesan teks yang tidak menyenangkan pada Senin malam: “Besok Google akan mengalami masalah.”

Ruby dengan cepat menemukan kebocoran tersebut dan mencatat dua fitur peringkat yang menarik perhatiannya: “isElectionAuthority” dan “isCovidLocalAuthority.” Fitur-fitur ini tampaknya menjadi cara Google menentukan peringkat kredibilitas halaman web dalam memberikan informasi yang tepat tentang pemilu dan COVID-19. Pada tahun 2019, Ruby banyak menulis tentang bagaimana ukuran halaman web tepercaya Google (yang disebut Google sebagai EEAT , singkatan dari Experience, Expertise, Authoritativeness, dan Trust) pada dasarnya bersifat politis. Dia mencatat bahwa ukuran faktor-faktor ini oleh Google cenderung condong ke arah politik.

“Bagi saya, ini menjadi masalah karena Google tidak memberikan konteks pada item penting dalam data seperti 'isElectionAuthority' atau 'isCovidLocalAuthority.' Bagaimana Google mendefinisikan otoritas di domain penting ini?” Ruby mengatakan dalam pernyataan email. “Saya tidak perlu menebak apa jawabannya. Google harusnya terbuka dan memberi tahu saya apa jawabannya.”

Meskipun Google adalah sebuah bisnis yang memiliki hak atas informasi pribadi, Ruby berpendapat bahwa Google memiliki kewajiban untuk menjawab pertanyaan tentang fitur peringkat yang membentuk dunia di sekitar kita. King dan Fishkin juga memperhatikan 'isCovidLocalAuthority” dan “isElectionAuthority” dalam tulisan mereka mengenai kebocoran tersebut, keduanya menunjukkan pentingnya mesin pencari dalam meningkatkan informasi berkualitas.

“Saya pikir sangat penting bagi mereka untuk memberikan pemahaman terhadap informasi karena suka atau tidak, Google pada dasarnya adalah layanan publik,” kata King. “Mereka mungkin menolak pernyataan saya, tapi kami menganggapnya sebagai sumber utama cara Anda mendapatkan informasi di web.”

Cara Google memberi peringkat pada informasi dalam contoh-contoh ini merupakan mikrokosmos dari keseluruhan ekosistem Penelusuran. Pada hari tertentu, terdapat jutaan pertanyaan tentang informasi apa yang harus diperkuat dan apa yang harus dibungkam. Meskipun Google, dan beberapa perusahaan teknologi, telah lama mencoba menggambarkan diri mereka sebagai algoritma tanpa opini, fitur pemeringkatan ini menunjukkan bahwa hal tersebut tidak sepenuhnya benar. Masih banyak lagi contoh fitur peringkat yang terungkap dalam bocoran setebal 2.500 halaman.

Mencari Jawaban di Tengah Algoritma Google

Karena Google tidak akan menguraikan dokumen-dokumen ini, memberi tahu Gizmodo bahwa memberikan terlalu banyak informasi dapat memungkinkan pelaku kejahatan, pakar SEO harus memahami hal ini atas nama semua orang yang menggunakan Google Penelusuran. Beberapa dari 14.000 fitur pemeringkatan yang diidentifikasi pada minggu lalu adalah hal-hal yang secara eksplisit diklaim Google belum digunakan selama bertahun-tahun.

Dalam video tahun 2016, perwakilan Google Penelusuran menyatakan, “Kami tidak memiliki skor otoritas situs web. ” Dalam sebuah wawancara pada tahun 2015, Googler lainnya berkata, “ Menggunakan klik secara langsung dalam pemeringkatan adalah sebuah kesalahan. ” Sulit untuk memahami komentar-komentar ini sekarang mengingat dokumen yang bocor dan tanggapan Google.

“Tanggapan ini adalah contoh sempurna mengapa orang tidak menyukai atau mempercayai Google,” kata Fishkin. “Ini adalah pernyataan yang tidak mengatasi kebocoran, tidak memberikan nilai, dan mungkin saja ditulis oleh AI yang terlatih dalam menyampaikan pesan perusahaan yang paling tidak berjiwa dalam satu dekade terakhir.”

Di era jawaban AI, Ruby mencatat bahwa cara Google memberi peringkat pada halaman web menjadi lebih penting dari sebelumnya. Daripada serangkaian tautan ke berbagai perspektif, Anda mungkin hanya mendapatkan satu jawaban langsung berkat Ikhtisar AI Google yang baru . Namun, kami telah melihat postingan Reddit berusia 10 tahun mendapatkan otoritas yang aneh, meminta beberapa pengguna untuk menempelkan lem ke dalam pizza mereka . Cara Google memilih otoritas menjadi semakin penting, karena hasil teratas mungkin merupakan satu-satunya hasil yang memiliki suara saat ini.

“Kami sedang berpindah haluan. Kami berpindah dari satu sistem pencarian ke sistem pencarian lainnya,” kata Ruby. “AI berdampak besar pada hasil penelusuran.”

Pada akhirnya, sulit untuk mengatakan apa yang sebenarnya dilakukan Google dengan fitur peringkat ini. Yang jelas adalah Google menciptakan pengklasifikasi ini, dan berpotensi memiliki lebih banyak lagi, untuk menentukan peringkat situs web di internet. Pemeringkatan ini jelas membutuhkan pertimbangan, sehingga menambah lebih banyak bukti bahwa Google Penelusuran bukanlah pengalaman objektif, melainkan serangkaian pilihan editorial yang dibuat oleh orang-orang di Google.