Home
» Wiki
»
Google przypadkowo opublikowało dokumentację dotyczącą działania wyszukiwania
Google przypadkowo opublikowało dokumentację dotyczącą działania wyszukiwania
W poniedziałek wyciekły wewnętrzne dokumenty opisujące czynniki, jakie wyszukiwarka Google bierze pod uwagę przy ustalaniu rankingu i wyświetlaniu wyników wyszukiwania w sieci.
Google przypadkowo ujawnia, jak działa wyszukiwarka
Dokumenty te zostały upublicznione przez Randa Fishkina ze SparkToro, firmy zajmującej się oprogramowaniem. Fiskin wcześniej pracował w branży optymalizacji wyszukiwarek (SEO).
W „Repozytorium treści interfejsu API Google” znajduje się wewnętrzna dokumentacja interfejsu API, która wyjaśnia pracownikom, jak działają różne komponenty generujące wyniki wyszukiwania. Łącznie jest ponad 2500 stron. Niektóre opisują starsze systemy, ale inne dokumenty wydają się być aktualne.
Na podstawie tego, co opublikowano, Google najwyraźniej udostępniło je publicznie — być może przez przypadek — za pośrednictwem GitHub począwszy od 27 marca. Dokumenty wyjaśniające zostały opublikowane 7 maja. Jednak ponieważ w tym czasie było ono indeksowane przez usługę zewnętrzną, jego kopia pozostała dostępna nawet po tym, jak Google ją usunęło.
Choć dane te pokazują, jakie czynniki wyszukiwarka Google bierze pod uwagę przy ustalaniu rankingu wyników wyszukiwania, nie ujawniają, jak istotny jest każdy z czynników dla ostatecznego rankingu.
Osoby zajmujące się SEO, które próbują dostosować się do zmian w wynikach wyszukiwania Google i uzyskać wyższą pozycję na stronie, mogą uznać te dane za przydatne. Po przejrzeniu dokumentu doszli do wniosku, że jest on sprzeczny z publicznymi oświadczeniami Google na temat działania wyszukiwarki.
Google nie skomentowało jeszcze publicznie przecieku. Firma ogłosiła w marcu najnowszą, dużą aktualizację wyszukiwarki, której celem jest wyświetlanie bardziej autentycznych i „użytecznych” treści. Główny system rankingowy został zaktualizowany w celu określenia, czy strona została „stworzona z myślą o wyszukiwarkach, a nie o ludziach ” .
Najważniejsze ustalenia wycieku
Jedno jest pewne: algorytm wyszukiwarki Google nie wyciekł, a eksperci SEO nie mają nagle wszystkich odpowiedzi. Jednak ilość informacji, które wyciekły z tysięcy wewnętrznych dokumentów Google, nadal jest ogromna. To bezprecedensowe spojrzenie na zazwyczaj pilnie strzeżone wewnętrzne mechanizmy działania Google.
Aby przetrwać, witryny internetowe są uzależnione od ruchu z wyszukiwarek, a wiele z nich jest gotowych podjąć ogromne wysiłki – i ponieść duże koszty – aby pokonać konkurencję i znaleźć się na szczycie wyników wyszukiwania. Wyższe pozycje w rankingu oznaczają większy ruch na stronie, a to z kolei oznacza więcej pieniędzy. W rezultacie operatorzy witryn uważnie monitorują każde słowo publikowane przez Google, a także każdy wpis w mediach społecznościowych pod kątem pozycji w wynikach wyszukiwania.
Przez lata rzecznicy Google wielokrotnie zaprzeczali, jakoby kliknięcia użytkowników miały wpływ na pozycję stron internetowych w wynikach wyszukiwania. Jednak ujawnione dokumenty wskazują, że pewne rodzaje kliknięć użytkowników mają wpływ na pozycję stron w wynikach wyszukiwania. Zeznania złożone w ramach poprzedniej sprawy antymonopolowej prowadzonej przez Departament Sprawiedliwości USA ujawniły, że istnieje czynnik rankingowy o nazwie Navboost, który wykorzystuje kliknięcia użytkowników do podniesienia pozycji treści w wynikach wyszukiwania.
„Dla mnie najważniejszym wnioskiem jest to, że wiele publicznych oświadczeń Google na temat tego, co gromadzi i jak działa ich wyszukiwarka, jest sprzecznych z rzeczywistością” – powiedział Rand Fishkin, ekspert w branży optymalizacji wyszukiwarek (SEO), w wiadomości e-mail dla The Verge .
Wyciek stał się viralem po tym, jak eksperci SEO Fishkin i Mike King opublikowali część treści poufnego dokumentu na początku tego tygodnia, wraz z towarzyszącą mu analizą. Wyciekłe dokumenty API obejmują repozytoria wypełnione informacjami i definicjami danych gromadzonych przez Google, z których niektóre mogą pomóc w ustaleniu pozycji stron internetowych w wynikach wyszukiwania. Google początkowo unikało pytań o autentyczność ujawnionych dokumentów, jednak oficjalnie potwierdziło je w ubiegłą środę.
„Ostrzegamy przed formułowaniem nieprawdziwych założeń na temat wyszukiwarki w oparciu o wyrwane z kontekstu, nieaktualne lub niekompletne informacje” – powiedział rzecznik Google, Davis Thompson, w e-mailu wysłanym w środę do The Verge. „Udostępniliśmy obszerne informacje na temat sposobu działania wyszukiwarki i rodzajów czynników branych pod uwagę przez nasze systemy. Pracujemy nad ochroną integralności naszych wyników przed manipulacją ” .
W dokumentacji nie ma informacji na temat sposobu nadawania wag różnym atrybutom. Możliwe jest również, że niektóre właściwości wymienione w dokumentacji — takie jak identyfikator „małej witryny osobistej” lub obniżenie statusu recenzji produktów — mogły zostać wdrożone w pewnym momencie, a następnie usunięte. Możliwe też, że nigdy nie zostały wykorzystane do pozycjonowania stron internetowych.
„Niekoniecznie wiemy, jak [elementy] są używane, poza różnymi opisami. Choć nie jest to zbyt bogate, to i tak jest to dla nas wiele informacji” – powiedział King. „O jakich aspektach powinniśmy szczególnie pamiętać, tworząc stronę internetową lub ją optymalizując?”.
Pomysł, że największa na świecie platforma wyszukiwania nie klasyfikuje wyników wyszukiwania na podstawie interakcji użytkowników z treścią, wydaje się absurdalny. Jednak powtarzające się zaprzeczenia, starannie sformułowane odpowiedzi i publikacje branżowe sprawiają, że jest to temat kontrowersyjny.
Kolejnym ważnym punktem, na który zwrócili uwagę Fishkin i King, jest kwestia sposobu, w jaki Google może wykorzystywać dane z Chrome w swoich rankingach wyszukiwania. Przedstawiciele wyszukiwarki Google twierdzą, że nie korzystają z żadnych funkcji przeglądarki Chrome w celu ustalania rankingu, ale przeciekłe dokumenty sugerują, że może to nie być prawdą. Na przykład jedna z sekcji zawiera listę „chrome_trans_clicks”, która wskazuje, które linki z domeny pojawiają się pod główną witryną w wynikach wyszukiwania. Fishkin wyjaśnia, że oznacza to, że Google „bierze liczbę kliknięć na stronach w przeglądarce Chrome i używa tej liczby do określenia najpopularniejszych/najważniejszych adresów URL w witrynie, które są następnie obliczane w celu uwzględnienia w funkcji linków do witryn ” .
W dokumencie wymieniono ponad 14 000 nieruchomości, a badacze musieliby spędzić wiele tygodni, aby znaleźć zawarte na tych stronach wskazówki. „Twiddlers” lub zmiany w rankingu są wprowadzane poza głównymi aktualizacjami systemu, aby uporządkować treści w górę lub w dół według określonych kryteriów. Omówiono elementy witryny, takie jak tożsamość autora, a także mierniki „autorytetu” witryny. Fishkin zauważa, że w dokumentach brakuje wielu informacji, na przykład informacji o wynikach wyszukiwania generowanych przez sztuczną inteligencję.
Co to wszystko oznacza? Po pierwsze, być może każdy, kto prowadzi stronę internetową, przeczyta o tym wycieku i spróbuje go zrozumieć. Wydawcy, firmy zajmujące się handlem elektronicznym i przedsiębiorstwa prawdopodobnie zaprojektują różne eksperymenty, aby spróbować przetestować niektóre z rozwiązań sugerowanych w dokumencie. Kiedy tak się dzieje, strony internetowe mogą zacząć sprawiać wrażenie nieco innych — wszystko to, ponieważ próbują one nadać sens tej nowej, choć wciąż niejednoznacznej fali informacji.
„Dziennikarze i wydawcy zajmujący się SEO i wyszukiwarką Google muszą przestać powtarzać publiczne oświadczenia Google i przyjrzeć się bliżej, bardziej krytycznie retoryce giganta wyszukiwania” – powiedział Fishkin . „Publikacje, które powtarzają twierdzenia Google, jakby były faktami, pomagają Google jedynie tworzyć narrację, która jest użyteczna dla firmy, a nie pomocna dla praktyków, użytkowników ani opinii publicznej”.