Эксперимент
Особое мнение - новый социальный алгоритм ранжирования Google
В последнее время только ленивый не заметил, что в поисковой выдаче Google начали происходить странные вещи. Совершенно исчезла стабильность, с которой определенные сайты месяцами занимали одни и те же места в результатах поиска.
Прошло немного времени, и теперь уже с полной уверенностью можно сказать, что ранжирование сайтов в Google работает по новому алгоритму. Слова инженера Google Мэтта Каттса о значимости для поисковой машины социальных закладок оказались правдой.
Очевидно, что компанию не устраивает устоявшаяся выдача по многим типам “горячих” запросов, поэтому Google экспериментирует с новостными информационными потоками, которые отражают развитие событий в реальном времени.
Итак, можно утверждать, что Google с помощью новостной службы Google News и недавно запущенного поиска по блогам Google Blog Search научился анализировать информационную картину и разделять информационные потоки, которые попадают в его индекс.
На практике это уже обернулось тем, что по англоязычным запросам, связанным с наиболее важными мировыми событиями, поисковая выдача неоднородна и состоит из наложений сайтов из основного индекса, новостей из Google News и постов из Google BlogSearch. Очевидно, что количество выведенных таким образом сайтов определяется исходя из важности события в мировых масштабах.
Как только тема перестает быть “горячей”, выдача снова меняется и становится практически стабильной. При этом, чтобы Google выделил событие из общей массы и изменил вывод результатов поиска по связанным с ним запросами, в информационном потоке должна быть достигнута некая критическая масса как для новостей, так и для обсуждений. Логика Google очевидна - если все пишут, значит событие вызвало широкий резонанс, и все эти мнения будут интересны людям, которые будут искать информацию по этой теме в основном поиске.
Понятно, что этот подход сразу же заинтересует оптимизаторов, ведь влиять на результаты поиска подобным образом вполне можно. Для этого нужно лишь отслеживать все горячие новости и иметь хорошо оптимизированные и, главное, авторитетные сайты либо в новостном секторе, либо в блоговом.
Возвращаясь к истокам, можно сказать, что Google решил одну из самых важных проблем, с которыми столкнулись поисковые машины еще в начале 90-х - он научился предоставлять информацию по запросам, связанным с только что произошедшими событиями, причем прямо в основной поисковой выдаче.
Самое поразительное, что такая выдача находится в постоянном развитии (как и новости, которые непрерывно поступают по важнейшим событиям), поэтому по одному и тому же запросу уже спустя несколько часов можно получить совершенно другие результаты.
Очевидно, что Google хочет показывать своим пользователям не только официальную позицию, которую заняли новостные издания, но и мнение обычных людей, комментирующих происходящее иногда даже раньше и достовернее прессы. К тому же, очень часто мнение СМИ может не совпадать с мнением блоггеров, поэтому Google выступает здесь в роли арбитра, который и выражает третье, “Особое мнение” - кого ставить в результаты поиска и как.
Звучит немного фантастично, однако приведу несколько примеров, которые довольно быстро смогут убедить вас в том, что новый алгоритм Google построен на социальной почве, как и утверждал инженер Google Мэтт Каттс.
Как показывает Google News, сегодня наиболее обсуждаемое событие - это смерть в Лондоне бывшего российского шпиона Александа Литвиненко. Следует отметить, что событие произошло совсем недавно, поэтому типичный рабочий индекс не должен показывать какие-либо релевантные результаты.
Итак, вот что знает об этом Google - запрос “litvinenko killed“:
Очевидно, что первые две позиции занимают блоги, причем посты очень свежие. Тот же запрос в поиске по блогам дает следующую картинку:
Совершенно очевидно, что из документов в первой тройке основной выдачи два первых (pajamasmedia.com/2006/11/litvinenko_killed_by_plutonium.php и polizeros.com/2006/11/24/litvinenko-killed-by-high-dose-of-radiation/) совпадают с результатами Google Blogsearch и выведены в основном поиске наложением из поиска по блогам. Самое интересное, что пока я подбирал запросы, выдача поменялась прямо на глазах - перед этим там был только один (первый) пост из блога.
Идем дальше. Позиции начиная с 3-й занимают новости. Поиск по новостям дает следующий расклад:
Итак, Google собрал кластер из 3,254 новостей по этому событию, из которых по какому-то принципу, возможно, по авторитетности изданий, вывел несколько в основной выдаче. И точно, сразу бросается в глаза статья из mirror.co.uk (EX-SPY LITVINENKO KILLED BY RADIACTIVE POISON Mirror.co.uk), которая есть в top Google News и поэтому попала в основную выдачу:
Очевидно, что остальные ссылки в основном индексе тоже выведены из Google News и входят в собранный кластер, который показан в Google News.
Есть еще ряд примеров применения гуглом нового алгоритма, однако этот показался мне наиболее ярким. К тому же, поразила быстрота, с которой поисковик отреагировал на новое событие, сориентировался и вывел релевантные документы по связанному с этим событием запросу. Я не исключаю, что по прочтении вами этой статьи уже через несколько часов после публикации выдача может снова измениться до неузнаваемости.
Чтобы окончательно развеять все сомнения, приведу еще один пример.
Совсем недавно много шума наделало заявление Джима Олчина из Microsoft о том, что для новой операционной системы Windows Vista не нужен никакой антивирус, настолько эта система безопасна.
Тема эта активно обсуждалась и в блогах, и в СМИ, поэтому вполне подойдет.
Итак, внимание на экран:
Поисковая выдача, очевидно, состоит не только из новостных сайтов, но и из блогов. Тот же запрос в Google News показывает, что отсюда был выведен первый сайт arstechnica.com:
Следующие за ним сайты взяты тоже из Google News и как раз выводились здесь несколько дней назад, однако теперь выдача изменилась.
Запрос в Google Blog Search дает следующие результаты:
Вот оно! Сайты digg.com, biz-tech.net, infopackets.com попали в основную выдачу как раз через поиск по блогам. Более того, два дня назад на 10-м месте основного поиска находился сайт , занимающий здесь первое место (hostit1.connectria.com), однако сегодня его по какой-то причине убрали, возможно, из-за недостатка авторитета.
Думаю, что ошибка или случайность здесь полностью исключена, так как совпадают не только сайты, но и страницы, на которые выведены ссылки в основном поиске, так что выводы делайте сами.
P.S. При перепечатке этой статьи ссылка на Google Chance обязательна.