Бесконечная сеть

Иллюстрация: Comstock complete / Fotolink

Триллион (1000 млрд) уникальных адресов страниц в интернете зафиксировал крупнейший в мире поисковик Google, говорится в официальном блоге компании [1]. На самом деле число адресов еще больше, но многие из них ведут на один и тот же сайт или ссылаются на совсем неактуальный контент (в качестве примера в Google приводят интернет-календари, в которых по ссылке "следующее число" можно кликать практически бесконечно). Таким образом, пишут инженеры Google, реальный размер глобальной сети зависит лишь от того, какую информацию вы считаете актуальной.

Стоит отметить, что количество проиндексированных, то есть занесенных в поисковую базу страниц еще меньше (по тем же причинам актуальности и уникальности информации). По оценкам блога TechCrunch [2], Google в настоящий момент осуществляет поиск по более чем 40 млрд интернет-страниц. Загрузка данных происходит непрерывно, а индекс обновляется несколько раз в день. 1 трлн адресов был найден системой проверки ссылок от Google, которая лишь помогает искать новые сайты для индексации, но не заносит их в поисковую базу сразу же. Каждый день, утверждают в Google, к этому числу прибавляется по несколько миллиардов новых адресов.

Тем временем сегодня в сети появился новый поисковик Cuil [3] (произносится как "cool", кул), который был создан Анной Паттерсон, ранее возглавлявшей команду поиска Google, и ее мужем Томом Костелло, работавшим над поисковыми движками в университете Стэнфорда и для IBM. Об этом пишет издание PC World [4]. Супруги объявили, что Cuil уже успел проиндексировать 120 млрд страниц. Кроме того, он выводит результаты поиска по новой интеллектуальной системе анализа контекста и бережно относится к личным данным пользователей.

Крупнейший российский поисковик "Яндекс" в настоящее время осуществляет поиск по 4,5 млрд веб-страниц.

Ссылки

  • [1] http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html
  • [2] http://www.techcrunch.com/
  • [3] http://www.cuil.com/
  • [4] http://www.pcworld.com/

Комментарий эксперта

Анна Артамонова

вице-президент и директор по маркетингу и PR Mail.Ru

Наш поисковик GoGo.Ru фокусируется далеко не только на простом увеличении охвата индекса, но и на качественных показателях его работы и качества поиска в целом. На сегодняшний день им проиндексировано 4,1 млн видеороликов, 3,3 млрд веб-страниц, 160 млн изображений, свыше 16 млн вопросов и почти 110,5 млн ответов (с проекта Ответы@Mail.Ru). Ежедневно в базу поисковой машины добавляется в среднем по 100 млн страниц, 5 млн картинок и 10 тыс. роликов.

Page created in 0.14144 seconds Powered by Lasto Portator [ Стахановский Портатор ]