Оценочный поиск в Google

Эта статья состоит из трех интервью с различными представителями компании Google, взятых Джоном Пачковским для Digital Daily (перевод Google and the Evolution of Search I: Human Evaluators).

Наша цель — дать возможность пользователям Google задать вопросы, вроде “Что я буду делать завтра?” и “На какую работу мне стоит устроиться?”… Мы отвечаем быстро, изходя из всей имеющейся информации. В будущем алгоритмы станут лучше и мы улучшим персонализацию.
— Управляющий в Google, Эрик Шмидт (Eric Schmidt)

На протяжении многих лет Google заявлял, что ранжирование сайтов в результатах поиска происходит автоматически и определяется компьютерным алгоритмом, используя тысячи факторов для вычисления релевантности страниц определенному запросу. В мае 2007-го это заявление изменилось: “Ранжирование сайтов в Google основывается, преимущественно, на компьютерных алгоритмах…”

Небольшое изменение в формулировке, но очень важное. Google дал понять, что его поисковые результаты более не опираются на автоматику и алгоритмы, которыми хвасталась компания. Сейчас они опираются на алгоритмы лишь “преимущественно”. Почему произошли такие изменения?

Некоторые факты утверждают, что алгоритмы постоянно калибруются исходя из человеческого фактора. Например, Google нанял большую команду “экспертов для оценки поиска” (копию старого обучающего руководства можно скачать здесь). Эти оценщики, в основном, студенты колледжей по всему миру, они анализируют поиск по определенным критериям, тестируют различные алгоритмы и определяют, какие из них работают лучше, предоставляя качественные сайты.

Предоставляя также персонализированный поиск, когда пользователь в своем аккаунте может удалить или поощрить ряд сайтов из результатов поиска, Google использует эти данные для настоек и дальнейшей оптимизации алгоритма. Таким образом, объективная оценка и ранжирование сайтов частично определяется субъективными причинами коллективного человеческого разума.

В предоставленных интервью инженеры Google делятся некоторыми особенностями поиска. Эти инженеры — технический директор Скот Хафман (Scott Huffman), младший программный инженер Мэт Катс (Matt Cutts) и ещё один сотрудник Амит Сингал (Amit Singhal).

Часть I: Скот Хафман

Scott Huffman - технический директор Google Как вы поддерживаете качество поиска?
Мы постоянно оцениваем качество наших результатов в сотнях различных местах и на разных языках. Каждый день мы смотрим на случайные примеры, которые мы получаем от пользователей. Оценщики наблюдают за качеством каждого результата по этим запросам. Мы постоянно отслеживаем довольно большой массив различных видов сигналов качества.

Раскажи немного о человеческом факторе. Вы наняли людей для оценки страниц?
Да, у нас есть ребята по всему миру, обученных оценивать качество результатов. Мы предпочитаем, чтобы они были “в-стране”, таким образом, понимая культуру и некоторые другие вещи. Также у нас имеется специальная система, дающая им различного рода оценочные задачи. Например, “скажите нам свое мнение о том, насколько хороши результаты для этого запроса”. И потом мы выводим ряд агрегированных метрик, которые проверяются и могут использоваться в дальнейшем.

И как много у вас таких оценщиков?
Сколько их? Не думаю, что могу назвать точную цифру, к сожалению.

Ну примерно? Я слышал порядка 10.000
Ну, их количество довольно большое по ряду причин. Во-первых, у Google множество локалей и на каждую из них требуются оценщики. Во-вторых, мы предпочитаем большую группу, чтобы иметь независимую картину качества. Мы получаем множество запросов со всех стран мира, таким образом, нам нужно большое количество людей для понимания, насколько хороши результаты для них.

А эти оценщики являются студентами или случайными ребятами, ответившими на объявление о работе? Какие к ним требования?
Это довольно разные люди. Требования к ним не супер-специфичны. В основном, мы требуем начальный уровень образования, преимущественно из-за того, что они должны уметь очень активно взаимодействовать с нами, давать комментарии и другие подобные вещи в письменной форме.

Интересно, как вы их обучаете?
Обучение довольно простое. Имеется множество документации и видео-курсов, а также различные практические мероприятия. Мы помогаем им понять, что значит для поисковых результатов быть высокорелевантными и юзабельными для пользователя. Имеется ли преобладающий результат на сегодня для определенного запроса? Если да, то он должен быть прямо здесь в топе. Возьмите, к примеру, запрос “Олимпиада”. Если пользователь ищет по “олимпиада”, результаты с 1996-го года не так интресны, как с 2008-го.

Ну а как вы исследуете данные, полученные от оценщиков? Имеется ли какой-нибудь контроль качества?
Оценщики работают в разных местах и мы не видим их каждый день. Мы даже не разговариваем с ними по телефону. У нас имеются некоторые автоматические измерения, которые берутся во внимание. Также имеются модераторы. Однако, окончательно, контроль качества выполняется ребятами, работающих с ранжированием и поисковым пользовательским интерфейсом. Они единственые, кто понимает, почему мы лучшие сегодня в Китае, чем были неделю назад или месяц назад. Что изменилось? Что мы сделали лучше? Оценочная программа, в действительности, всего лишь дает нашим инженерам агрегированные данные о том, насколько хороши их алгоритмы и, таким образом, они могут их улучшить.

Вы описали процесс, в котором эксперты посещают определенные web-страницы и дают им рейтинг в соответствии с определенными критериями. Эти данные как-то влияют на PageRank сайтов или стоимость бида в поисковой рекламе?
Мы не используем эти данные для подобных целей. Я имею в виду, что потенциально это возможно, но полученные оценочные рейтинги сайтов никогда напрямую не влияют на поисковые результаты. Мы никогда не возвращаемся со словами, “О, мы узнали от эксперта, что этот результат не так хорош как тот, поэтому давайте их поменяем местами”. Поступая таким образом, весь процесс исказится и оценка будет довольно трудоемка. Поэтому мы никогда не трогаем результаты.

Давайте немного вернемся. Откуда истоки этого проекта? Кто его придумал?
С самых первых дней Google нам было интересно, насколько хорошо работают наши алгоритмы. Я тогда ещё не работал здесь, но понял, что имелся набор любимых 10-ти запросов Сергея (Sergey Brin, прим. devaka), при изменениях алгоритма люди производили поиск по этим запросам и нужно было быть уверенным, что все работает отлично. Очевидно, Google приобретал больше популярности и траффика и требовался более широкий набор запросов. Таким образом, мы решили, что нам необходимы оценочные эксперты в тех странах, которые мы обслуживаем, понимающих культуру. Мы нуждались в команде, которая могла бы оценить результаты с перспективой на будущее.

Часть II: Мэт Катс

Matt Cutts - младший программный инженер Как вы поддерживаете качество поиска?
Если в общих чертах, мы улучшаем наши алгоритмы и разрабатываем систему, где используем совершенно новый подход для улучшения релевантности. Моя обязанность следить за людьми, которые пытаются взломать (обмануть) систему и не показывать их выше, чем они бы этого хотели в наших поисковых результатах. Мы хотим, чтобы сайты высоко ранжировались по заслуге, а не по определенным ярлыкам (сигналам).

Понятно, а как вы это делаете?
Мы используем различные данные, например, жалобы пользователей. Также имеется ряд внутренних метрик, используемых нами для отслеживания текущих трендов. Они помогают понять нам, что люди на данный момент используют для спама, который проходит через нашу защиту. Таким образом, мы определяем подобные вещи, мы пишем новые алгоритмы или разрабатываем инструменты, помогающих определять и препятствовать спаму. То есть, большая часть того, чем мы занимаемся, это просто анализ тенденций спама.

Имеется ли элемент человеческой оценки в этом процессе?
Каждая команда отвечает за основные измерения поискового качества, однако, они не меняют рейтинг или делают что-то подобное. Мы всего лишь анализируем очевидные нарушения политики. Например, если при вводе своего имени вы получаете не свой блог, а порно-сайт, вам это не понравится. Вероятно, что вы пожалуетесь в Google. Будет весьма неприятно, если вы получите от нас ответ, “да, мы думаем, что можем усовершенствовать алгоритм, который пофиксит эту проблему через 5-6 месяцев, а пока что мы оставим этот порно-сайт в топе”. Явно, что это совсем неудовлетворительный ответ.

То есть, при спаме, мы иногда применяем ручные методы для такого рода нарушений правил. Однако, философия Google в том, где бы ты не мог использовать машины и алгоритмы, это намного лучше, надежней и имеет расширяемость. Таким образом, мы полагаемся в большей степени на компьютер, как на главную линию обороны.

Однако, вы вынуждены удалять спам вручную пока не найдете алгоритм для борьбы с ним. Настанет ли когда-нибудь тот день, когда человеческое вмешательство подобное тому, как вы описали, не будет настолько необходимым или же мы с каждым годом все больше и больше нуждаемся в человеческом вмешательстве?
Очень классный вопрос, однако, я пока не знаю ответа. Можно спроецировать это на модель PageRank. Этот показатель тем точнее, чем больше страниц участвуют в его подсчете. Также, чем больше страниц вы будете анализировать, тем легче определить насколько достойна уважения определенная страница без человеческого вмешательства.

Так как Интернет растет в размерах, также появляются новые различные нарушения политики поисковой системы, такие как спрятанный текст, клоакинг. Это те вещи, где их лучшим образом определит только человек. И конечно, вы можете определить некоторые из них компьюетными алгоритмами, но не все. Таким образом, наши цели в том, чтобы постоянно быть уверенным в эффективности алгоритмов. Однако, я совершенно не представляю, что из этого выйдет в будущем.

Часть III: Амит Сингал

Amit Singhal - сотрудник Google, работающий с поиском информации Раскажи немного об истории оценочного поиска и твою роль в нем.
Оценочный поиск возник в ранних 60-х в Англии. Поиск тогда был булевым. Первым оценочным показателем была полнота (recall). У вас есть запрос и 100 релевантных ему документов. Сколько из них выйдет на выходе при поиске? Мы быстро смогли найти легкий способ получить 100% полноту. Однако, мы также заметили, что поиск часто возвращал множество нерелевантных документов вместе с релевантными. Таким образом мы пришли ко второму показателю оценки поиска — точности (precision). Точность показывает процент хороших результатов. То есть, если поиск вернул 100 из 100 релевантных документов для запроса, но при этом общее кол-во полученных документов 1000, то полнота будет 100%, а точность всего лишь 10%.

Эти два показателя или некоторая их комбинация учитывались все время, они используются даже в современных поисковых системах, например Google. Таким образом, с самого начала поиска были команды в лаборатории, которые судили насколько релевантны поисковые результаты человеческому запросу.

Но релевантность понятие субъективное.
Верно. Однако, эти показатели оценки качества не влияют напрямую на результаты, возвращаемые пользователям. Они лишь используются для определения, хорошо ли работает алгоритм или лучше ли работает новый алгоритм по сравнению со старым. Они не влияют непосредственно на пользователя а всего лишь являются калибровочными инструментами.

Мэт и Скот упоминали о человеческих поисковых оценках. Хотелось бы узнать, насколько велика их роль в Google?
Ну, наш оценочный поиск основан на многих компонентах. Один из них это человеческая оценка. У нас имеются также автоматические системы, они говорят нам, к примеру, если пользователи внезапно прекращают кликать на первый результат и вместо этого начинают кликать на пятый результат. Все вместе, эти приемы говорят нам, насколько хорошо действует наша система в каждый момент времени. И мы делаем это на более чем ста языках.

Как вы балансируете свежие результаты с более старыми?
Когда новые результаты более релевантны чем старые? Этот вопрос очень важен для наших пользователей и, соостветственно, для наших алгоритмов. Таким образом, мы определяем свежесть запроса — этот запрос заслуживает свежести сегодня, но не три недели назад. Мы также делаем подобное с документами. Мы постоянно спрашиваем, насколько свеж этот документ? Насколько релевантен? Насколько полезен? И мы собираем ответы на эти вопросы исключительно алгоритмически и предоставляем их пользователям в нашем универсальном поиске. Все это делается автоматически, однако, определенный человек сидит тут и говорит, популярен ли сегодня GM или Mumbai. К концу дня человек склонен это делать субъективно, а алгоритмы нет. И они могут сделать такие же определения на сотнях языков.

Насколько далеко мы зашли в поиске?
Мы едва лишь начали. Мы даже и близко не подошли к тому, как это должно быть. Поиск является очень серьезной проблемой и тяжелая часть здесь это то, что ожидания пользователей довольно разносторонние и их запросы все выше и выше по мере улучшения поиска. Таким образом, поиск ни коим образом не решенная проблема.

Так что же будет дальше?
Что будет следующим в поиске? Намного, намного лучший поиск… его широта, когда пользователь не должен идти на YouTube для того, чтобы найти видео или в Google, чтобы найти документы. Если любой вид из контента релевантен вам, он должен показаться в результатах поиска. То есть, поиск станет фокусироваться на том, кто вы и где вы. Он будет локальным для вас, как для индивидуальности, а также локальным с географической точке зрения. Все вместе это даст универсально релевантные результаты, соответствующие вам и вашему местонахождению.

Вернемся немного к роли чевеческой оценки в поиске, как ты думаешь, будет ли это необходимо всегда? Будут ли они более или менее важными в будущем? Как изменится их роль?
Я уверен, что роль человеческой оценки в поиске будет присутствовать до тех пор, пока мы не научимся распознавать язык с помощью компьютера, что довольно далеко от того, где мы находимся сейчас. Вам должно быть известно, мы приложили множество усилий, однако, технология понимания языка далека от того, чтобы определить, искал ли человек именно этот документ или нет.

Комментарии

Добавить комментарий / отзыв

Статьи по теме

Как выбрать и законно использовать стоковые фото для сайта

При одном упоминании «стоковых фотографий» у многих до сих пор всплывает в голове образ идеальных, но до жути неестественных картин�...

2026-05-28

Open Source — что должен знать бизнес перед тем, как взять чужой код

С 2022 года Россия активно взяла курс на импортозамещение в IT. Из-за санкций и ухода западных вендоров государство стало активно подд...

2026-05-07

Чат-боты или живые менеджеры: что выбрать для эффективного продвижения в 2026 году?

Клиентский сервис стремительно меняется — компании всё чаще оказываются перед выбором: автоматизация или живое общение. Мы пон...

2026-04-08

Объективные метрики здоровья сайта, которые должен отслеживать каждый бизнес

Вы вкладываете деньги в рекламу или активно занимаетесь SEO, но количество заявок не радует? Или, наоборот, обращений достаточно, н...

2026-04-01

Почему малый бизнес проигрывает в контекстной рекламе и при чем тут структура сайта

Сегодня поговорим о том, как устроено выживание в интернете в 2026 году. Отличный сервис, качественный продукт, благодарные кли�...

2026-02-22

Зеленый хостинг и экология в IT: тренд или необходимость?

1. Почему интерес к «зеленым» VPS-серверам резко вырос Европейский рынок претерпевает трансформацию. Сегодня компании подходят к выбор...

2026-02-22

Эволюция интерфейсов: от CLI к GUI, к VUI и далее

За какими инновациями стоит следить бизнесу? Компьютерные интерфейсы прошли долгий путь: от первых машин со световыми ...

2026-02-12

PWA vs Нативное приложение: что выбрать малому бизнесу в 2026?

Пользователи все чаще заходят в интернет со смартфонов. Если ваш сайт не адаптирован под мобильные устройства, вы упускаете к...

2026-02-12

Техническое SEO 2025: Фундаментальное руководство по созданию безупречного цифрового актива

Полный анализ ключевых технических аспектов современного SEO Скорость загрузки: оптимизация до миллисекунд Глубоки�...

2025-12-11

Оптимизация сайтов: как микроразметка Schema.org влияет на видимость и привлечение клиентов

Сегодня веб-сайты можно сравнить с огромной библиотекой, где каждая страница --- это отдельная книга. Поисковым системам становит...

2025-12-11

Метатеги для сайта: исчерпывающее руководство по Title, Description, Canonical, Robots и другим тегам

В данном материале мы разберем ключевые метатеги и предоставим практические советы по их применению для повышения эффекти�...

2025-12-02

NFT 2.0: новые стандарты токенов

Стандарт ERC-6551 — это современный протокол для невзаимозаменяемых токенов (NFT), вызвавший активное обсуждение в сообществе Ethereum. Разра...

2025-10-27

Основные принципы DevOps

Содержание: Преимущества DevOps Ключевые принципы DevOps Лучшие практики DevOps Заключение DevOps — это культурная трансформа�...

2025-10-27

Искусственный интеллект в SEO: новые правила борьбы за цифровое внимание

От 29% до 36% пользователей уже обращаются к возможностям искусственного интеллекта вместо традиционных поисковых систем. В ответ на э�...

2025-10-24

Сложности управления данными в эпоху облачных технологий

В условиях глобальной цифровой экономики передача данных между юрисдикциями создает серьезные правовые вызовы. При использовани�...

2025-10-10

| Эта статья состоит из трех интервью с различными представителями компании Google, взятых Джоном Пачковским для Digital Daily (перевод Google and the Evolution of Search I: Human Evaluators). Наша | РэдЛайн, создание сайта, заказать сайт, разработка сайтов, реклама в Интернете, продвижение, маркетинговые исследования, дизайн студия, веб дизайн, раскрутка сайта, создать сайт компании, сделать сайт, создание сайтов, изготовление сайта, обслуживание сайтов, изготовление сайтов, заказать интернет сайт, создать сайт, изготовить сайт, разработка сайта, web студия, создание веб сайта, поддержка сайта, сайт на заказ, сопровождение сайта, дизайн сайта, сайт под ключ, заказ сайта, реклама сайта, хостинг, регистрация доменов, хабаровск, краснодар, москва, комсомольск |

Дайджест новых статей по интернет-маркетингу на ваш email

Продающие сайты "под ключ"!

Наши сайты зарабытывают вам деньги. Landing-page. Эффективные продающие сайты точно в срок и под ключ! Всего от 29800 рублей
Подробнее...

Интернет-магазины и каталоги "под ключ"!

Эффективные и удобные инструменты торговли (электронной торговли) "под ключ". Продают, даже когда вы спите! Всего от 54200 рублей
Подробнее...

Комплексный интернет-маркетинг и продвижение сайтов

Максимальную эффективность дает не какой-то конкретный метод, а их комбинация. Комбинация таких методов и называется комплексным интернет-маркетингом. Всего от 10000 рублей в месяц
Подробнее...

Скидка 50% на разработку логотипа

Профессиональный логотип поможет вашему бизнесу привлечь новых покупателей и усилить их приверженность к торговой марке, а также повысить доверие, так как он работает на вас 24 часа в сутки. В заключение к этому можно сказать, что лoготип занимает центральное место в индивидуальности компании.
Подробнее...

Реклама в Yandex и Google

Контекстная реклама нацелена лишь на тех пользователей, которые непосредственно заинтересованы в рекламе Ваших услуг или товаров. Всего от 10000 рублей в месяц
Подробнее...

Social media marketing (SMM) — продвижение в социальных медиа

Реклама в VK, Однокласcниках и на Mail.ru Создание, ведение и раскрутка групп и реклама ВКонтакте и Facebook. Всего от 10000 рублей в месяц
Подробнее...

Приглашаем к сотрудничеству рекламные агентства и веб-студии!

Внимание Акция! Приглашаем к сотрудничеству рекламные агентства и различные веб-студии России! Индивидуальные и взаимовыгодные условия сотрудничества.
Подробнее...

Ускоренная разработка любого сайта от 5 дней!

Внимание Акция! Ускоренная разработка любого сайта! Ваш сайт будет готов за 5-10 дней. Вы можете заказать разработку любого сайта "под ключ" за 5-10 рабочих дней, с доплатой всего 30% от его стоимости!
Подробнее...

Ждем новых друзей!

Внимание Акция! Ждем новых друзей! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта при переходе к нам от другого разработчика.
Подробнее...

Приведи друга и получи скидку!

Внимание Акция! Приведи друга и получи скидку! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта, если клиент заказавший наши услуги, пришел по Вашей рекомендации.
Подробнее...

1 2 3 4 5 6 7 8 9

Смотреть все акции и спец. предложения Оставить заявку на заказ!

Новые статьи и публикации

Темы

Одного яйца два раза не высидишь.

К. Прутков

Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!

Качественное и объемное представление своего бизнеса в Сети требуется любой растущей коммерческой структуре, стремящейся увеличить продажи, именно по этой причине среди наших клиентов как крупные так и небольшие компании во многих городах России и ближнего зарубежья.

Как мы работаем

Заявка
Позвоните или оставьте заявку на сайте.

Консультация
Обсуждаем что именно Вам нужно и помогаем определить как это лучше сделать!

Договор
Заключаем договор на оказание услуг, в котором прописаны условия и обязанности обеих сторон.

Выполнение работ
Непосредственно оказание требующихся услуг и работ по вашему заданию.

Поддержка
Сдача выполненых работ, последующие корректировки и поддержка при необходимости.

Остались еще вопросы? Просто позвоните и задайте их специалистам

8 (924) 311-3435

Или пишите нам в Max | WA | TG

8 (924) 311-3435

Или пишите нам в Max | WA | TG

Создание сайта	Копирайтинг
Поисковое продвижение	Контекстная реклама
Реклама в соц. сетях	Сопровождение сайта
Не знаю, посоветуйте

Смена дизайна сайта	Установка модулей
Чистка кода от вирусов	Внутренняя оптимизация
Перенос сайта	Установка аналитики
Нет в списке

Оценочный поиск в Google

Часть I: Скот Хафман

Часть II: Мэт Катс

Часть III: Амит Сингал

Статьи по теме

Дайджест новых статей по интернет-маркетингу на ваш email

Продающие сайты "под ключ"!

Интернет-магазины и каталоги "под ключ"!

Комплексный интернет-маркетинг и продвижение сайтов

Скидка 50% на разработку логотипа

Реклама в Yandex и Google

Social media marketing (SMM) — продвижение в социальных медиа

Приглашаем к сотрудничеству рекламные агентства и веб-студии!

Ускоренная разработка любого сайта от 5 дней!

Ждем новых друзей!

Приведи друга и получи скидку!

Новые статьи и публикации

Темы

Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!

Как мы работаем

Заказать услуги со скидкой \ Бесплатная консультация

КАКИЕ УСЛУГИ ВАС ИНТЕРЕСУЮТ?

КАКИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ ПОТРЕБУЮТСЯ?

Что нужно сделать, чтобы заказать создание сайта у нас?

Для всех тарифных планов на создание и размещение сайтов включено:

Комплексная раскрутка работает в рамках стратегии развития вашего бизнеса в сети и направлена

ЭФФЕКТИВНОЕ СОПРОВОЖДЕНИЕ (ПОДДЕРЖКА, ОБСЛУЖИВАНИЕ) САЙТОВ

Современный, технологичный, кроссбраузерный ... Профессиональный дизайн сайтов и веб-приложений

Адаптивный дизайн сайтов и веб-приложений

Реклама в поисковых системах Яндекс и Google. Профессиональная настройка рекламы и отслеживание эффективности!