РЭДЛАЙН
Лучшие решения для Вас и Вашего бизнеса!
На нашем сайте вы можете получить информацию о веб-разработке, обслуживании и продвижении сайта. Интернет-маркетинге. SEO (поисковой оптимизации). Контекстной и медийной рекламе в Интернете. SMM. Регистрации доменов и хостинговых услугах. И современном дизайне сайтов. Вообщем того что касается веб-разработки, а также много другой полезной информации из мира интернета, бизнеса и интернет-технологий...
Создаем доступные и современные сайты, которые работают! Обслуживаем и эффективно продвигаем интернет-проекты с 2006 года!
Главная Блоги Описание поискового спама


Описание поискового спама

Поисковые системы сейчас являются точкой входа в Интернет для большинства пользователей сети. С помощью поисковых систем люди ищут не только информацию общего плана, но и используют в коммерческих целях. Соответственно, эта платформа представляет интерес для множества коммерческих структур. Одни, стараются играть по правилам и достигают хороших результатов не сразу, но имеют долгосрочные перспективы. Другие же компании ищут разнообразные методы, чтобы достичь результатов (хорошего положения в ТОПе) как можно быстрее. На этой почве появился так называемый поисковый спам.

В Яндексе этот вид спама называют поисковым, в Google используют термин “вебспам”. Причем, поисковые системы не описывают вебспам как страницы низкого качества (хотя это подразумевается тоже). Поисковый спам относится скорей к цели существования самой страницы, а также к целям (соответственно, и методам) её продвижения.

В лицензии Яндекса поисковому спаму дается следующее определение:

3.7. «Поисковый спам» — это попытки обмана поисковой системы Сервиса и манипулирования ее результатами с целью изменения позиции того или иного веб-сайта в результатах поиска.

Заметьте, здесь не говорится о качестве сайта или документа, а лишь о манипулировании выдачей. Другими словами, какой бы хороший сайт у вас не был, если вы пытаетесь прорекламировать свою страницу в ТОПе с помощью увеличения её рейтинга, скорей всего её пометят как вебспам.

Google не дает четкого определения вебспама, а ограничивается лишь рекомендациями по обеспечению качества сайта в своем руководстве для вебмастеров. Однако, вскользь упоминает на официальном блоге что

Вебспам это мусор в поисковой выдаче, когда сайты пытаются обманом выйти на топовые позиции или нарушают требования к обеспечению качества…

Таким образом, причину спама необходимо искать и в контенте и в ссылках.

Как поисковый спам учитывается при поиске

При ранжировании сайтов поисковыми системами в формуле учитывается не только релевантность сайта, его авторитетность и все остальные показатели качества, но также и коэффициент спамности. Причем, этот коэффициент не бинарный (спам или не спам), а непрерывный, как многие другие ранки.

Для работы с поиском в Google даже существует разные отделы, один посвящен качеству поиска (Search Quality Team) и его задача как раз обеспечивать качество выдачи (работают с формулой ранжирования). Глава этого отдела Амит Сингал (Amit Singhal). Другой отдел (Webspam Team) борется с поисковым спамом во главе с Мэттом Каттсом (Matt Catts). Соответственно, алгоритм “Панда” (в 2011 г) это разработка отдела качества, в то время как алгоритм “Пингвин” (в 2012-ом) это порождение отдела по борьбе с вебспамом.

В одном из своих патентов компания Microsoft приводит схему, как формируется поисковая выдача с учетом модуля классификатора вебспама (для общего представления).

Описание поискового спама

Стоит отметить, что для определения спамности документа используются не только автоматические методы, но и ручные (в единичных случаях), а также “стуки” от вебмастеров через специальную форму.

Небольшое описание проблемы поискового спама

Для описания проблемы определения поискового спама ниже приведена небольшая выдержка из документа Spam: It’s Not for Inboxes Anymore (научный труд ребят из стенфордского университета по классификации веб-спама, на который, впоследствии, ссылались авторы других трудов).

“В ряде случаев вебспам очевиден. Например, при публикации этой статьи (в 2005 г), топовым результатом поиска Google по запросу “Kaiser pharmacy online” была страница, внешне аналогичная выдаче Google, за исключением заголовка Gogle, и все ссылки вели на ряд сайтов, продающих дешевые лекарства, отпускаемые по рецепту. Естественно, эти грубые результаты намеренно подрывают репутацию Google и, несомненно, должны быть помечены как “спам”.

Однако, рассмотрим другой случай. Сайт “World News Network” ранжируется третьим в Google по запросам “world news” и “news network”, наряду с такими компаниями, как CNN, BBC и FOX. Пользователю очевидно, что WNN не является источником новостей; это компания, владеющая тысячами сайтов, каждый из которых по отдельности является онлайн-газетой определенной тематики в определенном географическом регионе (например, Бизнес в Каире или Азиатское Побережье). Дальнейший просмотр сайтов покажет, что многие статьи нетематичны. Например, определенные статьи, принадлежащие разделу “Бизнес в Каире”, мало относятся к бизнесу в Каире, и больше раскрывают основные события, такие как война в Ираке. Эти WNN-ресурсы, плотно ссылаются друг на друга, при этом, нет других неаффилированных сайтов, ссылающихся на них. Несмотря на то, что статьи берутся из достойных источников, вроде Associated Press, CNN и New York Times, ссылки на действительный источник ставятся редко. Таким образом, здесь имеется серая область. Агрегация новостей может быть полезной, но дает ли WNN что-либо истинно ценное или существует лишь для получения прибыли с рекламы на его страницах?

Размытость картины также зависит от субъективного взгляда пользователя. При поиске “miserable failure” в Google и Yahoo первым результатом была официальная биография президента Джоржа Буша (Мишель Мур и Хиллари Клинтон также были в десятке). Спамные техники, конечно же, влияли на рейтинг, но в данном случае вебспам неочевиден, так как одобряете ли вы результат или нет, зависит от личных предпочтений. Таким образом, даже если ценность заключается в довольно странном результате, она всё же есть.

Таким образом, определение вебспама не так просто как может показаться. С одной стороны, вебспам это явное влияние на ожидание людей. С другой стороны, это серьезная проблема. Ежедневно производится множество попыток повлиять на людей – рекомендации, телевидение и газеты, политическая пропаганда и евангелизм. Одному пользователю что-то может казаться некорректным, обманчивым, неубедительным и раздражающим, другие могут в этом находить соответствие своим взглядам. Автоматически генерируемый мусор, никому не несущий ценности, легко классифицировать как спам. Однако, что на счет большой серой области, где контент несет для кого-то хотя бы небольшую ценность? И кому решать, где кончается серая область и начинается сплошной бесполезняк?”

Классификация

Авторы приведенного выше труда классифицировали поисковый спам и опубликовали одноименный документ.

Webspam Taxonomy (405 Кб) (см. перевод на SeoNews).

Судя описанной классификации вебспам бывает текстовый и ссылочный. Опишем коротко каждый из них. Ниже приведен рисунок, описывающий текстовый вебспам.

(кликните для увеличения)
Описание поискового спама

Текстовый спам это, прежде всего, повторения ключевого слова (переоптимизация) в различных информационных составляющих сайта (теле документа, заголовке, мета-тегах, ссылках и ЧПУ). Но также сюда относятся:

Свалка. Когда страница завалена множеством разных ключевых слов, чтобы повысить вероятность захода на неё хотя бы по ряду низкочастотных запросов.

Вплетение. Когда берутся цитаты с других источников (например, новостных) и в них вплетается нужная ключевая фраза (или несколько).

Смешивание. Когда контент агрегируется из различных источников в надежде синтезировать что-то уникальное.

Среди ссылочного поискового спама также имеется большое разнообразие:

(кликните для увеличения)
Описание поискового спама

Здесь предлагается анализировать не только входящие ссылки, но и исходящие, где к спаму относят каталоги ссылок (часто нетематические). Что касается входящих, то это:

Линк-фермы. Специально созданные сайты для размещения на них ссылок. Часто это сеть сателлитов, сплогов или специальные ссылочные системы.

Скрытые ссылки. Ссылки на сайте-доноре либо скрыты в коде, либо имеют цвет фона, чтобы их не видели посетители (или сам владелец сайта, если ресурс был взломан).

Обмен ссылками. Участие в системах по обмену ссылками. Также сюда относится обмен со своими же ресурсами (сателлитами).

Ссылки из комментариев. Уже в 2005 году понимали малозначимость ссылок из комментариев. Особенно, если они имели такой вид: “У вас хороший сайт. Загляните также на мой про <a>казино</a>”.

Ссылки с/на освобождающиеся домены. Чаще всего освобождающиеся домены с имеющейся ссылочной массой покупают именно с целью манипулирования выдачей.

Немодерируемые ссылки. Все типы ссылок, которые не проходят модерацию. Сюда относятся и гостевые книги, доски объявлений, а также ряд других сайтов (каталогов).

Помимо ссылочного и текстового спама в классификации выделены другие общеизвестные типы, такие как клоакинг, редирект (дорвеи) и скрытый контент.

Методы обнаружения

На основе приведенной выше классификации поискового спама было разработано множество методов его определения, разработаны различные SpamRank, Anti-Trust Rank и другие Spam-ранки.

1. Антиспам контента

Один из методов определения контентного поискового спама это статистический анализ различных его информационных составляющих. В одном из документов специалисты из Microsoft показывают явные зависимости спамности контента от количества используемых слов, средней их длины, сжимаемости текста, используемых водянистых слов и других параметров.

Detecting Spam Web Pages throught Content Analysis (221 Кб)

Например, ниже показано распределение страниц в зависимости от количества используемых слов, а также красной линией вероятность спама в зависимости от того же числа слов на странице.

Описание поискового спама

Здесь четко видно, что страницы с количеством слов больше 500-600 явно выделяются из общей массы и вероятность спама в них больше, чем для остальных. На следующем рисунке та же зависимость, только по заголовку TITLE.

Описание поискового спама

Заголовки длиннее 10-15 слов встречаются в сети достаточно редко и чем длиннее заголовок, тем больше вероятность попадания документа в спам-зону.

Ещё интересна зависимость спамности контента от его способности к сжатию (архивации).

Описание поискового спама

Спамный контент часто хорошо сжимается. И так далее… Смотрите другие интересные зависимости в приведенном выше документе.

Для определения текстового поискового спама используются и другие техники. Читайте, например:

Spam, Damn Spam, and Statistics (706 Кб) — другой документ от Microsoft, описывающий статистические методы определения спама.

Анализ разнообразия тематической структуры текста (224 Кб) — труды специалиста из МГУ, где описаны методы обнаружения массово порождаемых неестественных текстов на основе анализа разнообразия тематической структуры текста (поиск шаблонности).

2. Ссылочный антиспам

Из-за большого разнообразия ссылочного поискового спама также существует большое разнообразие методов его идентификации. Например, Anti-Trust Rank (по аналогии с TrustRank) по начальной выборке заведомо спамных сайтов находит аналогичные ресурсы. SpamRank меряет количество незаслуженного PageRank с помощью анализа обратных ссылок. Другие алгоритмы позволяют определять линк-фармы, сетки сайтов, обменивающихся ссылками, и другие спам-техники. Ниже приведены некоторые из полезных для прочтения документов на эту тему.

Анализ качества контента и ссылок для антиспама (148 Кб)
(Университет в Пекине, Китай).

Поиск ссылочных шаблонов для борьбы с вебспамом (237 Кб)
(Венгерская Академия Наук).

Рейтинг Дирихле (238 Кб)
(Университет Иллинойс в Урбана-Шампейне).

Ссылочные альянсы (485 Кб)
(Стэнфордский университет).

R-SpamRank: Определение спама с помощью анализа ссылок (97 Кб)
(Университет Цинхуа, Китай).

Исключение влияния ссылочного плагиата при ранжировании (104 Кб)
(Университет Лехай, США).

Использование латентных графов с положительными и отрицательными ссылками для устранения спама в информационном поиске (211 Кб)
(Калифорнийских технологический институт).

Заключение

Как пишут сами представители поисковых систем, для определения спама идет попытка идентифицировать не только используемые техники, но и мотивы. Например, скрытие контента не говорит ничего само по себе, так как контент может скрываться с целью улучшения юзабилити сайта и данный метод использоваться не для манипулирования выдачей, а для удобства пользователя.

Несмотря на всю сложность определения поискового спама, на данный момент существует достаточное количество методов и большие обучающие выборки. Но здесь возникает вопрос: не расширилась ли классификация поискового спама, относится ли покупка ссылок к спамным техникам?

Скорей всего с 2005 года классификация расширилась и к текстовому поисковому спаму может относится также количество страниц в дополнительном индексе (наличие большого количества дублей и шаблонных страниц на сайте), что наблюдается одной из причин попадания сайтов под антиспам-фильтр “Пингвин” в Google (исходя из проведенного эксперимента).

Также, покупка ссылок является спамной техникой, но не сам факт покупки, а наличие в этих ссылках продвигаемых ключевых фраз. Ещё в прошлом году на CyberMarketing 2011 и на Optimization.by Кирилл Николаев (руководитель группы отдела вебпоиска Яндекс) выступал с докладом, где упоминалось о неучете ряда ссылок для сайтов (иногда до 90% ссылочной массы просто игнорируется). То же самое мы наблюдаем в антиспам-алгоритме “Пингвин” от Google, где явно видно отсечение влияния прямых вхождений ключевых запросов в анкорах входящих ссылок, если они занимают первое место в анкор-листе.

Если несколько лет назад поисковики не могли отключить влияние всех продажных ссылок из-за малого количества игроков в определенных тематиках, то к этому времени коммерческих сайтов появилось достаточно много и есть из кого выбрать ТОП, поэтому, ссылки начали играть меньшую роль, и больше уделяется внимание ценности ресурса и его юзабилити.

Целью данной статьи не было найти современные способы продвижения сайтов, а лишь описать поисковый спам, показать серьезность проблемы для поисковиков и какие они используют подходы для её решения. На основе этих данных, надеюсь, читатель увидит тенденции и будет прилагать дальнейшие усилия по продвижению сайта в перспективное русло!

Описание поискового спама | | 2012-08-01 04:04:00 | | Блоги и всяко-разно | | Поисковые системы сейчас являются точкой входа в Интернет для большинства пользователей сети. С помощью поисковых систем люди ищут не только информацию общего плана, но и используют в коммерческих | РэдЛайн, создание сайта, заказать сайт, разработка сайтов, реклама в Интернете, продвижение, маркетинговые исследования, дизайн студия, веб дизайн, раскрутка сайта, создать сайт компании, сделать сайт, создание сайтов, изготовление сайта, обслуживание сайтов, изготовление сайтов, заказать интернет сайт, создать сайт, изготовить сайт, разработка сайта, web студия, создание веб сайта, поддержка сайта, сайт на заказ, сопровождение сайта, дизайн сайта, сайт под ключ, заказ сайта, реклама сайта, хостинг, регистрация доменов, хабаровск, краснодар, москва, комсомольск |
 
Дайджест новых статей по интернет-маркетингу на ваш email
Подписаться

Продающие сайты "под ключ"!

Наши сайты зарабытывают вам деньги. Landing-page. Эффективные продающие сайты точно в срок и под ключ! Всего от 14700 рублей
Подробнее...

Интернет-магазины и каталоги "под ключ"!

Эффективные и удобные инструменты торговли (электронной торговли) "под ключ". Продают, даже когда вы спите! Всего от 33800 рублей
Подробнее...

Комплексный интернет-маркетинг и продвижение сайтов

Максимальную эффективность дает не какой-то конкретный метод, а их комбинация. Комбинация таких методов и называется комплексным интернет-маркетингом. Всего от 8000 рублей в месяц
Подробнее...

Реклама в Yandex и Google

Контекстная реклама нацелена лишь на тех пользователей, которые непосредственно заинтересованы в рекламе Ваших услуг или товаров. Всего от 8000 рублей в месяц
Подробнее...

Social media marketing (SMM) — продвижение в социальных медиа

Реклама в Однокласcниках и на Mail.ru Создание, ведение и раскрутка групп и реклама ВКонтакте и Facebook. Всего от 8000 рублей в месяц
Подробнее...

Приглашаем к сотрудничеству рекламные агентства и веб-студии!

Внимание Акция! Приглашаем к сотрудничеству рекламные агентства и различные веб-студии России! Индивидуальные и взаимовыгодные условия сотрудничества.
Подробнее...

Ускоренная разработка любого сайта от 5 дней!

Внимание Акция! Ускоренная разработка любого сайта! Ваш сайт будет готов за 5-10 дней. Вы можете заказать разработку любого сайта "под ключ" за 5-10 рабочих дней, с доплатой всего 30% от его стоимости!
Подробнее...

Ждем новых друзей!

Внимание Акция! Ждем новых друзей! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта при переходе к нам от другого разработчика.
Подробнее...

Приведи друга и получи скидку!

Внимание Акция! Приведи друга и получи скидку! Скидка 10% на услуги по созданию и(или) обслуживанию вашего сайта, если клиент заказавший наши услуги, пришел по Вашей рекомендации.
Подробнее...

1 2 3 4 5 6 7 8 9

Новые статьи и публикации



Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!

Качественное и объемное представление своего бизнеса в Сети требуется любой растущей коммерческой структуре, стремящейся увеличить продажи, именно по этой причине среди наших клиентов как крупные так и небольшие компании во многих городах России и ближнего зарубежья.
Как мы работаем

Заявка
Позвоните или оставьте заявку на сайте.


Консультация
Обсуждаем что именно Вам нужно и помогаем определить как это лучше сделать!


Договор
Заключаем договор на оказание услуг, в котором прописаны условия и обязанности обеих сторон.


Выполнение работ
Непосредственно оказание требующихся услуг и работ по вашему заданию.


Поддержка
Сдача выполненых работ, последующие корректировки и поддержка при необходимости.

Остались еще вопросы? Просто позвоните и задайте их специалистам
с 2:30 до 11:30 по Мск, звонок бесплатный
Или напишите нам в WhatsApp
с 9:30 до 18:30 по Хабаровску
Или напишите нам в WhatsApp
Веб-студия и агентство комплексного интернет-маркетинга «РЭДЛАЙН» © 2006 - 2024

Профессиональная Веб-разработка. Создание сайтов и магазинов "под ключ" , а также по всей России и зарубежью. Продвижение и реклама. Веб-дизайн. Приложения. Сопровождение. Модернизация. Интеграции. Консалтинг. Продвижение и реклама. Комплексный Интернет-маркетинг.

Оставьте заявку / Задайте вопрос

Нажимая на кнопку ОТПРАВИТЬ, я даю согласие на обработку персональных данных
×

Заказать услугу

Нажимая на кнопку ОТПРАВИТЬ, я даю согласие на обработку персональных данных
×

Обратный звонок

Нажимая на кнопку ОТПРАВИТЬ, я даю согласие на обработку персональных данных
×

Подписка на дайджест новостей

Нажимая на кнопку ОТПРАВИТЬ, я даю согласие на обработку персональных данных
×

Заказать услуги со скидкой \ Бесплатная консультация







КАКИЕ УСЛУГИ ВАС ИНТЕРЕСУЮТ?

КАКИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ ПОТРЕБУЮТСЯ?

Нажимая на кнопку ОТПРАВИТЬ, я даю согласие на обработку персональных данных
×

Высококачественные сайты по доступным ценамМы создаем практически любые сайты от продающих страниц до сложных, высоконагруженных и нестандартных веб приложений! Наши сайты это надежные маркетинговые инструменты для успеха Вашего бизнеса и увеличения вашей прибыли! Мы делаем красивые и максимально эффектные сайты по доступным ценам уже много лет!

Что нужно сделать, чтобы заказать создание сайта у нас?

Ну для начала вам нужно представлять (хотя бы в общих чертах), что вы хотите получить от сайта и возможно каким вы хотите его видеть. А дальше все просто. Позвоните нам или оставьте заявку нашим менеджерам, чтобы они связались с Вами, проконсультировали и помогли определиться с подходящим именно Вам сайтом по цене, сроку, дизайну или функционалу. Если вы все ещё не уверены, какой сайт вам нужен, просто обратитесь к нам! Мы вместе проанализируем вашу ситуацию и определим максимально эффективный для вас вариант.

Быстрый заказ \ Консультация

Для всех тарифных планов на создание и размещение сайтов включено:

Комплексная раскрутка сайтов и продвижение сайта Комплексный подход это не просто продвижение сайта, это целый комплекс мероприятий, который определяется целями и задачами поставленными перед сайтом и организацией, которая за этим стоит. Время однобоких методов в продвижении сайтов уже прошло, конкуренция слишком высока, чтобы была возможность расслабиться и получать \ удерживать клиентов из Интернета, просто сделав сайт и не занимаясь им...

Комплексная раскрутка работает в рамках стратегии развития вашего бизнеса в сети и направлена

Быстрый заказ \ Консультация

ЭФФЕКТИВНОЕ СОПРОВОЖДЕНИЕ (ПОДДЕРЖКА, ОБСЛУЖИВАНИЕ) САЙТОВ

Полный комплекс услуг по сопровождению сайтаМы оказываем полный комплекс услуг по сопровождению сайта: информационному и техническому обслуживанию и развитию Интернет сайтов.

Передав свой сайт для поддержки в руки наших специалистов, Вы избавитесь от проблем, связанных с обновлением информации и контролем за работой ресурса.

Наша компания осуществляет техническую и информационную поддержку уже имеющихся сайтов. В понятие «поддержка сайтов» также входят услуги администрирования сайтов, обновления сайтов и их модернизация.

Быстрый заказ \ Консультация

Редизайн сайта и Адаптивный веб дизайн

Современный, технологичный, кроссбраузерный ... Профессиональный дизайн сайтов и веб-приложений

Редизайн сайта — создание нового дизайна сайта с целью улучшения внешнего вида, функциональности и удобства использования. Редизайн сайта – это способ преобразовать проект к извлечению из него максимальной отдачи и средств. В современном мире задачами редизайна является поднятие существующего сайта на новый уровень для внедрения новых технологий, при этом сохраняя многолетний сформировавшийся опыт и успешные решения компаний.

Адаптивный дизайн сайтов и веб-приложений

Все больше людей пользуются мобильными устройствами (телефонами, планшетами и прочими) для посещения Интернета, это не для кого уже не новость. Количество таких людей в процентном отношении будет только больше с каждым годом, потому что это удобно и по многим другим причинам.

На сегодняшний день адаптивный дизайн является стандартным подходом при разработке новых сайтов (или веб-приложений) и в идеале ваш сайт должен смотреться и функционировать так, как вы задумывали, на всём разнообразии устройств.

Быстрый заказ \ Консультация

Контекстная реклама в Яндекс и GoogleКонтекстная реклама - это эффективный инструмент в интернет маркетинге, целью которого является увеличение продаж. Главный плюс контекстной рекламы заключается в том, что она работает избирательно.

Реклама в поисковых системах Яндекс и Google. Профессиональная настройка рекламы и отслеживание эффективности!

Рекламные объявления показываются именно тем пользователям, которые ищут информацию о Ваших товарах или услугах, поэтому такая реклама не является навязчивой и раздражающей в отличие от других видов рекламы, с которыми мы сталкиваемся на телевидении или радио. Контекстная реклама нацелена лишь на тех пользователей, которые непосредственно заинтересованы в рекламе Ваших услуг или товаров.

Быстрый заказ \ Консультация

Скидка

1500 руб.
Заинтересовались услугами создания, обслуживания или продвижения вашей компании в Интернете?!
Получите 1500 руб.
за он-лайн заявку
Предложение ограничено.

После получения заявки с Вами свяжутся наши специалисты и уточнят все детали по интересующей вас услуге.
«Нажимая на кнопку "Получить скидку", я даю согласие на обработку персональных данных»
×
Получите 1500 рублей!
×
×