Как защититься от парсинга сайта?

Нашел сайт, который ежедневно копирует весь мой новый контент. Причем спокойно находится в яндексе. Позиции у этого сайта пониже, чем у моего, но всё равно неприятно. Уж я думал, давно поисковики научились за такое грубое копирование штрафовать, а оказывается нет.

Есть какие-то современные действенные методы по борьбе с парсингом?

Ответы

100% защиты от парсинга открытых данных не бывает, про какие-либо новые методы борьбы не слышал, я бы на вашем месте:
1) Собрал бы информацию о нарушителе: IP, user agent, может сервисы метрик что покажут.
2) Если сайт нарушителя не совсем мусорный написал бы администратору, не ответит/откажет жалоба хостингу с доказательствами (как вариант сделать заранее 3 снимка независимым сервисом с временными метками: ваш сайт после размещения контента, сайт нарушителя без него и сайт нарушителя после копирования контента).
3) Искал бы признаки, по которым можно однозначно определить посещения нарушителя, примитивный бот-парсер может использовать всегда один IP — заблокировать, выдать капчу, скрывать или модифицировать контент.
4) Если не смогу заблокировать бота других вариантов не вижу, начал бы уведомлять поисковики о новом контенте сразу после публикации (в яндекс вебмастере это переобход страниц), у гугла есть DMCA запросы https://support.google.com/legal/trouble...

поставьте антибот antibot.cloud и не будите знать проблем.

Если есть возможность отследить парсер по ip или агенту :
1) можно выводить поддельный контент с использованием кириллических и латинских букв в словах.

Насчёт результата не уверен, просто читал что Гугл ставит в ранжировании такие сайты со словами которые состоят из букв разных алфавитов в конец, так как это попытка обмануть Гугл на уникальность статьи.

2) при генерации миниатюр и превью, создавать копии картинок с ватермарком, и в таком случае бот будет парсить запачканный картинки, а пользователь получит в хорошем качестве.

Отправить комментарий

Если вы укажете номера тикетов или имя пользователя, отзыв будет выглядеть убедительнее, а провайдеру будет проще разобраться с вашей проблемой

Подробнее о форматировании

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
5 + 7 11 + 8 плюс 3 8