Что такое дублированный контент и как от него избавиться

Что такое дублированный контент?

Итак, во-первых, что такое дублированный контент?

По сути, дублированный контент — это контент, который появляется более чем в одном месте в Интернете. Но это может быть не так чисто, как кажется. Контент, который слишком похож, даже если он не идентичен, может считаться дубликатом друг друга.

Размышляя о дублированном контенте, важно помнить, что дело не только в том, что видят посетители-люди, когда переходят на ваш сайт и сравнивают две страницы. Это также касается того, что видят поисковые системы и сканеры, когда они обращаются к этим страницам. Поскольку они не могут видеть отображаемую страницу, они обычно уходят из исходного кода страницы, и если этот код слишком похож, поисковый робот может подумать, что он просматривает две версии одной и той же страницы.

Представьте, что вы идете в пекарню, и перед вами два кекса, которые выглядят почти одинаково. У них нет никаких знаков. Как узнать, какой именно вам нужен? Вот что происходит, когда поисковая система обнаруживает две слишком похожие страницы.

Эта путаница между частями контента может привести к таким вещам, как проблемы с ранжированием, потому что поисковые системы могут быть не в состоянии определить, какую страницу они должны ранжировать, или они могут ранжировать неправильную страницу. В инструментах Moz у нас есть 90% -ный порог для повторяющегося контента, что означает, что любые страницы с кодом, который хотя бы на 90% совпадает, будут помечены как дубликаты друг друга.

Решения

Итак, теперь, когда мы вкратце рассмотрели, что такое дублированный контент, что нам с этим делать? Есть несколько разных способов устранить дублирующийся контент.

301 редирект

Во-первых, это возможность реализовать 301 редирект. Этот вариант будет похож на копию фильма на VHS, которая, возможно, уже не так актуальна.

Итак, вы должны быть уверены, что предоставили людям цифровую версию, которая транслируется в Интернете. На своем сайте вы можете перенаправлять старые версии страниц на новые, обновленные версии. Это актуально для проблем с изменениями поддоменов или протоколов, а также с обновлениями контента, когда вы больше не хотите, чтобы люди имели доступ к этому старому контенту.

Rel=canonicals

Далее следует возможность реализовать rel = canonicals на вашей странице. Допустим, вы на распродаже выпечки и у вас с собой два вида печенья: сахар и шоколадная крошка. Вы считаете свое сахарное печенье первоклассным. Поэтому, когда люди спрашивают вас, какое из них им следует попробовать, вы указываете им на сахарное печенье, хотя у них все еще есть возможность попробовать шоколадную стружку.

На вашем сайте это будет похоже на продажу двух предметов разного цвета. Вы хотите, чтобы посетители-люди могли видеть и получать доступ к обоим цветам, но вы должны использовать канонический тег, чтобы сообщить поисковым роботам, какая страница более релевантна для ранжирования.

Мета noindex

У вас также есть возможность пометить страницы как noindex.

Например, у вас может быть два издания вашей любимой книги. Вы будете читать и ссылаться на это второе издание, потому что оно самое новое и самое актуальное. Но вы по-прежнему хотите иметь возможность читать и получать доступ к первой редакции, если вам это понадобится. Мета-теги noindex сообщают поисковому роботу, что он все еще может сканировать эту повторяющуюся страницу, но не должен включать ее в свой индекс. Это может помочь с проблемами дублирования контента из-за таких вещей, как разбиение на страницы.

Добавить содержание

Но что, если у вас есть две страницы, которые на самом деле не дублируют друг друга? Они посвящены разным темам, и их следует рассматривать как отдельные части контента. Что ж, в этом случае вы можете добавить больше контента на каждую из этих страниц, чтобы это не сбивало с толку поискового робота.

Это позволит им выделяться друг от друга, и это будет похоже на добавление посыпки и вишни к одному кексу и, возможно, глазури другого цвета к другому.

Используйте Moz Pro для выявления и устранения повторяющегося контента

Если вам когда-либо понадобится помощь в определении того, какие страницы вашего сайта могут считаться дублирующими друг друга, вам могут помочь Moz Pro Site Crawl и On-Demand Crawl.

В обоих этих инструментах мы будем отмечать, какие страницы считаются дубликатами друг друга, и вы даже можете экспортировать эти данные в CSV, чтобы вы могли анализировать их вне инструмента. Просто небольшой совет. При экспорте этих данных в CSV группа дублированного контента сообщит вам, какие страницы считаются дубликатами друг друга.

Таким образом, любые страницы с одинаковым номером группы повторяющегося контента являются частью одной и той же группы повторяющихся страниц. Это ни в коем случае не исчерпывающий список способов устранения дублированного контента, но я надеюсь, что он поможет указать вам правильное направление, когда дело доходит до решения этой проблемы.

Автор: Меган Пахинуи
Источник: moz


29 марта 2021

99

Если у вас появились вопросы, оставьте ваши контактные данные. Мы свяжемся с вами и проконсультируем



Не пропустите эти статьи