Как быстро идентифицировать дублирующийся контент при сканировании сайта

  1. Хотите быть в курсе последних тенденций поиска?
  2. Хотите быть в курсе последних тенденций поиска?

Эта статья представляет собой простое описание того, как использовать сканер сайтов SEO для быстрой идентификации дублированного контента. Существует множество инструментов, но Screaming Frog, безусловно, является одним из самых популярных и мощных скребков, и он является пауком для этого урока.

Первый шаг к сканированию любого сайта - это настройка. Ограничьте просматриваемые страницы любым удобным для вас способом, поскольку, как правило, в интересах всех, чтобы не царапать весь Интернет.

Показанные выше параметры были выбраны для этого примера сканирования Costco.com. Ограничивая «Общий лимит поиска», Screaming Frog будет сканировать только первые 100 URL-адресов, с которыми сталкивается.

После того, как параметры были указаны, введите адрес сайта и нажмите «Пуск». В большинстве инструментов сканирования URL-адреса отображаются по запросу. Когда процесс завершится, нажмите «Экспорт».

Когда процесс завершится, нажмите «Экспорт»

Хотя Screaming Frog использовался для получения списка результатов, показанного ниже, можно использовать любой инструмент, который может запрашивать, анализировать и экспортировать эти данные:

  • Адрес
  • Код состояния
  • Заголовок страницы
  • Метаданные
  • Мета Обновить
  • канонический

Адрес   Код состояния   Заголовок страницы   Метаданные   Мета Обновить   канонический

В простоте есть красота, и этот отчет определенно прост, но эффективен. Справа от кодов состояния находится заголовок страницы, отсортированный по возрастанию и с выделенными дублирующимися значениями (с использованием условного форматирования в Excel). Столбцы справа от заголовков страниц показывают, содержат ли эти страницы директивы, поисковые системы последует

  • Метаданные: будут отображаться любые мета-метки роботов Noindex
  • Meta Refresh: иногда используется для перенаправления пользователей
  • Канонический: используется на дублирующих (или подмножественных) страницах для указания на авторитетный или ранжирующий URL

Продолжая методологию выявления дублирующегося контента, сканируя столбец «Заголовки страниц» и ища дубликаты, выделенные розовым цветом, мы находим то, что выглядит как дубликаты страниц обслуживания клиентов на изображении, показанном выше.

http://www.costco.com/customer-service.html
http://www.costco.com/customer-service.html?cm_re=Common-_-Top_Nav-_-Customer_Service

Если взглянуть направо, то очевидно, что метаданные и метаобновление не используются, но оба содержат каноническое значение:

http://www.costco.com/customer-service.html

Это отличные новости! Это означает, что они используют самореферентные каноники справиться хотя бы с некоторым их дублированием.

Теперь, просматривая оставшуюся часть этих данных, мы знаем, что может быть много случаев, когда происходит то же самое, так что может быть проще искать случаи, когда существуют повторяющиеся заголовки страниц, но каноническое пусто. Для больших наборов данных было бы неплохо использовать фильтры для достижения этой цели, но, поскольку это всего лишь пример сканирования, вы можете увидеть ниже, что это довольно очевидно.

Для больших наборов данных было бы неплохо использовать фильтры для достижения этой цели, но, поскольку это всего лишь пример сканирования, вы можете увидеть ниже, что это довольно очевидно

Подожди, что это там, Костко? Похоже, они забыли использовать свою каноническую стратегию для домашней страницы!

http://www.costco.com/
http://www.costco.com/?cm_re=Common-_-Top_Nav-_-Home
http://www.costco.com/TopCategories?langId=-1&storeId=10301&catalogId=10701

Добавление этих дублирующих страниц в Open Site Explorer и Majestic SEO не выявило обратных ссылок, но, поскольку эти страницы внутренне связаны и доступны для навигации, у пользователей определенно есть возможность ссылаться на них и возможность разделения ссылок. В соответствии с передовой практикой они должны добавить каноническую ссылку на домашнюю страницу, чтобы убедиться, что все свойства индексации URL-адресов, содержащих параметры отслеживания, объединены на своем законном месте - на странице рейтинга.

Сканеры сайта должны использоваться с осторожностью! Сайт можно сломать, если он сканируется слишком быстро. При этом они играют ключевую роль в выявлении проблем на сайте, имеющих отношение к SEO, а также в понимании масштаба, в котором происходит конкретная проблема.

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Похожие

4 шага к современному исследованию ключевых слов в 2015 году
... вление Google Hummingbird вызвало много беспокойств, но, в конечном счете, это может быть полезно для отрасли, поскольку оно освобождает нас от тирании конкуренции за ограниченное количество ключевых слов. По сути, роль алгоритма Hummingbird заключается в том, чтобы лучше отвечать на те более длинные запросы, которые пользователи вводят в Google. Если ваши страницы оптимизированы для этих более разговорных запросов, у вас больше шансов на высокий рейтинг. Попробуйте новый, нишевый подход к
Быстрый SEO Конкурентный Анализ
... поиска продуктов или услуг нашего клиента. поисковые системы Можем ли мы начать выявление проблем и сосредоточиться на областях с высокими возможностями. Ваша SEO стратегия так же хороша, как и исследование ключевых слов, которое в нее вошло. В этой статье основное внимание будет уделено следующим аспектам исследования ключевых слов, первой из серии статей о быстром SEO-конкурентном
Оптимизация мобильного поиска (MSO)
Последнее обновление: 28 апреля 2019 года в 11:47 Так что в последнее время я немного занимался оптимизацией мобильного поиска и обнаружил несколько ресурсов, в которых говорится, что Google будет ранжировать сайты
Как восстановить штраф Google Panda
Нет ничего лучше, чем просыпаться утром, только чтобы увидеть, что трафик вашего сайта сократился вдвое благодаря последнему обновлению алгоритма Google. К сожалению, больше людей, чем когда-либо - даже включая владельцев качественных, законных веб-сайтов
Как работает SEO маркетинг?
... быть современным профессионалом - непростая задача, особенно когда новости рынка выходят несколько раз в день, не так ли? Я не знаю, начинаете ли вы сейчас или уже немного знакомы с этим районом, также не имеет значения, что вы на самом деле собираетесь сказать, насколько вы любите свой район и за что вы готовы от него отказаться, ? Вы заметите, что работать с SEO-маркетингом - это постоянная проблема. Не потому, что это профессия, которая подвергает вашу жизнь риску или иным образом
SEO оптимизация сайта через контент
... вная цель и миссия Google - организовать глобальную информацию и предоставлять пользователям высококачественный контент. Те, кто профессионально занимается публикацией информации в Интернете, предоставляют большую долю новых данных, и по мере повышения качества публикаций они получают преимущество в том, что их информация становится более заметной, чем все остальные. Качество контента, а также длина были основными критериями для позиционирования сайта в результатах
SEO аудит сайта. Профессиональный анализ сайта для выявления SEO проблем - Львов
Детальная проверка сайта на отсутствие технических ошибок Профессиональный анализ сайта - это прекрасная возможность улучшить видимость в поисковых системах, усовершенствовать его юзабилити, увеличить поисковый трафик, а также сформировать доверие со стороны потенциальных клиентов и партнеров. Конечно, вы всегда можете воспользоваться специальными онлайн-сервисами для начального аудита интернет-ресурса, но, как правило, такие программы не в состоянии охватить всех аспектов
Платный и органический поиск: какая разница?
Поисковые системы - замечательный, мощный инструмент для открытия. Введите то, что вы хотите знать, и в течение доли секунды у вас под рукой будет огромное количество информации, ожидающей дальнейшего изучения. Поисковые системы являются практически основным элементом повседневной жизни в Интернете. Думаю об этом. Как часто вы используете фразу « Google it »? При ближайшем рассмотрении вы, вероятно, обнаружите, что страница результатов поисковой системы (SERP) содержит
Проанализируйте SEO своего сайта на WordPress
Как SEO-консультант, SEOzio собирает информацию на вашем сайте WordPress. В отличие от SEO-консультанта, он анализирует десятки факторов за секунды, бесплатно и онлайн. Собранные данные поступают из различных источников, таких как поисковые системы, авторитетные
Как написать тег заголовка для SEO
Google Panda, Penguin & Phantom: 3 примера восстановления
... вление Панды начало выкатываться на неделе 15 июля и было подтверждено Google , Я был рад видеть, что Google подтвердил обновление, поскольку этого больше не должно было случиться. Во время июльского обновления многие веб-мастера сообщали о восстановлении на разных уровнях, что, похоже, совпало с тем, что выдающийся инженер Google Мэтт Каттс объяснил

Комментарии

Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска? Получить лучшие идеи и новости от наших экспертов по поиску. Хотите быть в курсе последних тенденций поиска? Получить лучшие идеи и новости от наших экспертов по поиску.
Что касается новостей о поисковой оптимизации и последних обновлениях Google, вы всегда хотите быть в курсе?
Что касается новостей о поисковой оптимизации и последних обновлениях Google, вы всегда хотите быть в курсе? Тогда мы рекомендуем, регулярно в Блог SISTRIX остановить. Особенно интересными являются статьи с ценными и конкретными советами для реализации ваших SEO-мер, а также различные исследования, которые aufgehubscht по графике (конечно, из SISTRIX Toolbox). Блог Moz
Итак, как вы можете начать и быть в курсе последних обновлений?
Итак, как вы можете начать и быть в курсе последних обновлений? Мы спросили собственного лидера роста TNW Мартина Шейбелера, как он начал в отрасли, что нужно, чтобы идти в ногу с постоянно меняющимися поисковыми системами. как вы начинали? Я заинтересовался онлайн-маркетингом, прочитав много постов в блоге о юзабилити, но обнаружил, что наиболее эффективно сосредоточиться на SEO, который для большинства сайтов по-прежнему остается крупнейшим
Итак, как мы решаем, какой контент мы хотим, чтобы поисковые системы индексировали и ранжировали, и как только мы решим, как мы это сделаем?
Итак, как мы решаем, какой контент мы хотим, чтобы поисковые системы индексировали и ранжировали, и как только мы решим, как мы это сделаем? В этом посте я собираюсь познакомить вас (или напомнить, если вы уже знаете о них) с несколькими метатегами, размещенными в разделе <head> вашего сайта, которые помогут вам справиться с дублирующимся контентом. В конце, если вы используете WordPress, я покажу вам, как это сделать, используя SEO
Как ваш бизнес может быть успешным, если вашего сайта нет?
Как ваш бизнес может быть успешным, если вашего сайта нет? Проблема в том, что добраться туда и остаться там может быть слишком дорого для многих компаний, особенно если вы нанимаете профессионала SEO. Вот почему мы создали наши программные решения TopRank SEO - чтобы предоставить вам продукты и услуги, необходимые для успеха, не разрушая банк. Представление в поисковых системах, исследование ключевых слов, анализ оптимизации, проверка рейтинга и популярность ссылок - все
Мы поклонники всех вещей, стройных и ловких Так что если вы просто хотите получить представление о том, как работает ваш контент?
Как ваш бизнес может быть успешным, если вашего сайта нет? Проблема в том, что добраться туда и остаться там может быть слишком дорого для многих компаний, особенно если вы нанимаете профессионала SEO. Вот почему мы создали наши программные решения TopRank SEO - чтобы предоставить вам продукты и услуги, необходимые для успеха, не разрушая банк. Представление в поисковых системах, исследование ключевых слов, анализ оптимизации, проверка рейтинга и популярность ссылок - все
С такими крупными компаниями, как Amazon, Walmart и Target, доминирующими на странице результатов поиска, как малый бизнес электронной коммерции может начать свое восхождение на вершину?
С такими крупными компаниями, как Amazon, Walmart и Target, доминирующими на странице результатов поиска, как малый бизнес электронной коммерции может начать свое восхождение на вершину? С электронной коммерцией SEO. Ecommerce SEO обеспечивает основу для веб-сайтов для создания сильной стратегии цифрового маркетинга. Если вы только начинаете работать с новым веб-сайтом или хотите оптимизировать рост для своих органических кампаний, эти советы помогут ускорить ваш рост и
Кроме того, как вы можете быть уверены, что любая из предложенных кривых кликов применима к вашему сектору рынка, вертикали поиска или бренду?
Кроме того, как вы можете быть уверены, что любая из предложенных кривых кликов применима к вашему сектору рынка, вертикали поиска или бренду? Ниже приведена методология, которую я использовал для определения CTR SERP сайта, используя данные, полученные с самого сайта, а не отраслевые исследования. Во-первых, я должен сказать, что, изучая научные методы, в этой процедуре есть ряд предостережений, которые никоим образом не являются точным решением. Вместо этого он используется
Но как Google узнает, какой сайт должен быть на первом месте, какой на десятом, а какой вообще не должен быть представлен пользователю?
Но как Google узнает, какой сайт должен быть на первом месте, какой на десятом, а какой вообще не должен быть представлен пользователю? Отвечая на продвинутые алгоритмы, созданные Google, это оценка страниц и определение порядка сайта в результатах поиска. Их задача - оценить сайт и решить, на какой позиции он должен появиться. Google объявляет что при определении рейтинга сайтов учитываются сотни
Google Analytics отлично отслеживает ключевые слова, используемые для поиска вашего сайта, но как вы ориентируетесь на конкурентов?
Google Analytics отлично отслеживает ключевые слова, используемые для поиска вашего сайта, но как вы ориентируетесь на конкурентов? Мы используем платные корпоративные инструменты для сравнения сайтов наших клиентов с их конкурентами. Эти инструменты могут быть дорогостоящими, но мы можем принять это, чтобы обеспечить конкурентный анализ для наших клиентов. Бизнес-профессионалы, имеющие ограниченный опыт работы с английским языком, могут столкнуться с трудностями в SEO. Особенно, когда
Как вы можете быть уверены, что они там, где должны быть?
Как вы можете быть уверены, что они там, где должны быть? Ну, это легко использовать SEO Spider, чтобы помочь сделать это оптом в масштабе! Обратите внимание, что функция пользовательского поиска, описанная ниже, доступна только для лицензированных пользователей. Вот краткое руководство, чтобы показать, как это можно сделать: Шаг 1 - перечислите свои URL Получите полный список URL-адресов, которые вы хотите проверить в одном файле TXT или CSV. Убедитесь, что вы

Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска?
Html?
Подожди, что это там, Костко?
Com/?
Com/TopCategories?
Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска?
Быть современным профессионалом - непростая задача, особенно когда новости рынка выходят несколько раз в день, не так ли?