Duplicate Content and SEO: The Ultimate Guide

Duplicate Content in short

Duplicate content refers to very similar, or the exact same, content being on multiple pages. Tenha isto em mente.:

  • conteúdo duplicado acrescenta pouco a nenhum valor para os seus visitantes e confunde os motores de busca.
  • evite ter conteúdo duplicado, pois pode prejudicar o seu desempenho SEO.
  • duplicate content can be caused by technical mishaps and manually copied content.
  • existem maneiras eficazes de evitar que ambos os casos de conteúdo duplicado se tornem um problema, que discutiremos neste artigo.

o que é conteúdo duplicado?

tomado de forma estreita, conteúdo duplicado refere-se a muito semelhante, ou exatamente o mesmo, conteúdo estar em várias páginas dentro de seu próprio site ou em outros sites.

tomado em geral, conteúdo duplicado é um conteúdo que acrescenta pouco a nenhum valor para os seus visitantes. Portanto, páginas com pouco ou nenhum conteúdo corporal também são consideradas como conteúdo duplicado.

os robôs do motor de busca ficam confusos pelo conteúdo duplicado.
os robôs de busca ficam confusos por conteúdo duplicado.

porque é que o conteúdo duplicado é mau para o SEO?

conteúdo duplicado é mau por duas razões:

  1. quando existem várias versões de conteúdo disponíveis, é difícil para os motores de busca determinar que versão para indexar, e posteriormente mostrar em seus resultados de pesquisa. Isso reduz o desempenho para todas as versões do conteúdo, uma vez que eles estão competindo uns contra os outros.
  2. os motores de busca terão dificuldade em consolidar métricas de ligação (Autoridade, relevância e confiança) para o conteúdo, especialmente quando outros sites link para mais de uma versão desse conteúdo.
Barry Adams

conteúdo duplicado pode causar graves problemas de SEO e enviar sinais conflitantes para os motores de busca. Coloque as medidas certas no lugar para garantir que o seu conteúdo tem URLs exclusivos, para que cada página tem a melhor chance de classificar bem e conduzir o tráfego para o seu site.

Barry Adams, Consultor Independente do SEO, Polemic Digital (abre numa nova página)

o seu site sofre de conteúdo duplicado?

duplicate content may be retaining your SEO performance.
por que não verificar se o seu site está sofrendo de conteúdo duplicado?

posso obter uma penalidade de conteúdo duplicado?

ter conteúdo duplicado pode prejudicar o seu desempenho SEO, mas não lhe dará uma penalidade do Google, desde que não copie intencionalmente o site de outra pessoa. Se você é um proprietário honesto do site com alguns desafios técnicos do site, e você não está tentando enganar o Google, você não tem que se preocupar em obter uma penalidade do Google.

se você copiou grandes quantidades do conteúdo de outras pessoas, então você está caminhando uma linha fina. Isto é o que o Google diz sobre isso (abre em uma nova página):

“conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é ser enganoso e manipular os resultados do motor de busca. Se o seu site sofre de problemas de conteúdo duplicados, e você não seguir os conselhos listados acima, fazemos um bom trabalho de escolher uma versão do conteúdo para mostrar em nossos resultados de pesquisa.”

Paul Shapiro

as pessoas muitas vezes têm equívocos sobre o conteúdo duplicado. Se eu tivesse um quarto de cada vez que ouvi um SEO dizer que o conteúdo duplicado lhe daria uma penalidade Panda, teria pelo menos 50 dólares. É uma piada. Pequena indústria.

de qualquer forma, se você tem uma ou duas páginas menos significativas com conteúdo duplicado, não é realmente nada para se preocupar. Os problemas reais surgem quando seu próprio site está gerando multidões de conteúdo duplicado devido ao desenvolvimento da web e problemas técnicos de SEO. Isso pode levar a complicações rastejantes e problemas de trânsito. Conteúdo duplicado também pode ser concernente se outro domínio está raspando o seu conteúdo e essas páginas estão superando o seu próprio, o que raramente é o caso, mas isso acontece!

finalmente, provavelmente o maior conern com conteúdo duplicado é no que diz respeito à dilatação de backlinks que acontecem como resultado disso. Se eu tenho duas versões da mesma página, e os usuários não sabem qual é o ‘principal’ um, então ele pode receber backlinks e o outro não pode. Desta forma, em vez de uma página com todos os backlinks, é dividido entre duas ou mais páginas. No bueno.

Paul Shapiro, Diretor de Estratégia de & a Inovação, o Catalisador (abre em uma nova guia)

Patrick Stox

você sabia que 25% a 30% da web é conteúdo duplicado, e que está tudo bem! Isso não vai fazer com que você seja penalizado e, embora eu acredite firmemente que você deve especificar como você lida com as duplicatas, se você não fizer nada, então o Google tem muitas maneiras que eles tentam resolver os problemas de duplicação para você. Eu não insistiria muito sobre isso a menos que você esteja fazendo algo que possa causar grandes problemas como raspar conteúdo de outros sites.

LinkedIn (abre numa nova Página)Patrick Stox, SEO técnico com base em Raleigh (abre numa nova página)

Qual é a correção mais comum para conteúdo duplicado?

em muitos casos, a melhor maneira de corrigir o conteúdo duplicado é implementar 301 redirecionamentos das versões não preferidas dos URLs para as versões preferidas.

301 redirecionamento: movido permanentemente o conteúdo
301 redirecionamento: movido permanentemente conteúdo

Quando os URLs devem permanecer acessível aos visitantes, você não pode usar redirect, mas você pode usar uma URL canônica ou um robots noindex redirective. A URL canônica permite que você consolide alguns sinais, enquanto a diretiva noindex dos robôs não.

escolha a sua arma para combater o conteúdo duplicado cuidadosamente, pois todos eles têm os seus prós e contras. Não há uma abordagem” Tamanho único ” para duplicar o conteúdo.

Vá através da seção abaixo para aprender sobre as diferentes causas de conteúdo duplicado, e ver qual método para lidar com ele se encaixa melhor.

causas comuns de conteúdo duplicado

conteúdo duplicado é muitas vezes devido a um servidor web ou site incorretamente configurado. Estas ocorrências são de natureza técnica e provavelmente nunca resultarão em uma penalidade do Google. Eles podem prejudicar seriamente seus rankings, então é importante fazer com que seja uma prioridade corrigi-los.

mas além de causas técnicas, existem também causas de origem humana: conteúdo que está sendo propositadamente copiado e publicado em outros lugares. Como dissemos, isto pode trazer penalidades se tiverem uma intenção maliciosa.

conteúdo duplicado devido a razões técnicas

Non-www vs www e HTTP vs HTTPs

diga que está a utilizar o www subdomain e HTTPs. Então sua maneira preferida de servir o seu conteúdo é através de https://www.example.com. Este é o teu domínio canónico.

se o seu servidor web estiver mal configurado, o seu conteúdo também pode estar acessível através:

duplicar o conteúdo devido a diferentes domínios canónicos.
conteúdo duplicado devido a diferentes domínios canónicos.

Escolha uma forma preferida de servir o seu conteúdo, e implemente redirecionamentos 301 para formas não preferidas que levam à versão preferida: https://www.example.com.

estrutura do URL: barras de revestimento e travamento

para o Google, os URLs são sensíveis a maiúsculas e minúsculas. Significando que https://example.com/url-a/ e https://example.com/url-A/ são vistos como URLs diferentes. Quando você está criando links, é fácil fazer uma gralha, fazendo com que ambas as versões da URL fiquem indexadas. Por favor, note que os URLs não são sensíveis a maiúsculas para o Bing.

uma barra para a frente (/) no final de um URL é chamada de barra de trilho. Muitas vezes os URLs são acessíveis através de ambas as variantes aqui: https://example.com/url-a e https://example.com/url-a/.

duplicar o conteúdo devido a inconsistências na utilização do revestimento do URL e da barra de seguimento.
conteúdo duplicado devido a inconsistências no revestimento de URL e uso de barra de acompanhamento.

Escolha uma estrutura preferida para os seus URLs, e para versões URL não preferidas, Implemente um redirecionamento 301 para a versão URL preferida.

Hamlet Batista

consolidar conteúdo duplicado não é sobre evitar penalidades do Google. Trata-se de construir ligações. Links são valiosos para o desempenho SEO, mas se links acabam em páginas duplicadas eles não o ajudam. Eles vão para o lixo.

LinkedIn (abre em um novo tab)Hamlet Batista, CEO, RankSense (abre em um novo tab))

páginas do Índice (Índice.html, index.php)

sem o seu conhecimento, a sua página inicial pode ser acessível através de vários URLs porque o seu servidor web está mal configurado. Além de https://www.example.com, a página inicial também pode ser acessada por meio de:

  • https://www.example.com/index.html
  • https://www.example.com/index.asp
  • https://www.example.com/index.aspx
  • https://www.example.com/index.php

Escolha uma forma preferencial para servir a sua página inicial, e implementar os redirecionamentos 301 a partir de versões não preferenciais para a versão preferencial.

no caso de seu site estar usando qualquer um destes URLs para servir o conteúdo, certifique-se de canonicalizar estas páginas porque redirecioná-los iria quebrar as páginas.

Parameters for filtering

Websites often use parameters in URLs so they can offer filtering functionality. Veja este URL, por exemplo:

https://www.example.com/toys/cars?colour=black

esta página mostraria todos os carros de brinquedo pretos.

embora isto seja bom para os visitantes, pode causar grandes problemas para os motores de busca. As opções do filtro geram muitas vezes uma quantidade virtualmente infinita de combinações quando há mais de uma opção de filtro disponível. Ainda mais porque os parâmetros também podem ser rearranjados.

estes dois URLs mostrariam exactamente o mesmo conteúdo:

duplicar o conteúdo devido a diferentes ordens de parâmetros URL.
conteúdo duplicado devido a diferentes ordens de parâmetros URL.

Implemente URLs canônicos-um para cada página principal, não filtrada-para evitar conteúdos duplicados e consolidar a autoridade da página entregue pelo filtro. Por favor, note que isso não impede rastejar problemas de Orçamento. Alternativamente, você pode usar a funcionalidade de tratamento de Parâmetros na consola de pesquisa do Google e Ferramentas Bing Webmaster para instruir seus rastreadores como lidar com os parâmetros.

Jenny Halasz

Duplicate content is the most pervasive and mal-entendido SEO issue. Há tantas formas de duplicação que você tem que ter cuidado, e um pequeno erro técnico pode levar a literalmente milhares de páginas duplicadas. Canônico nem sempre é a solução certa, e este artigo de ContentKing faz um trabalho incrível de identificar o problema e solução para dezenas de questões comuns com conteúdo duplicado.

tenho visto sites muito bem sucedidos obstruídos por conteúdo duplicado. Nestes casos, a fixação das questões que conduzem à duplicação de conteúdo por si só pode resultar frequentemente num aumento de 20% ou mais do tráfego orgânico. Quando você tem milhões de visitantes, isso pode ser centenas de milhares em receita adicional.

Jenny Halasz, Busca consultor de marketing, JLH de Marketing (abre em uma nova guia)

Taxonomias

Uma taxonomia é um mecanismo de agrupamento para classificar o conteúdo. Eles são frequentemente usados em Sistemas de gerenciamento de conteúdo para suportar categorias e tags.

digamos que você tem um post no blog que está em três categorias. O blog pode ser acessado através de todos os três:

  • https://www.example.com/category-a/topic/
  • https://www.example.com/category-b/topic/
  • https://www.example.com/category-c/topic/
conteúdo Duplicado devido a páginas em várias categorias.
conteúdo duplicado devido às páginas estarem em várias categorias.

certifique-se de escolher uma destas categorias como a primária, e fazer os outros canonicalizar para aquela usando a URL canônica.

David Iwanow

Duplicata é um grande problema para muitas plataformas de legado que são de configuração fortemente dependem de parâmetros internos para a estrutura da página, mas é também um problema para as mais recentes plataformas como o WordPress com o /tag/ páginas que muitas vezes são melhores noindexed desde o início.

David Iwanow, Travel Network (abre em uma nova guia)

páginas Dedicadas imagens

Alguns Sistemas de Gerenciamento de Conteúdo criar uma página separada para cada imagem. Esta página normalmente apenas mostra a imagem numa página em branco. Uma vez que esta página não tem outro conteúdo, é muito semelhante a todas as outras páginas de imagem e, portanto, equivale a duplicar o conteúdo.

se possível, desactivar a funcionalidade para dar páginas dedicadas às imagens. Se isso não for possível, a próxima melhor coisa é adicionar um atributo noindex meta robots para a página.

páginas de comentários

se você tem comentários ativados em seu site, você pode estar paginando-os automaticamente após uma certa quantidade. As páginas de comentários paginadas irão mostrar o conteúdo original; apenas os comentários no fundo serão diferentes.

por exemplo, o artigo URL que mostra os comentários 1-20 pode ser https://www.example.com/category/topic/, com https://www.example.com/category/topic/comments-2/ para os comentários 21-40, e https://www.example.com/category/topic/comments-3/ para os comentários 41-60.

utilize as relações de ligação paginação para sinalizar que se trata de uma série de páginas paginadas.

Localização e hreflang

Quando se trata de localização, problemas de conteúdo duplicado pode surgir quando você está usando exatamente o mesmo conteúdo para o destino de pessoas em diferentes regiões que falam o mesmo idioma.

por exemplo: quando você tem um site dedicado para o mercado canadense e também um para os EUA-mercado—ambos em inglês—é provável que haja muita duplicação no conteúdo.

o Google é bom em detectar isso, e geralmente dobra esses resultados juntos. O atributo hreflang ajuda a prevenir o conteúdo duplicado. Então, se você está usando o mesmo conteúdo para diferentes públicos, certifique-se de implementar hreflang como parte de uma sólida estratégia internacional SEO.

David Iwanow

O maior problema de todo o conteúdo duplicado é que o Google entenda o contexto e você recebe visitantes de destino na página errada. Isso aconteceu no passado com um cliente onde o Google não conseguia entender a diferença entre Londres, Reino Unido e Londres, Ontário, Canadá, porque o conteúdo era 85-90% semelhante.

David Iwanow, rede de viagens (abre numa nova página)

páginas de resultados de pesquisa indexáveis

muitos sites oferecem funcionalidade de pesquisa, permitindo que os visitantes pesquisem através do conteúdo do site. As páginas em que os resultados de pesquisa são exibidos são todos muito semelhantes, e na maioria dos casos não fornecem qualquer valor para os motores de busca. É por isso que não queres que sejam indexáveis para motores de busca.

impedir que os motores de busca indexem as páginas dos resultados de busca utilizando o atributo noindex dos meta robots. E também, em geral, é uma boa prática não ligar para as suas páginas de resultados de pesquisa.

In case of a large amount of search result pages that are getting crawled by search engines it’s recommended to stop search engines from accessing them in the first place using the robots.ficheiro txt.

ambiente de ensaio / estadiamento Indexável

é igualmente uma boa prática utilizar ambientes de ensaio para a implantação e ensaio de novas funcionalidades em sítios web. Mas estes são muitas vezes incorretamente deixados acessíveis e indexáveis para os motores de busca.

duplicar o conteúdo devido a vários ambientes estarem disponíveis ao público.
conteúdo duplicado devido a vários ambientes estarem disponíveis ao público.

Use a autenticação HTTP para impedir o acesso a ambientes de teste/estadiamento. Um benefício adicional de fazer isso é que você está impedindo as pessoas erradas de acessá-las também.

se o seu ambiente de teste/teste ficar indexado em algum ponto, siga os passos descritos neste guia de remoção de URL para removê-los rapidamente.

evite publicar o conteúdo do trabalho em progresso

quando você cria uma nova página que contém pouco conteúdo, salve—o sem publicá-lo ainda-muitas vezes, ele irá fornecer pouco ou nenhum valor.

guardar as páginas inacabadas como rascunhos. Se precisar de publicar páginas com conteúdo limitado, evite que os motores de busca os indexem: use o atributo noindex dos meta robots.

parâmetros utilizados para rastreamento

parâmetros são comumente usados para rastreamento também. Por exemplo, ao compartilhar URLs no Twitter, a fonte é adicionada à URL. Esta é outra fonte de conteúdo duplicado. Tome por exemplo este URL que foi tweetado usando Buffer:

https://www.contentkingapp.com/academy/ecommerce-link-building/?utm_content=buffer825f4&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer

é uma boa prática implementar Auto-referenciamento de URLs canônicos em páginas. Se já fizeste isso, isto resolve o problema. Todos os URLs com estes parâmetros de rastreamento são canonicalizados por padrão para a versão sem os parâmetros.

IDs de sessão

Sessions may store visitor information for web analytics. Se cada URL que um visitante solicita receber um ID de sessão adicionado, isso cria um monte de conteúdo duplicado, porque o conteúdo nesses URLs é exatamente o mesmo.

por exemplo, quando você clicar em uma versão localizada do nosso site, adicionamos uma variável de sessão do Google Analytics como https://www.contentking.nl/?_ga=2.41368868.703611965.1506241071-1067501800.1494424269. Ele mostra a página inicial com o mesmo conteúdo exato, apenas em uma URL diferente.

mais uma vez-é uma boa prática implementar Auto-referenciamento URLs canônicos em páginas. Se já fizeste isso, isto resolve o problema. Todos os URLs com estes parâmetros de rastreamento são canonicalizados por padrão para a versão sem os parâmetros.

versão amigável para impressão

quando as páginas têm uma versão amigável para impressão em um URL separado, há essencialmente duas versões do mesmo conteúdo. Imagine isto: https://www.example.com/some-page/ e https://www.example.com/print/some-page/.

implementa um URL canônico que vai da versão amigável para a versão normal da página.

conteúdo duplicado causado por conteúdo copiado

páginas de desembarque para pesquisa paga

pesquisa paga exige páginas de desembarque dedicadas que visam palavras-chave específicas. As páginas de destino são muitas vezes cópias de páginas originais, que são depois ajustados para direcionar essas palavras-chave específicas. Uma vez que estas páginas são muito semelhantes, eles produzem conteúdo duplicado se forem indexados por motores de busca.

duplicar o conteúdo devido a pequenas diferenças entre as páginas de desembarque.
conteúdo duplicado devido a pequenas diferenças entre as páginas de desembarque.

previnem que os motores de busca indexem as páginas de aterragem implementando o atributo noindex dos meta robots. Em geral, é uma boa prática não ligar às suas páginas de desembarque nem incluí-las no seu sitemap XML.

outras partes que copiam o seu conteúdo

o conteúdo duplicado também pode ser originário de outras pessoas que copiam o seu conteúdo e o publicam noutro local. Isto é, em particular, um problema se o seu site tem uma autoridade de domínio baixo, e aquele que copia o seu conteúdo tem uma autoridade de domínio superior. Sites com uma autoridade de domínio superior muitas vezes se rasteja mais freqüente, resultando no conteúdo copiado sendo rastejado primeiro no site do que copiou o conteúdo. Eles podem agora ser percebidos como o autor original e posto acima de você.

certifique-se de que outros sites creditam você, implementando um URL canônico que leva à sua página e ligando à sua página. Se eles não estiverem dispostos a fazê-lo, você pode enviar um pedido DMCA para o Google (abre em uma nova página) e/ou tomar uma ação legal.

copiar conteúdo de outros sites

copiar conteúdo de outros sites é uma forma de conteúdo duplicado também. O Google documentou (abre em uma nova página) como lidar melhor com isso do ponto de vista do SEO: ligando-se à fonte original, combinado com um URL canônico ou uma tag a meta robots noindex. Tenha em mente que nem todos os proprietários do site estão felizes com você sindicando seu conteúdo, então é recomendado pedir permissão para usar seu conteúdo.

Encontrar conteúdo duplicado

Encontrar conteúdo duplicado dentro do seu próprio site

Usando ContentKing, você pode facilmente encontrar conteúdo duplicado, verificando se suas páginas de ter um único título da página, descrição meta, e H1 título. Você pode fazer isso indo para a seção de questões e abrindo as cartas” Meta informação” e “cabeçalhos de conteúdo”. Veja se há alguma questão em aberto:

  • “título da Página não é exclusivo”
  • “descrição Meta não é exclusivo”
  • ” título não é exclusivo”
testar Rapidamente o seu site por conteúdo duplicado

Com ContentKing você pode facilmente testar se o seu site tiver problemas de conteúdo duplicado. Estarás a funcionar dentro de 20 segundos.

O Relatório de cobertura de índice do Google Search Console também é útil quando se encontra conteúdo duplicado no seu site. Estejam atentos aos seguintes issies:

  • Duplicate without user-selected canonical: Google’s found duplicate URls that are not canonicalized to a preferred version.
  • Duplicate, Google chose different canonical than user: Google choose to ignore your canonical on URLs they found on their own, and instead assigns Google-selected canonicals.
  • Duplicate, URL submetido não seleccionado como canónico: o Google optou por ignorar os cânones que definiu para os URLs que submeteu através de um sitemap XML.

encontrar conteúdo duplicado fora do seu próprio site

se tiver um pequeno site, pode tentar procurar no Google frases entre aspas. Por exemplo, se eu quiser ver se existem outras versões deste artigo, eu posso procurar por “usando ContentKing, você pode facilmente encontrar conteúdo duplicado, verificando se suas páginas têm um título de página única, meta descrição, e cabeçalho H1.”

alternativamente, para um site maior você pode usar um serviço como Copyscape (abre em uma nova página). Copyscape rasteja a web procurando múltiplas ocorrências do mesmo ou quase o mesmo conteúdo.

perguntas mais frequentes sobre conteúdo duplicado

  1. Posso obter uma penalidade por ter conteúdo duplicado?
  2. a fixação de duplicados de conteúdos irá aumentar a minha classificação?
  3. qual a quantidade de conteúdo duplicado aceitável?

⚠️ Posso obter uma penalidade por ter conteúdo duplicado?

se você não copiou intencionalmente o site de alguém, então é muito improvável para você obter uma penalidade de conteúdo duplicado. Se você copiou grandes quantidades de conteúdo de outras pessoas, então você está caminhando uma linha fina. Isto é o que o Google diz sobre isso (abre em uma nova página):

conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é ser enganoso e manipular os resultados do motor de busca. Se o seu site sofre de problemas de conteúdo duplicados, e você não seguir os conselhos listados acima, fazemos um bom trabalho de escolher uma versão do conteúdo para mostrar em nossos resultados de pesquisa.

🔧 a correcção de duplicados vai aumentar os meus rankings?

Sim, porque ao corrigir os duplicados problemas de conteúdo você está dizendo aos motores de busca que páginas eles realmente deveriam estar rastejando, indexando e ranking.

você também estará impedindo que os motores de busca gastem seu orçamento rastejante para o seu site em páginas duplicadas irrelevantes. Eles podem se concentrar no conteúdo único em seu site que você quer classificar para.

🧮 quanto conteúdo duplicado é aceitável?Não há uma boa resposta para esta pergunta. Entanto:

se você quiser classificar com uma página, ela precisa ser valiosa para os seus visitantes e ter conteúdo único.

Deixe uma resposta

O seu endereço de email não será publicado.