Paginação amigável para SEO: um guia completo de práticas recomendadas

28/12/2019

A paginação do site é um metamorfo astuto. É usado em contextos que variam da exibição de itens nas páginas de categorias, arquivos de artigos, apresentações de slides da galeria e tópicos do fórum.

Para profissionais de SEO, não é uma questão de se você precisa lidar com paginação, é uma questão de quando.

Em um certo ponto de crescimento, os sites precisam dividir o conteúdo em uma série de páginas componentes para a experiência do usuário (UX).

Nosso trabalho é ajudar os mecanismos de pesquisa a rastrear e entender a relação entre esses URLs para que eles indexem a página mais relevante.

Com o tempo, as melhores práticas de SEO de manipulação de paginação evoluíram. Ao longo do caminho, muitos mitos se apresentaram como fatos. Mas não mais.

Este artigo irá:

Desmascarar os mitos sobre como a paginação prejudica o SEO.

Apresente a maneira ideal de gerenciar a paginação.

Revise os métodos incompreendidos ou inferiores ao tratamento da paginação.

Investigue como rastrear o impacto da paginação no KPI.

Paginação causa conteúdo duplicado

Corrija se a paginação foi implementada incorretamente, como ter uma página "Visualizar tudo" e páginas paginadas sem um rel = canonical correto ou se você criou uma página = 1 além da sua página raiz.

Incorreto quando você tem paginação amigável de SEO. Mesmo que suas tags H1 e meta sejam iguais, o conteúdo real da página é diferente. Portanto, não é duplicação.

A paginação cria conteúdo fino

Corrija se você dividiu um artigo ou galeria de fotos em várias páginas (para gerar receita com anúncios aumentando as visualizações de página), deixando muito pouco conteúdo em cada página.

Incorreto quando você deseja que o usuário consuma facilmente seu conteúdo acima do faturamento de anúncios em banner ou de visualizações de página infladas artificialmente. Coloque uma quantidade de conteúdo compatível com UX em cada página.

Paginação dilui sinais de classificação

Corrigir. A paginação faz com que o patrimônio interno do link e outros sinais de classificação, como backlinks e compartilhamentos sociais, sejam divididos nas páginas.

Mas pode ser minimizado usando a paginação apenas nos casos em que uma abordagem de conteúdo de página única causaria uma má experiência do usuário (por exemplo, páginas da categoria de comércio eletrônico). E nessas páginas, adicionando o maior número possível de itens, sem abrandar a página para um nível perceptível, para reduzir o número de páginas paginadas.

A paginação usa orçamento de rastreamento

Corrija se você está permitindo que o Google rastreie páginas paginadas. E há alguns casos em que você deseja usar esse orçamento.

Por exemplo, para o Googlebot percorrer URLs paginados para alcançar páginas de conteúdo mais profundas.

Geralmente, incorreto quando você define o tratamento de parâmetros de paginação do Google Search Console como "Não rastrear" ou define uma proibição de robots.txt, no caso em que deseja conservar seu orçamento de rastreamento para páginas mais importantes.

Gerenciando a paginação de acordo com as práticas recomendadas de SEO

Usar links de âncora rastreáveis

Para que os mecanismos de pesquisa rastreiem páginas paginadas com eficiência, o site deve ter links âncora com atributos href para esses URLs paginados.

Certifique-se de que seu site use <a href="your-paginated-url-here"> para links internos para páginas paginadas. Não carregou links âncora paginados ou atributo href via JavaScript.

Além disso, você deve indicar o relacionamento entre os URLs dos componentes em uma série paginada com os atributos rel = "next" e rel = "prev".

Sim, mesmo depois do infame Tweet do Google, eles não usam mais esses atributos de link.

Complemente o rel = "next" / "prev" com um link auto-referente rel = "canonical". Então / category? Page = 4 deve rel = "canonical" para / category? Page = 4.

Isso é apropriado, pois a paginação altera o conteúdo da página e a cópia principal dessa página.

Se o URL tiver parâmetros adicionais, inclua-os nos links rel = "prev" / "next", mas não os inclua no rel = "canonical".

Por exemplo:

<link rel = "next" href = "https://www.example.com/category?page=2&order=newest" />

<link rel = "canonical" href = "https://www.example.com/category?page=2" />

Isso indicará um relacionamento claro entre as páginas e impedirá o potencial de conteúdo duplicado.

Erros comuns a serem evitados:

Colocando os atributos do link no conteúdo <body>. Eles são suportados apenas pelos mecanismos de pesquisa na seção <head> do seu HTML.

Adicionar um link rel = "prev" à primeira página (também conhecida como página raiz) da série ou um link rel = "next" até a última. Para todas as outras páginas da cadeia, os dois atributos de link devem estar presentes.

Cuidado com o URL canônico da página raiz. As chances estão em? Page = 2, rel = prev deve ser vinculado ao canônico, não a? Page = 1.

O código <head> de uma série de quatro páginas será mais ou menos assim:

Uma tag de paginação na página raiz, apontando para a próxima página em série.

<link rel = "next" href = "https://www.example.com/category?page=2 ″>

<link rel = "canonical" href = "https://www.example.com/category">

Duas tags de paginação na página 2.

<link rel = "prev" href = "https://www.example.com/category">

<link rel = "next" href = "https://www.example.com/category?page=3 ″>

<link rel = "canonical" href = "https://www.example.com/category?page=2">

Duas tags de paginação na página 3.

<link rel = "prev" href = "https://www.example.com/category?page=2 ″>

<link rel = "next" href = "https://www.example.com/category?page=4 ″>

<link rel = "canonical" href = "https://www.example.com/category?page=3">

Uma tag de paginação na página 4, a última página da série paginada.

<link rel = "prev" href = "https://www.example.com/category?page=3">

<link rel = "canonical" href = "https://www.example.com/category?page=4">

Modificar elementos de página paginada na página

John Mueller comentou: "Não tratamos a paginação de maneira diferente. Nós os tratamos como páginas normais. "

O significado de páginas paginadas não é reconhecido pelo Google como uma série de páginas consolidadas em uma parte do conteúdo, conforme recomendado anteriormente. Cada página paginada é elegível para competir com a página raiz pela classificação.

Para incentivar o Google a retornar a página raiz nos SERPs e impedir os avisos "Duplicar meta descrições" ou "Duplicar tags de título" no Google Search Console, faça uma modificação fácil no seu código.

Se a página raiz tiver a fórmula:

As páginas paginadas sucessivas podem ter a fórmula:

Esses títulos de página de URL paginados e a meta descrição são propositadamente abaixo do ideal para dissuadir o Google de exibir esses resultados, em vez da página raiz.

Se mesmo com essas modificações, as páginas paginadas estiverem classificadas nos SERPs, tente outras táticas tradicionais de SEO na página, como:

Des otimizar as tags H1 da página paginada.

Adicione texto útil na página à página raiz, mas não às páginas paginadas.

Adicione uma imagem de categoria com um nome de arquivo otimizado e uma tag alt na página raiz, mas não nas páginas paginadas.

Não inclua páginas paginadas em sitemaps XML

Embora os URLs paginados sejam tecnicamente indexáveis, eles não são uma prioridade do SEO para gastar no orçamento de rastreamento.

Como tal, eles não pertencem ao seu sitemap XML.

Lidar com parâmetros de paginação no Google Search Console

Se você tiver uma escolha, execute a paginação por meio de um parâmetro, em vez de um URL estático. Por exemplo:

example.com/category?page=2 em example.com/category/page-2

Embora não haja vantagem em usar um sobre o outro para fins de classificação ou rastreamento, a pesquisa mostrou que o Googlebot parece adivinhar padrões de URL com base em URLs dinâmicos. Assim, aumentando a probabilidade de descoberta rápida.

Por outro lado, pode causar interceptações de rastreamento se o site renderizar páginas vazias por suposições que não fazem parte da série paginada atual.

Por exemplo, digamos que uma série contenha quatro páginas.

Os URLs com um conteúdo são interrompidos em www.example.com/category?page=4

Se o Google adivinha www.example.com/category?page=7 e uma página ativa, mas vazia, for carregada, o bot desperdiçará o orçamento de rastreamento e potencialmente se perderia em um número infinito de páginas.

Verifique se o código de status HTTP 404 foi enviado para todas as páginas paginadas que não fazem parte da série atual.

Outra vantagem da abordagem de parâmetro é a capacidade de configurar o parâmetro no Google Search Console para "Paginates" e, a qualquer momento, alterar o sinal para o Google rastrear "Every URL" ou "No URLs", com base em como você deseja usar o seu orçamento de rastreamento. Não é necessário desenvolvedor!

Nunca mapeie o conteúdo da página paginada para identificadores de fragmento (#), pois não é rastreável ou indexável e, portanto, não é compatível com mecanismos de pesquisa.

Soluções de SEO mal compreendidas, desatualizadas ou erradas para conteúdo paginado

Fazer nada

O Google acredita que o Googlebot é inteligente o suficiente para encontrar a próxima página por meio de links, portanto, não precisa de nenhum sinal explícito.

A mensagem para o SEO é essencialmente: manipule a paginação sem fazer nada.

Embora exista uma essência da verdade nessa declaração, ao fazer nada, você está apostando com seu SEO.

Muitos sites viram o Google selecionar uma página paginada para classificar sobre a página raiz para uma consulta de pesquisa.

Sempre vale a pena dar orientações claras aos rastreadores sobre como você deseja indexar e exibir seu conteúdo.

Canonizar em uma página Exibir todas

A página Visualizar tudo foi criada para conter todo o conteúdo da página do componente em um único URL.

Com todas as páginas paginadas tendo um rel = "canonical" na página Exibir tudo para consolidar os sinais de classificação.

O argumento aqui é que os pesquisadores preferem exibir um artigo inteiro ou uma lista de itens de categorias em uma única página, desde que seja rápido e fácil de navegar.

O conceito era que, se sua série paginada tiver uma versão alternativa Visualizar tudo que ofereça a melhor experiência do usuário, os mecanismos de pesquisa irão favorecer esta página para inclusão nos resultados da pesquisa, em oposição a uma página de segmento relevante da cadeia de paginação.

O que levanta a questão - por que você tem páginas paginadas em primeiro lugar?

Vamos simplificar.

Se você pode fornecer seu conteúdo em um único URL enquanto oferece uma boa experiência ao usuário, não há necessidade de paginação ou uma versão Exibir Tudo.

Se você não puder, por exemplo, uma página de categoria com milhares de produtos seria ridiculamente grande e levaria muito tempo para carregar, pagine. Visualizar tudo não é a melhor opção, pois não ofereceria uma boa experiência ao usuário.

O uso de rel = "next" / "prev" e uma versão View All não confere um mandato claro aos mecanismos de pesquisa e resultará em rastreadores confusos.

Não faça isso.

Canonicalize para a primeira página

Um erro comum é apontar o rel = "canonical" de todos os resultados paginados para a página raiz da série.

Algumas pessoas mal informadas do SEO sugerem isso como uma maneira de consolidar a autoridade no conjunto de páginas para a página raiz, mas isso é mal informado.

A canonização incorreta na página raiz corre o risco de direcionar mal os mecanismos de pesquisa e pensar que você tem apenas uma única página de resultados.

O Googlebot não indexa as páginas que aparecem mais ao longo da cadeia, nem reconhece os sinais para o conteúdo vinculado a essas páginas.

Você não deseja que suas páginas de conteúdo detalhadas sejam excluídas do índice por causa do mau processamento da paginação.

Cada página de uma série paginada deve ter um canônico de auto-referência, a menos que você use uma página Visualizar tudo.

Use o rel = canonical incorretamente e é provável que o Googlebot simplesmente ignore seu sinal.

Páginas paginadas no índice

nenhum URL paginado por índice

Um método clássico para resolver problemas de paginação era uma tag noindex de robôs para impedir que o conteúdo paginado fosse indexado pelos mecanismos de pesquisa.

Confiar apenas na tag noindex para manipulação de paginação resultará em qualquer sinal de classificação das páginas componentes sendo desconsideradas.

No entanto, o problema maior desse método é que um índice de longo prazo em uma página levará o Google a não seguir os links dessa página.

Isso pode remover o conteúdo vinculado das páginas paginadas do índice.

Paginação e rolagem infinita ou carregar mais

Uma forma mais nova de manipulação de paginação é:

Rolagem infinita, em que o conteúdo é pré-buscado e adicionado diretamente à página atual do usuário enquanto ele rola para baixo.

Carregue mais, onde o conteúdo é renderizado com o clique de um botão "ver mais".

Essas abordagens são apreciadas pelos usuários, mas o Googlebot? Não muito.

O Googlebot não emula comportamentos como rolar para a parte inferior de uma página ou clicar para carregar mais. Ou seja, sem ajuda, os mecanismos de pesquisa não podem rastrear efetivamente todo o seu conteúdo.

Para ser amigável ao SEO, converta sua rolagem infinita ou carregue mais página em uma série paginada equivalente, com base em links âncora rastreáveis ​​com atributos href, acessíveis mesmo com o JavaScript desativado.

À medida que o usuário rola ou clica, use JavaScript para adaptar o URL na barra de endereço à página paginada do componente.

Além disso, implemente um pushState para qualquer ação do usuário que se assemelhe a um clique ou que gire ativamente uma página. Você pode conferir essa funcionalidade na demo criada por John Mueller.

Essencialmente, você ainda está implementando as práticas recomendadas de SEO recomendadas acima, apenas adicionando funcionalidades adicionais de experiência do usuário.

Desencorajar ou bloquear o rastreamento de paginação

Rastreando o impacto da paginação do KPI

Então agora você sabe o que fazer, como controla o efeito da manipulação da paginação de otimização?

Em primeiro lugar, reúna dados de referência para entender como a entrega atual da paginação está afetando o SEO.

As fontes para KPIs podem incluir:

Arquivos de log do servidor para o número de rastreamentos de página paginados.

Site: operador de pesquisa (por exemplo, site: exemplo.com inurl: página) para entender quantas páginas paginadas o Google indexou.

Relatório do Analytics da Pesquisa do Google Search Console filtrado por páginas que contêm paginação para entender o número de impressões.

Relatório da página de destino do Google Analytics filtrado por URLs paginados para entender o comportamento no site.

Se você encontrar um problema ao fazer com que os mecanismos de pesquisa rastreiem a paginação do site para alcançar seu conteúdo, convém alterar os links de paginação.

Depois de iniciar seu tratamento de paginação de práticas recomendadas, revise essas fontes de dados para medir o sucesso de seus esforços.

Créditos de imagem

Imagem em destaque: Paulo Bobita

Imagens na postagem / capturas de tela: criadas / tiradas pelo autor

Seja o primeiro a ler as novidades!

Posts mais recentes em nosso blog

Leia o que há de novo essa semana

Você sabia que existem planos de saúde específicos para advogados? Pois há várias opções disponíveis no mercado. Leia este texto para saber como descobrir o melhor plano de saúde para advogado.

Eleito um dos melhores modelos de divulgação em 2019, criado por especialistas de Marketing Digital em diversas áreas, GCO significa G de Global ( posicionamento na internet completo, ser encontrado em varias partes como redes sociais, site, blog dentre outros ) C de Comunicação, é a arte de como se comunicar e agradar sua audiência e públicos alvo...