Tutoriais

SEO para iniciantes: como o Google encontra páginas

Como o Googlebot rastreia, indexa e ranqueia páginas — crawl budget, mobile-first, title tag, Core Web Vitals e os mitos que ainda circulam.

Rafael Duarte

EDITOR TÉCNICO

Publicado

18 de jun. de 2026

Leitura

8 min

18 de jun. de 2026 · 8 MIN

COVER · Tutoriais

Você publicou o site, ele está no ar, e uma semana depois o Google ainda não o encontrou. Você digita o nome do produto no buscador e nada. Vai lá no Search Console e vê "URL não está no índice do Google". Isso não é punição — é o fluxo normal. O Google não indexa automaticamente tudo que existe na internet. Tem um processo.

Como o Google encontra páginas novas

O Googlebot é o crawler do Google — um programa que navega pela web seguindo links, exatamente como um usuário faria, mas em escala massiva e de forma sistemática. Ele parte de um conjunto de URLs conhecidas (seeds) e vai descobrindo novas páginas através dos links que encontra em cada página que visita.

Existem três caminhos principais para o Googlebot chegar até uma página nova:

Link externo. Alguém linka para o seu site a partir de uma página que o Google já conhece. Esse é o caminho mais natural e, historicamente, o mais confiável.
Sitemap. Você submete um sitemap.xml no Google Search Console indicando quais URLs existem no seu site. O Google não promete indexar tudo que está no sitemap, mas usar um é a forma mais direta de dizer "essas páginas existem".
Solicitação manual. No Search Console, você pode pedir inspeção de uma URL específica. Útil para páginas novas ou recém-atualizadas — mas não é garantia de indexação imediata.

Um detalhe importante: desde outubro de 2023, o Google usa mobile-first indexing por padrão para todos os sites. O Googlebot rastreia e indexa principalmente a versão mobile da página. Se o seu site não tem versão responsiva, parte do conteúdo pode ser ignorada.

O que acontece depois que o Googlebot visita

Visita não é o mesmo que indexação. O Googlebot pode passar por uma URL e decidir não a indexar por vários motivos: conteúdo duplicado, qualidade percebida como baixa, diretiva noindex no HTML, ou simplesmente porque o crawler priorizou outras URLs naquele momento.

O processo tem três etapas distintas:

1. Crawling (rastreamento): o Googlebot faz uma requisição HTTP para a URL, baixa o HTML (até ~2 MB), e depois renderiza a página executando JavaScript para ver o DOM final. A renderização pode acontecer com horas ou dias de delay em relação ao crawl inicial — o Google usa uma fila de renderização separada.

2. Indexação: o Google processa o conteúdo renderizado, extrai texto, links, metadados, e armazena no índice. É aqui que a página passa a existir para o Google. Sem indexação, não há ranking — não importa o quão boa seja a página.

3. Ranking: entre todas as páginas indexadas que são candidatas para uma busca, o Google aplica centenas de sinais para decidir a ordem. Conteúdo, relevância, autoridade, experiência do usuário — tudo entra no cálculo.

O que é crawl budget e quando isso importa

Crawl budget é a quantidade de URLs que o Googlebot está disposto a rastrear no seu site dentro de um período. Para sites pequenos (menos de algumas centenas de páginas), isso raramente é problema — o Google rastreia tudo rapidamente. Para sites grandes (e-commerces com dezenas de milhares de SKUs, por exemplo), gerenciar o crawl budget é crítico.

Os dois fatores que determinam o crawl budget são: crawl rate limit (quantas requisições o servidor suporta sem travar) e crawl demand (o quanto o Google acha que vale a pena rastrear suas páginas com base em popularidade e frescor).

Se você tem páginas de baixa qualidade, URLs duplicadas sem canonical, ou redirecionamentos em cadeia, esses recursos desperdiçam crawl budget que poderia ir para as páginas que importam.

O que influencia o ranking

A pergunta que todo mundo faz — e que ninguém responde com honestidade — é: o que faz uma página rankear?

A resposta honesta é: relevância para a intenção de busca, autoridade do domínio, qualidade do conteúdo, e experiência do usuário. Tudo ao mesmo tempo. Não tem um fator único.

Mas há elementos on-page concretos que você controla:

Title tag

É o título que aparece no resultado de busca. Direto ao ponto: é o sinal on-page mais forte que você tem. Limite prático em 2026: 50–60 caracteres para não ser cortado na SERP. Coloque a keyword principal no início. Cada página deve ter um title único.

<title>Gerador de QR Code grátis — Quick Tools</title>

Meta description

Não é fator direto de ranking — o Google deixou claro isso. Mas é o texto que aparece abaixo do título na SERP e tem impacto direto no CTR (click-through rate). CTR é um sinal de relevância. Limite seguro: 120–160 caracteres. Se você não escrever uma, o Google vai pegar um trecho aleatório da página — que raramente é o melhor trecho.

<meta name="description" content="Crie QR codes para URL, WhatsApp, Wi-Fi ou texto em segundos. Sem cadastro, sem limite." />

Headings (H1, H2, H3)

O <h1> deve ter uma ocorrência por página e comunicar claramente o tema principal. Os <h2> organizam as seções. Isso não é só SEO — é estrutura para o leitor e para o crawler entender o que é mais importante na página.

URL limpa e descritiva

/ferramentas/gerador-qr-code ranqueia melhor que /page?id=482&cat=tools. A URL aparece na SERP, o Google a usa como sinal de conteúdo, e ela é mais fácil de linkar.

Core Web Vitals

Desde 2021 o Google usa métricas de performance como fator de ranking. As três que importam em 2026:

LCP (Largest Contentful Paint): tempo até o maior elemento visível carregar. Alvo: abaixo de 2,5 segundos.
INP (Interaction to Next Paint): tempo de resposta a interações do usuário. Alvo: abaixo de 200ms. Substituiu o FID em 2024.
CLS (Cumulative Layout Shift): quanto o layout pula enquanto carrega. Alvo: abaixo de 0,1.

Esses thresholds são os que o Google considera "bom" em 2026. O impacto no ranking é real mas proporcional — Core Web Vitals é um desempate entre páginas com conteúdo equivalente, não substituto de conteúdo de qualidade.

O que não é fator de ranking (mitos comuns)

Tem muita desinformação circulando sobre SEO. Alguns mitos persistentes:

"Postar todo dia melhora o ranking." Frequência de publicação não é fator direto. Uma página ótima publicada uma vez ranqueia melhor que dez páginas mediocres. O Google prefere conteúdo útil a conteúdo frequente.

"Meta keywords ainda funcionam." O Google ignorou a meta tag keywords desde 2009. Continuar usando não prejudica, mas não ajuda em nada.

"Ter SSL garante posição mais alta." HTTPS é um requisito básico de confiança desde 2018 — sites sem HTTPS são penalizados, mas ter HTTPS não te coloca à frente de ninguém. É o mínimo esperado.

"SEO demora 6 meses para funcionar." Depende completamente da competitividade da keyword e da autoridade do domínio. Uma página bem construída sobre uma keyword de baixa concorrência pode rankear em dias. Para keywords competitivas, sim, pode levar meses.

Como verificar se suas páginas estão indexadas

O jeito mais direto: busque site:seudominio.com no Google. O resultado mostra quantas páginas o Google tem indexadas do seu domínio. Se aparecerem bem menos páginas do que você tem publicado, há algum problema no pipeline de crawling ou indexação.

Para um diagnóstico mais preciso, o Google Search Console é a fonte autoritativa. Ele mostra quais URLs estão indexadas, quais estão com erro, e por que algumas foram excluídas do índice.

Antes de subir uma página nova, uso o Preview Google — SERP para visualizar como title e description vão aparecer nos resultados — especialmente útil para confirmar que o title não está cortando no meio de uma palavra e que a description está dentro do limite.

Perguntas frequentes

Quanto tempo leva para o Google indexar uma página nova?

Varia muito. Páginas em domínios estabelecidos com bom crawl budget podem ser indexadas em horas. Sites novos sem links externos podem levar semanas. Submeter a URL no Google Search Console (via "Inspecionar URL" → "Solicitar indexação") acelera o processo, mas não garante prazo.

O que é robots.txt e quando usar?

O robots.txt é um arquivo na raiz do domínio que diz ao Googlebot quais URLs ele não deve rastrear. Útil para excluir áreas administrativas, páginas de login, ou URLs com parâmetros que geram conteúdo duplicado. Importante: robots.txt bloqueia o rastreamento, não a indexação. Se uma URL bloqueada em robots.txt receber links externos, o Google pode indexá-la assim mesmo — sem conseguir ler o conteúdo.

Preciso de backlinks para rankear?

Para keywords competitivas, backlinks (links de outros domínios apontando para o seu) continuam sendo um dos sinais mais fortes de autoridade. Para keywords de baixa concorrência, conteúdo bem estruturado muitas vezes é suficiente. A autoridade do domínio acumulada através de links afeta o ranking de todas as páginas do site, não só das que recebem os links diretamente.

A tag canonical serve para quê?

Quando você tem conteúdo duplicado ou muito semelhante em múltiplas URLs, a tag canonical diz ao Google qual é a versão "oficial". Exemplo: /produto?cor=azul e /produto?cor=vermelho com conteúdo quase idêntico — você aponta ambas para /produto com canonical. Sem isso, o Google decide por conta própria qual versão rankear — e raramente escolhe a que você quer.

Indexação não é automática: o que fazer agora

A maioria dos problemas de visibilidade no Google não é de conteúdo — é de crawling. Página sem links apontando para ela, sitemap desatualizado, noindex que deveria ter sido removido depois do lançamento, canonical apontando para URL errada.

O fluxo mínimo para qualquer site novo: verificar no Search Console se as páginas principais estão indexadas, garantir que o sitemap está submetido e atualizado, e checar que nenhuma tag noindex ficou esquecida do ambiente de staging. Depois disso, SEO on-page é otimização — não o problema principal.

Autor

Rafael Duarte

Desenvolvedor backend com passagem por fintech e SaaS B2B — trabalhou em times que escalaram APIs de zero a milhões de requisições. Carrega cicatrizes de produção suficientes para ter opiniões fortes sobre ferramentas, padrões e decisões de arquitetura. Não é acadêmico: leu a RFC do UUID quando precisou escolher entre v4 e v7 para uma tabela de alta escrita.

Ver perfil

Mais vistos

Todos os artigos