Apple reconstruiu a Siri em cima do Google Gemini — o que isso significa
A Apple pagou US$ 1 bilhão por ano ao Google para rodar o Gemini na Siri. A empresa que vendia privacidade como produto acabou de terceirizar o núcleo do seu assistente para o maior rival do iOS.
A Apple passou uma década construindo a identidade de que privacidade é um produto, controle vertical é uma vantagem competitiva e dependência de terceiros é fraqueza. No WWDC 2026, ela subiu no palco e anunciou que a Siri — seu assistente de voz, o produto mais visível do iPhone para usuários comuns — agora roda em cima de um modelo do Google.
Não é um parceiro neutro. É o Google. A empresa com quem a Apple luta no mercado de navegadores, no mercado de publicidade, no mercado de busca embutida no iOS, e em múltiplos processos antitruste em três continentes.
E mesmo assim: a Siri AI do WWDC 2026 é alimentada por uma versão customizada do Gemini, rodando em GPUs Nvidia Blackwell B200 no Google Cloud.
Como a Siri chegou nesse ponto
A trajetória da Siri nos últimos quatro anos é um caso clínico de dívida técnica em escala corporativa. Enquanto o ChatGPT explodia em novembro de 2022 e o Google lançava o Gemini em 2023, a Siri continuava executando um pipeline construído em era pré-transformer: intenções classificadas manualmente, grafos de conhecimento estáticos, capacidade de raciocínio perto de zero.
A Apple anunciou "Apple Intelligence" no WWDC 2024 com aquela promessa habitual de "vai mudar tudo". O update real chegou fragmentado, atrasado, e as features mais ambiciosas — Siri entendendo contexto de tela, raciocínio multi-etapa — foram repetidamente empurradas para "próximo ano". Tim Cook perdeu confiança no John Giannandrea, o responsável pela IA. A Bloomberg documentou isso em 2025.
O problema não era só produto. Era arquitetural. Treinar um modelo frontier do zero, do tamanho do GPT-4 ou do Gemini 1.5 Pro, custa bilhões de dólares e anos de pesquisa. A Apple tem os bilhões, mas não os anos.
A solução encontrada: comprar acesso ao modelo pronto e construir a camada de privacidade por cima.
A arquitetura de três camadas
O que a Apple apresentou no WWDC não é simplesmente "Siri usa Gemini". A arquitetura é mais sofisticada do que isso, e entender como ela funciona importa para avaliar se as promessas de privacidade fazem sentido.
Camada 1 — on-device: tarefas simples, como criar alarmes, enviar mensagens para contatos, rodar atalhos, ficam nos modelos próprios da Apple rodando no neural engine do dispositivo. Nada sai do aparelho.
Camada 2 — Private Cloud Compute: pedidos de complexidade média sobem para os servidores da Apple. A Apple afirma que pesquisadores externos podem auditar o código rodando nessa camada a qualquer momento.
Camada 3 — Google Cloud com Blackwell B200: o raciocínio pesado — perguntas complexas, análise de documentos, contexto longo — roteia para o Google Cloud, em GPUs da linha Blackwell da Nvidia. Aqui fica a versão customizada do Gemini com 1,2 trilhão de parâmetros totais (arquitetura mixture-of-experts, que ativa apenas um subconjunto de parâmetros por consulta).
Antes de chegar ao Google, a Apple diz que anonimiza e tokeniza as queries para que nem ela nem o Google consigam vincular o pedido a um usuário específico. O contrato com o Google também proíbe o uso dos dados para treinamento de modelos futuros. O Blackwell B200 tem confidential computing no hardware, que encripta os dados enquanto estão sendo processados na GPU.
Por que o Blackwell B200 especificamente
A Nvidia lançou a arquitetura Blackwell no início de 2025, e os B200 são a geração de GPU mais capaz disponível comercialmente para cargas de inferência de LLMs. Em comparação com os H100 (Hopper), os B200 entregam throughput de inferência significativamente maior com menor consumo de energia por token gerado.
Para a Apple, isso importa por dois motivos. Primeiro: viabilidade econômica. Um modelo de 1,2 trilhão de parâmetros com mixture-of-experts pode rodar de forma economicamente sustentável em escala de bilhões de usuários se o hardware de inferência for eficiente o suficiente. Segundo: o confidential computing nativo do Blackwell — a GPU processa dados encriptados sem expô-los em memória — é justamente o argumento técnico que a Apple usa para afirmar que "nem o Google tem acesso ao dado".
O deal custa aproximadamente 1 bilhão de dólares por ano.
O problema que nenhum contrato resolve completamente
A Craig Federighi subiu no palco e disse "privacy in AI is non-negotiable". A frase ficou bonita no slide. O problema é que promessas contratuais e garantias de hardware têm limites diferentes da garantia de privacidade que a Apple vendia antes.
Pesquisadores de segurança levantaram o ponto óbvio logo depois do keynote: a Private Cloud Compute é "tão privada quanto o elo mais fraco". Se o Google mantiver qualquer caminho para dados de uso — mesmo que anonimizados, mesmo que agregados — para debugging de modelo ou monitoramento de infraestrutura, a promessa de privacidade muda de natureza. Não é quebrada, mas é diferente de "seus dados nunca saem do dispositivo".
Isso não é um argumento contra a Siri AI. É um argumento de honestidade: a Apple mudou o que "privacidade" significa para o assistente dela, e não ficou claro no keynote que essa mudança aconteceu.
Antes do WWDC 2026, a Siri processava pedidos on-device ou na Private Cloud Compute da Apple. O dado nunca tocava infraestrutura de terceiros. Agora toca — com garantias contratuais e técnicas robustas, mas toca.
O que a Siri AI realmente ganha
Além do debate de privacidade, vale documentar o que mudou funcionalmente, porque é substancial.
A Siri AI ganhou consciência de tela em tempo real. Se você recebe um texto com detalhes de voo, pode pedir para a Siri "adicionar isso ao calendário e mandar o horário de chegada para a minha mãe" — ela lê o que está na tela, cria o evento, envia a mensagem. Isso funcionava de forma rudimentar no Apple Intelligence 2024; agora funciona de forma confiável.
A Siri também ganhou um app standalone pela primeira vez. Você pode abrir, digitar ou falar, manter histórico de conversa — similar ao ChatGPT ou Gemini como produto. Não é o assistente de voz do iPhone; é um app separado, com interface de chat.
Raciocínio multi-etapa funciona agora. "Reserve uma mesa para sexta à noite perto de onde João mora, mas não japonês porque ele tem alergia" — esse tipo de instrução com contexto implícito e múltiplas restrições era onde a Siri antiga falhava consistentemente. O modelo Gemini subjacente resolve.
O que isso significa para o setor
A Apple admitindo que não consegue construir um modelo frontier competitivo sozinha é um dado de mercado. A empresa mais valiosa do mundo, com mais de 100 bilhões de dólares em caixa, com acesso a hardware, dados de uso de bilhões de dispositivos — e ainda assim chegou à conclusão de que comprar capacidade de modelo do Google é mais eficiente do que treinar do zero.
Isso muda a narrativa do "build vs buy" para modelos de linguagem no setor. Se a Apple faz buy, qualquer empresa que estava na dúvida sobre treinar modelo próprio tem agora um precedente de peso.
Também consolida o Google em posição interessante: a empresa recebe 1 bilhão de dólares por ano da Apple para alimentar o principal concorrente do Google Assistant. É um mercado estranho.
A Microsoft tem o GPT-4 via OpenAI na Cortana. A Amazon tem os modelos próprios via Bedrock e a Anthropic como investimento estratégico. A Apple agora tem o Gemini. A questão que fica é: qual das três estratégias produz o melhor assistente de voz em dois anos? Não sabemos ainda.
A virada que a Apple não anunciou explicitamente
O que ficou implícito no keynote e vale nomear: a Apple abandonou a estratégia de Apple Intelligence como diferencial proprietário de modelo. O "Apple Intelligence" do WWDC 2024 era, na narrativa da Apple, uma vantagem competitiva — modelos treinados pela Apple, para o hardware Apple, com privacidade Apple. O rebranding para "Siri AI" com Gemini por baixo é o reconhecimento de que essa estratégia não funcionou no prazo necessário.
A Apple continua diferenciada na camada de hardware (chips A-series, neural engine), na camada de on-device (modelos menores para tarefas simples), e na camada de produto (integração com o ecossistema iOS/macOS). O modelo de linguagem virou commodity comprada.
Isso é pragmatismo. Não é derrota — a integração funciona, o produto ficou melhor. Mas é uma mudança de posição estratégica que a Apple não nomeou diretamente, e que tem consequências para como você deve pensar nos próximos ciclos de iPhone.
Nota: o conteúdo editorial acabou aqui. O que vem abaixo é uma indicação de ferramenta relacionada ao tema do post.
Ferramenta relacionada
Se você está entendendo como os assistentes de IA e servidores identificam dispositivos e browsers nas requisições, o User Agent Parser analisa qualquer string de user agent instantaneamente — detecta browser, sistema operacional, tipo de dispositivo e motor de renderização. Útil quando você está depurando como seu app aparece para diferentes clientes HTTP ou validando headers de requisição.