Sentindo a velocidade da evolução da IA
Escrevendo este capítulo em março de 2026, o lema da indústria de IA é "o que era verdade há 6 meses já não vale mais".
Os números falam por si: os investimentos em IA atingiram US$ 225,8 bilhões em 2025, um recorde[1]. 77% das empresas já implementaram ou estão testando IA, e 21% da população mundial usa ferramentas de IA diariamente. O mercado de IA é estimado entre US$ 244 e 391 bilhões em 2025.
Vamos rever os principais acontecimentos dos últimos 18 meses em ordem cronológica.
A partir daqui, aprofundamos os 4 principais temas.
IA Multimodal — A IA que tem "cinco sentidos"
IA Multimodal é uma IA capaz de trabalhar com múltiplos formatos de forma integrada — texto, imagens, áudio e vídeo. Os primeiros LLMs eram "seres que só liam e escreviam texto". Hoje, a IA vê fotos, ouve vozes e cria vídeos.
Breakthroughs de 2025
| Área | Serviço | O que faz |
|---|---|---|
| Geração de imagens | GPT-4o (geração nativa) | Gera imagens com texto preciso. Quando lançada em março de 2025, a demanda foi tão alta que Altman disse que as GPUs "derreteram" |
| Geração de vídeo | Google Veo 3 | Gera vídeos com áudio. Após o lançamento, mais de 270 milhões de vídeos foram gerados |
| Compreensão de texto longo | Gemini 2.5 Pro | Processa 1 milhão de tokens (mais de um livro inteiro) de uma vez. Estreou em 1o lugar no LMArena |
| Diálogo por voz | GPT-4o Advanced Voice | Conversação natural em tempo real sem intermediação de texto. Funciona até como intérprete |
Por outro lado, o Sora (IA de vídeo da OpenAI), com custos estimados de US$ 15 milhões/dia em infraestrutura, teve seu encerramento anunciado em março de 2026. Gerar vídeos de alta qualidade ainda é extremamente caro.
Dica prática: A análise de imagens (foto → texto) está disponível gratuitamente em praticamente todos os serviços. Leitura de recibos, digitalização de notas manuscritas, extração de dados de gráficos — experimente no dia a dia.
A revolução dos modelos de raciocínio — A IA que "pensa"
A partir do final de 2024, uma nova categoria surgiu no mundo da IA: os modelos de raciocínio.
A IA tradicional respondia instantaneamente quando perguntada. Os modelos de raciocínio são diferentes. Eles "tiram um tempo para pensar" antes de responder. É como quando um humano resolve um problema de matemática fazendo anotações e pensando passo a passo.
Por que são importantes
Com os modelos de raciocínio, áreas em que a IA era fraca — matemática, ciência, programação complexa — tiveram saltos drásticos de desempenho.
- OpenAI o4-mini alcançou 92,7% em problemas de nível olímpico de matemática (AIME 2025). Com ferramentas Python, chegou a 99,5%
- DeepSeek R1 foi treinado por apenas ~US$ 6 milhões (comparado a mais de US$ 100 milhões estimados para o GPT-4) e alcançou alto desempenho. Em janeiro de 2025, chegou ao 1o lugar na App Store americana, e as ações da Nvidia caíram 18%[2]
- Claude Extended Thinking oferece uma funcionalidade exclusiva onde o desenvolvedor pode definir o "orçamento de pensamento". Também implementa "pensamento intercalado", onde continua pensando mesmo usando ferramentas
Destaque: Compute de tempo de inferência
A descoberta de que "quanto mais tempo a IA pensa, mais precisa é a resposta" adicionou um novo eixo à evolução da IA. Antes, as melhorias vinham de "mais dados de treino" e "modelos maiores". Agora, aumentar a computação durante a inferência também melhora o desempenho.
Agentes de IA — A era de "delegar"
A palavra-chave mais quente de 2025-2026 é agentes de IA.
Até agora, a IA era "perguntou, respondeu". Os agentes são diferentes. Você define um objetivo, e eles planejam, usam ferramentas e executam tarefas de forma autônoma. É como delegar trabalho a um assistente ou secretário.
Exemplos de agentes de IA
| Agente | O que faz | Destaque |
|---|---|---|
| Claude Code | Gera, executa e depura código de forma autônoma | Um dos 3 produtos de IA para código a ultrapassar US$ 1 bilhão em ARR |
| Operator | Navega e opera o navegador web, fazendo reservas e pesquisas | Inclui checkpoints humanos, mas segurança contra ataques de prompt ainda é desafio |
| Manus AI | Executa tarefas complexas de forma assíncrona na nuvem | Surgiu em março de 2025; logo depois, a Meta adquiriu por ~US$ 2 bilhões |
| Devin | Engenheiro de software autônomo por IA | US$ 500/mês. Taxa de sucesso oficial: 13,86% — ainda em desenvolvimento |
MCP — A "língua comum" dos agentes de IA
Como padrão para agentes se conectarem a ferramentas externas, o MCP (Model Context Protocol), desenvolvido pela Anthropic, está se espalhando rapidamente. Doado à Linux Foundation em dezembro de 2025, com downloads mensais do SDK chegando a 97 milhões. ChatGPT, Gemini, VS Code, AWS e Azure — as principais plataformas adotaram o padrão.
Segundo o Gartner, até o final de 2026, 40% dos aplicativos empresariais terão agentes de IA embutidos[1].
Desafios dos agentes: São convenientes, mas ainda têm limitações importantes: erros de julgamento complexo, riscos de segurança (enviar informações indevidamente), custos (chamadas de API em loop) e falta de transparência na responsabilização. A regra é "delegar e verificar", não "delegar e esquecer".
A ascensão da IA open source
GPT-4 e Claude não são as únicas opções. IAs open source — gratuitas e modificáveis — estão evoluindo numa velocidade impressionante.
Modelos principais (2025)
| Modelo | Desenvolvedor | Destaques |
|---|---|---|
| Llama 4 Scout/Maverick | Meta | Scout: suporte a contexto de 10 milhões de tokens, roda em 1 H100. Maverick: desempenho comparável ao GPT-4o |
| DeepSeek V3/R1 | DeepSeek (China) | V3 treinado por ~US$ 6M com nível GPT-4o. R1 chegou a 1o lugar nos EUA como modelo de raciocínio |
| Qwen 3 | Alibaba | Licença Apache 2.0. Suporte a 119 idiomas. Ultrapassou o Llama em downloads |
Por que a IA open source importa
A IA open source tem 5 vantagens fundamentais:
- Transparência — Permite verificar e auditar como o modelo funciona
- Personalização — Construa modelos especializados com seus próprios dados
- Custo — Rode no seu servidor e elimine custos de API
- Privacidade — Use IA sem enviar dados para terceiros
- Competição — Previne monopólio de IA por poucas grandes empresas
No verão de 2025, houve um marco simbólico: os downloads de modelos chineses (DeepSeek + Qwen) ultrapassaram os americanos. O equilíbrio geopolítico no desenvolvimento de IA está mudando.
Relevância para o usuário comum: A IA open source é voltada principalmente para empresas e desenvolvedores, mas seus benefícios chegam indiretamente a todos. Mais competição = preços menores e melhor desempenho nas IAs comerciais. Depois do lançamento do DeepSeek R1, todas as empresas reduziram significativamente os preços de suas APIs.
O futuro da IA — Perspectivas para 2026 em diante
IA + Robótica — "IA que se move"
Robôs humanoides que combinam a inteligência dos LLMs com corpos robóticos estão começando a atuar no mundo real.
- Figure 03 — Implantado nas fábricas da BMW. Mais de US$ 1 bilhão em investimentos
- 1X NEO — Primeiro humanoide doméstico. ~US$ 20 mil (ou US$ 499/mês), entregas começam em 2026
- Tesla Optimus — Meta de preço de US$ 20-30 mil. Plano de produção de dezenas de milhares em 2026
- China — Mais de 140 empresas, 330+ modelos em desenvolvimento
O caminho para a AGI — Previsões dos especialistas
AGI (Inteligência Artificial Geral — IA com inteligência igual ou superior à humana): as opiniões sobre quando chegará são divergentes.
| Posição | Previsão |
|---|---|
| Anthropic | "Início de 2027" — IA comparável a pesquisadores nível Nobel entre final de 2026 e início de 2027 |
| OpenAI | "Já sabemos como construir" — otimistas, mas sem data concreta |
| Google DeepMind | "3-5 anos" — revisado de "10 anos" para muito antes |
| Pesquisadores céticos | "Ainda faltam avanços fundamentais" — 10-20 anos na trajetória atual |
Mesmo que "a AGI esteja chegando", não significa que o dia a dia mude da noite para o dia. Mas é fato que o alcance do que a IA consegue fazer aumenta a cada mês. A suposição de "isso a IA ainda não consegue" pode ficar obsoleta em 6 meses.
O que fazer AGORA na era da IA
3 atitudes essenciais
- Experimente e se familiarize — Use as ferramentas gratuitas de IA. A melhor forma de aprender é fazendo
- Combine com seus pontos fortes — IA é uma ferramenta. O valor surge quando combinada com sua expertise e criatividade
- Aproveite as mudanças — Numa era em que tudo muda a cada 6 meses, manter a curiosidade é a maior habilidade
Referências
- Gartner. "Worldwide AI Spending Will Total $1.5 Trillion in 2025." Gartner Newsroom, September 2025. / Fortune Business Insights. "Artificial Intelligence Market Report." 2025.
- "DeepSeek R1: Open-source reasoning model." DeepSeek API Docs, January 20, 2025. / Market impact reported by multiple financial outlets, January 27, 2025.
Links relacionados:
- Hugging Face Models — Hub de modelos de IA open source
- LM Arena — Ranking comparativo de desempenho de modelos de IA
Parabéns por completar os 6 capítulos!
Você adquiriu um conhecimento estruturado desde os fundamentos até as últimas tendências da IA. A IA evolui a cada dia. Com a base que aprendeu neste curso, continue experimentando as ferramentas e acompanhando as novidades.