Blog | @nascimentoab

24 jul 2026

Quando a IA saiu da caixa: o ataque autônomo à Hugging Face

Um modelo da OpenAI escapou de um sandbox mal configurado durante um teste interno e invadiu sozinho a Hugging Face. Um dos primeiros casos documentados de ciberataque conduzido por IA.

Ler artigo →

22 jul 2026

Kimi K3, o modelo chinês que assustou o Vale do Silício

A chinesa Moonshot lançou o Kimi K3, modelo aberto que iguala Claude e ChatGPT e lidera a Arena em front-end. Diferente do Fugu, é uma LLM própria — e entra na disputa direta em meio à corrida EUA×China.

Ler artigo →

22 jul 2026

Fugu, a aposta japonesa da Sakana AI

A japonesa Sakana AI lançou o Fugu, que iguala Fable 5 e Mythos 5 nos benchmarks — mas com uma pegada diferente: não é uma LLM própria, e sim um orquestrador multiagente, vendido como alternativa livre de controles de exportação.

Ler artigo →

09 jul 2026

Fable 5 e Mythos 5 — dois irmãos, capítulo 2: o bem-comportado que segue trancado do lado de fora

O irmão perigoso voltou, mas o bem-comportado segue trancado. Por que o Fable 5 não espera um conserto, e sim um consenso entre Pentágono e inteligência — e por que ele voltará com sotaque e passaporte.

Ler artigo →

09 jul 2026

Fable 5 e Mythos 5 — dois irmãos, capítulo 1: o irmão perigoso ganha liberdade condicional

Dos dois modelos banidos, o primeiro a voltar foi o mais perigoso — o Mythos 5, sob liberdade condicional para defensores dos EUA. E um laboratório chinês já igualou a capacidade, em peso aberto.

Ler artigo →

23 jun 2026

Automatizando uma agência de marketing: visão executiva

Agência em processo manual queima margem. Por que desacoplar crescimento de custo via automação — as três camadas, orquestração agêntica, n8n self-hosted e o roteiro de ROI, na visão de quem gerencia datacenter.

Ler artigo →

22 jun 2026

Midjourney: a empresa que mudou como vemos o mundo agora quer mudar como cuidamos do nosso corpo

A Midjourney, símbolo da IA que gera imagens, lançou a Midjourney Medical: um scanner de ultrassom de corpo inteiro em 60 segundos — e um plano de negócio inesperado: spas de luxo.

Ler artigo →

21 jun 2026

Fable 5 e Mythos 5: o verdadeiro motivo apareceu — e não é o que estava no roteiro

O verdadeiro motivo do banimento apareceu — no Senado dos EUA. A disputa é sobre governança e precedência, não sobre um conserto técnico; ainda assim, os sinais de desfecho melhoraram.

Ler artigo →

19 jun 2026

Fable 5 e Mythos 5: a crise agora tem CEP — e fica em Seul

A diretiva dos EUA contra o Fable 5 e o Mythos 5 ganhou endereço: participantes sul-coreanos (Samsung, SK Hynix, SK Telecom) tiveram acesso cortado. E a Anthropic abriu escritório em Seul em plena crise. As datas que valem anotar: 20, 22 e 23 de junho.

Ler artigo →

17 jun 2026

Fable 5 e Mythos 5: a negociação ficou mais complicada

A negociação entre Anthropic e governo dos EUA andou rápido — mas ganhou três complicadores: a Amazon como quem reportou o jailbreak, a suspeita de acesso ligado à China e o ruído sobre um suposto ultimato.

Ler artigo →

16 jun 2026

Fable 5 e Mythos 5: como está a negociação agora

O caso Fable 5 / Mythos 5 saiu da fase do susto e entrou na mesa de negociação: reuniões diárias no Departamento de Comércio, equipe técnica sênior e um cenário de volta condicional ganhando força.

Ler artigo →

15 jun 2026

Três dias de vida: o que o caso Fable 5 e Mythos 5 nos conta sobre o futuro da IA

A Anthropic lançou Fable 5 e Mythos 5 numa terça e os desligou na sexta, após uma diretiva de controle de exportação dos EUA. O que o caso revela sobre governança, risco de fornecedor único e o futuro da IA de fronteira.

Ler artigo →

13 jun 2026

Comunicado sobre a diretiva do governo dos EUA para suspender o acesso ao Fable 5 e ao Mythos 5

O governo dos EUA emitiu uma diretiva de controle de exportação suspendendo o acesso ao Fable 5 e ao Mythos 5. A Anthropic cumpre a ordem, discorda do fundamento técnico e trabalha para restaurar o acesso.

Ler artigo →

10 jun 2026

Claude Mythos: o modelo que a Anthropic não quer liberar

O Claude Mythos é o modelo mais capaz já construído pela Anthropic, mas teve o release público adiado por risco: descobriu milhares de vulnerabilidades zero-day de forma autônoma.

Ler artigo →

10 jun 2026

Mega tendências e o uso de inteligência artificial

Sete mega tendências de IA já transformam os negócios — da IA generativa à observabilidade preditiva e governança de dados — junto com os riscos reais e um caminho prático para começar.

Ler artigo →

10 jun 2026

Governança de dados como fundação de projetos de IA

IA é só tão boa quanto seus dados. Governança de dados — qualidade, catalogação, privacidade, MDM, retenção e acesso — é pré-requisito, não extra, para qualquer projeto de IA bem-sucedido.

Ler artigo →

10 jun 2026

Segurança defensiva vs ofensiva: IA na detecção e prevenção de ameaças

Como a IA muda a cibersegurança de reativa para antecipatória: detecção de comportamento anômalo, threat intelligence, kill chains, resposta automática e os riscos do próprio uso de IA.

Ler artigo →

10 jun 2026

Observabilidade preditiva: de reativo para proativo

Observabilidade preditiva usa Machine Learning para prever falhas antes que se manifestem, reduzindo MTTR e downtime em datacenters por meio de detecção de anomalias e correlação multivariada.

Ler artigo →

10 jun 2026

RPA cognitivo: automação que aprende e se adapta

RPA cognitivo combina automação de processos com Machine Learning para lidar com exceções e variações em datacenters, do provisionamento à triagem de alertas e root cause analysis.

Ler artigo →

10 jun 2026

IA generativa em datacenters: implementação prática e riscos reais

Como colocar LLMs em produção em datacenters sem quebrar compliance, segurança ou orçamento: arquiteturas, integração, segurança de dados, custos e um roadmap prático.

Ler artigo →

10 jun 2026

Mistral, GLM e MiniMax: os modelos que ninguém esperava

Mistral, GLM e MiniMax representam a segunda camada do open source que vem surpreendendo o mercado, superando favoritos em benchmarks de matemática, raciocínio e engenharia de software.

Ler artigo →

10 jun 2026

Gemma 4 e Phi-4: Google e Microsoft no open source

Gemma 4 e Phi-4 mostram duas filosofias de IA open source: o Google aposta em modelos médios de alto desempenho, a Microsoft prova que modelos pequenos podem competir com gigantes.

Ler artigo →

10 jun 2026

Qwen 3 e 3.5: a Alibaba entra na disputa pelo topo

Com o Qwen 3 e o Qwen 3.5, a Alibaba colocou seus modelos open source entre os mais capazes do mundo, liderando o GPQA Diamond no open source e oferecendo 1M+ de tokens de contexto sob Apache 2.0.

Ler artigo →

10 jun 2026

DeepSeek: a China que abalou o mercado de IA

Em janeiro de 2025, a DeepSeek lançou modelos open source sob licença MIT que competem com os melhores proprietários a uma fração do custo, abalando o mercado de chips e infraestrutura.

Ler artigo →

10 jun 2026

Meta Llama 4: a IA open source que reinventou o jogo

O Llama 4 marcou a adoção da arquitetura Mixture of Experts pela Meta, entregando qualidade de modelo gigante com custo de inferência compacto e contexto de até 10 milhões de tokens.

Ler artigo →

10 jun 2026

Qwen 3.6 Plus: Alibaba deu um passo maior que o esperado

O Qwen 3.6 Plus dobra o contexto para 1 milhão de tokens, empata ou vence em 5 de 8 benchmarks, está gratuito no OpenRouter e reforça a família open source mais diversificada do mercado.

Ler artigo →

10 jun 2026

GLM-5.1: código aberto assumiu o primeiro lugar no benchmark que realmente importa

O GLM-5.1 da Z.ai liderou o SWE-Bench Pro superando GPT-5.4 e Claude Opus 4.6 — a primeira vez que um modelo open source com licença MIT vence os fechados em código real.

Ler artigo →

10 jun 2026

Gemini 2.5 Pro: o Google está em primeiro e agora fala com você

O Gemini 2.5 Pro lidera o LMArena com recorde de Elo, traz o modo Deep Think, saída de áudio nativa, automação via Project Mariner e thinking budgets para desenvolvedores.

Ler artigo →

10 jun 2026

GPT-5.4: a OpenAI uniu raciocínio e código num único motor

O GPT-5.4 funde raciocínio avançado e codificação em um só modelo, com 1 milhão de tokens de contexto, uso nativo do computador e redução expressiva de erros e alucinações.

Ler artigo →

10 jun 2026

Claude Opus 4.7: a Anthropic entregou seu modelo mais capaz ao público

O Claude Opus 4.7 traz saltos simultâneos em código, visão em alta resolução e autonomia em tarefas longas, além do novo nível de raciocínio xhigh — pelo mesmo preço do Opus 4.6.

Ler artigo →

10 jun 2026

Thinking budgets: o controle que os desenvolvedores precisavam

Thinking budgets permitem definir quanto raciocínio um modelo gasta por chamada, calibrando custo e qualidade por tarefa e reduzindo o gasto de pipelines em até 80%.

Ler artigo →

10 jun 2026

IA em 2026: US$ 300 bilhões e o fim do hype

O mercado de IA deve ultrapassar US$ 300 bilhões em 2026, marcando a transição de pilotos experimentais para infraestrutura em produção. A barreira agora é organizacional, não tecnológica.

Ler artigo →

10 jun 2026

Mixture of Experts: a arquitetura que está redefinindo eficiência em LLMs

A arquitetura Mixture of Experts permite modelos com centenas de bilhões de parâmetros que ativam só uma fração por inferência, reduzindo o custo computacional em mais de 90%.

Ler artigo →

10 jun 2026

Cursos gratuitos de IA em 2026: o que vale a pena e o que está sobrando

Com dezenas de cursos gratuitos de IA disponíveis em 2026, o desafio é escolher. Um guia direto sobre as melhores opções de Google, Microsoft, OpenAI, FGV e universidades.

Ler artigo →

10 jun 2026

IA agêntica: quando o modelo para de responder e começa a trabalhar

A IA agêntica inverte a lógica do chatbot: o modelo recebe um objetivo, planeja, usa ferramentas e executa. Em 2026 saiu do papel, com adoção empresarial acelerada e ROI alto.

Ler artigo →

10 jun 2026

A corrida da janela de contexto: 1 milhão, 10 milhões, e o que realmente funciona

Modelos anunciam até 10 milhões de tokens de contexto, mas o efeito 'lost in the middle' e os custos extras limitam o uso prático. Quando janela longa funciona e quando RAG ainda vence.

Ler artigo →

10 jun 2026

Multimodalidade real: quem processa áudio e vídeo nativamente em 2026

Nem todo modelo dito multimodal processa áudio e vídeo de verdade. Um mapa de quais LLMs de 2026 fazem fusão precoce nativa e por que áudio e vídeo nativos mudam casos de uso.

Ler artigo →

10 jun 2026

Modelos pequenos e fine-tuning em 2026: a vantagem dos especializados

Em 2026, modelos pequenos fine-tunados em dados de domínio superam LLMs gerais nas tarefas específicas — com custo de inferência até 10 vezes menor e deployment no edge.

Ler artigo →

10 jun 2026

Gemma 4: o Google abre o jogo com Apache 2.0 e IA no dispositivo

O Gemma 4 chega sob Apache 2.0 em toda a família, com modelos de edge multimodais que rodam offline e um flagship 31B no top 3 global de qualidade de texto.

Ler artigo →

10 jun 2026

Qwen 3.5 e 3.6: a Alibaba e a ambição de cobrir todos os casos de uso

A família Qwen 3.5/3.6 da Alibaba cobre do edge ao datacenter com arquitetura unificada, multimodalidade nativa, 201 idiomas e licença Apache 2.0 — a opção open source de menor fricção global.

Ler artigo →

10 jun 2026

O open source alcançou a fronteira: o que mudou em 2026

Em 2026, modelos abertos como DeepSeek V4, Llama 4 e Gemma 4 chegaram a 77-80% dos benchmarks de produção dos modelos fechados, encerrando a era em que open source ficava uma geração atrás.

Ler artigo →

10 jun 2026

Mistral Medium 3.5 e Grok 4.3: quando eficiência vira vantagem competitiva

Mistral Medium 3.5 e Grok 4.3 apostam em desempenho de fronteira a custo menor, mostrando que ser bom o suficiente a preço irresistível pode mover o mercado tanto quanto liderar benchmarks.

Ler artigo →

10 jun 2026

GPT-5.5 e Claude Opus 4.7: a nova barra dos modelos autônomos

GPT-5.5 e Claude Opus 4.7 marcam uma virada na fronteira fechada: o foco deixa de ser responder melhor e passa a ser executar tarefas com autonomia agentiva real.

Ler artigo →

10 jun 2026

Llama 4: Meta redefine o open source com MoE nativo e multimodalidade

O Llama 4 é a primeira família aberta da Meta com Mixture of Experts nativo e multimodalidade desde o treinamento, incluindo o Scout com 10 milhões de tokens de contexto.

Ler artigo →

10 jun 2026

DeepSeek V4: o modelo open source que chegou ao nível dos fechados

Com 1,6 trilhão de parâmetros, licença MIT e benchmarks no nível dos modelos proprietários, o DeepSeek V4 apagou a fronteira de qualidade entre open source e fechado.

Ler artigo →

10 jun 2026

IA multimodal na medicina: radiologia, patologia e o futuro da precisão genômica

Modelos como Med-Gemini integram imagem, texto e genômica em uma única arquitetura, superando métodos tradicionais em radiologia, patologia e medicina de precisão.

Ler artigo →

10 jun 2026

ESM3, Evo 2 e os modelos que aprendem a linguagem da vida

ESM3 e Evo 2 são modelos de linguagem treinados em proteínas e DNA que já projetam proteínas inéditas e analisam genomas completos, acelerando a biologia computacional.

Ler artigo →

10 jun 2026

O primeiro remédio descoberto por IA: rentosertib e o que vem depois

O rentosertib, primeiro medicamento descoberto e desenhado de ponta a ponta por IA, teve resultados positivos em ensaio clínico de Fase IIa publicado na Nature Medicine.

Ler artigo →

10 jun 2026

Llama 4 e DeepSeek V4: open source chegou na fronteira de verdade

Llama 4 Scout (10M de tokens de contexto) e DeepSeek V4 (1.6 trilhão de parâmetros) colocaram o open source na fronteira real dos LLMs, com custo de inferência até 100 vezes menor.

Ler artigo →

10 jun 2026

A guerra de preços dos LLMs: como os tokens ficaram 280 vezes mais baratos

Em dois anos o custo por token dos LLMs caiu 280 vezes, impulsionado por arquitetura MoE, competição chinesa e open source — mas o gasto total das empresas subiu 320%.

Ler artigo →

Quando a IA saiu da caixa: o ataque autônomo à Hugging Face

Kimi K3, o modelo chinês que assustou o Vale do Silício

Fugu, a aposta japonesa da Sakana AI

Fable 5 e Mythos 5 — dois irmãos, capítulo 2: o bem-comportado que segue trancado do lado de fora

Fable 5 e Mythos 5 — dois irmãos, capítulo 1: o irmão perigoso ganha liberdade condicional

Automatizando uma agência de marketing: visão executiva

Midjourney: a empresa que mudou como vemos o mundo agora quer mudar como cuidamos do nosso corpo

Fable 5 e Mythos 5: o verdadeiro motivo apareceu — e não é o que estava no roteiro

Fable 5 e Mythos 5: a crise agora tem CEP — e fica em Seul

Fable 5 e Mythos 5: a negociação ficou mais complicada

Fable 5 e Mythos 5: como está a negociação agora

Três dias de vida: o que o caso Fable 5 e Mythos 5 nos conta sobre o futuro da IA

Comunicado sobre a diretiva do governo dos EUA para suspender o acesso ao Fable 5 e ao Mythos 5

Claude Mythos: o modelo que a Anthropic não quer liberar

Mega tendências e o uso de inteligência artificial

Governança de dados como fundação de projetos de IA

Segurança defensiva vs ofensiva: IA na detecção e prevenção de ameaças

Observabilidade preditiva: de reativo para proativo

RPA cognitivo: automação que aprende e se adapta

IA generativa em datacenters: implementação prática e riscos reais

Mistral, GLM e MiniMax: os modelos que ninguém esperava

Gemma 4 e Phi-4: Google e Microsoft no open source

Qwen 3 e 3.5: a Alibaba entra na disputa pelo topo

DeepSeek: a China que abalou o mercado de IA

Meta Llama 4: a IA open source que reinventou o jogo

Qwen 3.6 Plus: Alibaba deu um passo maior que o esperado

GLM-5.1: código aberto assumiu o primeiro lugar no benchmark que realmente importa

Gemini 2.5 Pro: o Google está em primeiro e agora fala com você

GPT-5.4: a OpenAI uniu raciocínio e código num único motor

Claude Opus 4.7: a Anthropic entregou seu modelo mais capaz ao público

Thinking budgets: o controle que os desenvolvedores precisavam

IA em 2026: US$ 300 bilhões e o fim do hype

Mixture of Experts: a arquitetura que está redefinindo eficiência em LLMs

Cursos gratuitos de IA em 2026: o que vale a pena e o que está sobrando

IA agêntica: quando o modelo para de responder e começa a trabalhar

A corrida da janela de contexto: 1 milhão, 10 milhões, e o que realmente funciona

Multimodalidade real: quem processa áudio e vídeo nativamente em 2026

Modelos pequenos e fine-tuning em 2026: a vantagem dos especializados

Gemma 4: o Google abre o jogo com Apache 2.0 e IA no dispositivo

Qwen 3.5 e 3.6: a Alibaba e a ambição de cobrir todos os casos de uso

O open source alcançou a fronteira: o que mudou em 2026

Mistral Medium 3.5 e Grok 4.3: quando eficiência vira vantagem competitiva

GPT-5.5 e Claude Opus 4.7: a nova barra dos modelos autônomos

Llama 4: Meta redefine o open source com MoE nativo e multimodalidade

DeepSeek V4: o modelo open source que chegou ao nível dos fechados

IA multimodal na medicina: radiologia, patologia e o futuro da precisão genômica

ESM3, Evo 2 e os modelos que aprendem a linguagem da vida

O primeiro remédio descoberto por IA: rentosertib e o que vem depois

Llama 4 e DeepSeek V4: open source chegou na fronteira de verdade

A guerra de preços dos LLMs: como os tokens ficaram 280 vezes mais baratos

Receba as publicações