08 jun 2026
LLMs na medicina: do benchmark USMLE ao consultório real
O o3 da OpenAI marca 96% no MedQA — o exame de licenciamento médico americano (USMLE). O GPT-5 marca 73% no HealthBench. Em abril de 2026, um estudo da Harvard Medical School e Beth Israel Deaconess Medical Center publicado com repercussão no NPR concluiu que um modelo de raciocínio da OpenAI igualou ou superou médicos em acurácia diagnóstica para casos de pacientes reais. Esses números são reais. Mas existe uma lacuna entre benchmarks e prática clínica que a indústria ainda não solucionou — e e
Ler artigo →