O que é?
Retém a arquitetura multimodal do GPT4o, mas é otimizado para eficiência em vez de potência bruta. Combina raciocínio estruturado com respostas rápidas de linguagem natural e entendimento básico de imagens.
Casos de uso ideais:
Resolução ágil de problemas em STEM com precisão sólida
Aplicações em tempo real com baixa latência
Processamento multimodal com sofisticação limitada
Fluxos com saídas estruturadas e chamadas de função
Sistemas que equilibram eficiência e raciocínio computacional