Se o golpe de tempo de teste certo for fornecido, o modelo de idioma pequeno 1B poderá ganhar o modelo de idioma grande 405 B em tarefas racionais. Leia mais

Link da fonte