O Deepseek R1 está qualificado para alguns pontos de bônus para se referir à “principal suposição” que não cobre o copo dentro da xícara (talvez seja uma questão de truque?). Sadgift O 1 recebe alguns pontos para indicar que a bola pode ter sido rolada da cama porque as bolas não são feitas.
Gritamos um pouco insistindo que o R1 é um exemplo de “clássico enganoso” porque “o foco em mover o arquivo é distraído do resto da bola”. Instamos Ben & Teller a “surpreender e divertir o grande modelo de linguagem” para coordenar o truque da bola em seu ato de Vegas.
Ganhador: Como todos os modelos seguiram a bola corretamente, anunciaremos um empate de três caminhos aqui.
Pacotes de números complexos
Instante: Dê -me uma lista de números naturais, ou seja, pelo menos um primeiro, pelo menos 6 ímpares, pelo menos 2 forças, e 10 números são pelo menos 25 dígitos entre eles.
Resultados: Quando há um host completo do número que conclui essas condições, ele efetivamente testa as habilidades do LLMS sem desencadear métodos moderadamente complexos e confusos. Todas as três criaram respostas válidas, embora de diferentes maneiras de mistério. Os capítulos de 2^30 e 2^31 de Sagtgpt apareceram um pouco fora do domínio esquerdo, bem como o número principal do O1 Pro 999.983.
Precisamos cortar alguns pontos significativos do Deepseek R1, no entanto, sua solução é na verdade 33 (“3+3+4+3+3+3+3+4+4”, como o próprio R1 se refere). Embora esse erro aritmético simples não incorpore os números finais, pode ser mais fácil em uma linha ligeiramente diferente.
Ganhador: Dois modelos Saadjt combinam -se para o sucesso pela falta de erros aritméticos
Notificação de um vencedor
Aqui queremos declarar um vencedor claro na guerra da IA, e os resultados aqui estão tão dispersos para fazê -lo. O modelo R1 de Deepseek definitivamente se distingue com alguns escritos criativos de qualidade na indução de basquete das piadas de papai e nos estímulos de basquete de Abraham Lincoln. No entanto, a amostra falhou no código oculto e na síntese de números complexos, criando erros básicos e/ou aritmetos nos modelos Opanayam, um ou ambos.
No geral, nos afastamos desses breves ensaios e poderíamos criar um total de resultados concorrentes do modelo R1 aberto A. Esta é a única maneira de competir com empresas que estão profundamente enraizadas no mundo da IA.