Aumente o fato de que outras empresas de tecnologia são inspiradas nas diretrizes do Deesek. Olhar Há muito menos cor de rosa.
O ciclo de vida de qualquer modelo de IA tem duas etapas: treinamento e infraestrutura. O treinamento é um processo por muitos meses, que está aprendendo com os dados. O modelo está pronto para inferior, o que ocorre toda vez que todos no mundo perguntam alguma coisa. Ambos geralmente ocorrem no data center, que eles precisam de muita energia para executar o chip e o servidor frio.
Em termos de treinamento para o modelo R1, a equipe Deeek melhorou o que é chamado de técnica de “especialistas”, que apenas parte de bilhões de modelos -“botões” usados para criar melhores respostas. Tempo especificado durante o treinamento Em particular, eles melhoram o aprendizado, o reforço, com os resultados do modelo recebem pontos e usados para melhorar. Isso geralmente é feito pela Assembléia Humana, mas a equipe Deeek se saiu bem ao fazê -la automaticamente.
A introdução de métodos de treinamento mais eficientes pode sugerir que a IA usará menos energia para levar seus modelos de IA para certos padrões. Isso não está realmente funcionando.
“Porque o valor de ter um sistema mais inteligente é muito alto”. escrever O co -fundador do Dario Amodei em seu blog. mais do queNão menos que o formulário de treinamento Como exemplo do que é chamado Jevons Paradox.
Mas isso é verdade no treinamento enquanto a corrida da IA estiver indo. A energia necessária para a inflação é algo mais interessante.
Deeseek foi projetado como um motivo de raciocínio, o que significa que significa um bom trabalho em várias coisas, como lógica, busca de matemática e outros modelos de IA. Modelo de raciocínio, fazendo isso usando o que é chamado “A cadeia do pensamento” ajuda os modelos de IA a dividir o trabalho em partes e a trabalhar através deles em lógica antes de chegar à conclusão.
Você pode ver isso com Deeseek perguntando se mentir para proteger os sentimentos de alguém ou não. Em seguida, considerará a ética kantiana, o que sugere que você deve prosseguir com as máximas que podem ser uma lei universal. Considere essas diferenças e outras pessoas antes de compartilhar a conclusão. (Descobriram que as mentiras são “aceitas em geral em uma situação em que a compaixão e a prevenção são muito importantes.