Aumente o fato de que outras empresas de tecnologia são inspiradas nas diretrizes do Deesek. Olhar Há muito menos cor de rosa.

O ciclo de vida de qualquer modelo de IA tem duas etapas: treinamento e infraestrutura. O treinamento é um processo por muitos meses, que está aprendendo com os dados. O modelo está pronto para inferior, o que ocorre toda vez que todos no mundo perguntam alguma coisa. Ambos geralmente ocorrem no data center, que eles precisam de muita energia para executar o chip e o servidor frio.

Em termos de treinamento para o modelo R1, a equipe Deeek melhorou o que é chamado de técnica de “especialistas”, que apenas parte de bilhões de modelos -“botões” usados ​​para criar melhores respostas. Tempo especificado durante o treinamento Em particular, eles melhoram o aprendizado, o reforço, com os resultados do modelo recebem pontos e usados ​​para melhorar. Isso geralmente é feito pela Assembléia Humana, mas a equipe Deeek se saiu bem ao fazê -la automaticamente.

A introdução de métodos de treinamento mais eficientes pode sugerir que a IA usará menos energia para levar seus modelos de IA para certos padrões. Isso não está realmente funcionando.

“Porque o valor de ter um sistema mais inteligente é muito alto”. escrever O co -fundador do Dario Amodei em seu blog. mais do queNão menos que o formulário de treinamento Como exemplo do que é chamado Jevons Paradox.

Mas isso é verdade no treinamento enquanto a corrida da IA ​​estiver indo. A energia necessária para a inflação é algo mais interessante.

Deeseek foi projetado como um motivo de raciocínio, o que significa que significa um bom trabalho em várias coisas, como lógica, busca de matemática e outros modelos de IA. Modelo de raciocínio, fazendo isso usando o que é chamado “A cadeia do pensamento” ajuda os modelos de IA a dividir o trabalho em partes e a trabalhar através deles em lógica antes de chegar à conclusão.

Você pode ver isso com Deeseek perguntando se mentir para proteger os sentimentos de alguém ou não. Em seguida, considerará a ética kantiana, o que sugere que você deve prosseguir com as máximas que podem ser uma lei universal. Considere essas diferenças e outras pessoas antes de compartilhar a conclusão. (Descobriram que as mentiras são “aceitas em geral em uma situação em que a compaixão e a prevenção são muito importantes.

Link da fonte