Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo na cobertura da IA ​​da frente industrial. Saber mais


Medo de que, quando o Deepseek-R1 foi lançado pela primeira vez, a indústria abalou a indústria que poderia alcançar uma racionalidade avançada com baixa infraestrutura.

Se mudou, não é necessário. Pelo menos, de acordo com JuntoA ascensão da racionalidade de Deepseek e Open Raw tem o efeito certo: em vez de reduzir a necessidade de infraestrutura, está aumentando.

O aumento da demanda ajudou a estimular o local da IA ​​e o crescimento dos negócios. Hoje, a empresa anunciou o financiamento de US $ 305 milhões da Série B, liderada pelo Catalisador Público e pela Prosperidade 7. A IA apareceu pela primeira vez em 2023 com o objetivo de simplificar o uso da empresa de modelos de idiomas de código aberto (LLM). A empresa expandiu -se com o site Enterprise junto até 2024, que permite a classificação da IA ​​na nuvem privada virtual (VIBISI) e nos ambientes de instalações. Até 2025, juntamente com a IA, seu site foi desenvolvido com clusters racionais e habilidades de AI.

A empresa diz que possui mais de 450.000 desenvolvedores registrados em seu site de classificação de IA e a empresa aumentou seis vezes por ano. Os clientes da empresa incluem empresas iniciantes de IA, como Kriya AI, Tópicos e Laboratórios Pica.

“Agora estamos oferecendo modelos em todos os métodos: idioma e racional e imagens e áudio e vídeo”, disse Vipul Prakash Venturebette, CEO da Tucheter AI.

Deepseek-R 1 é o maior impacto da infraestrutura da IA

Por vários motivos, a maior interrupção da primeira introdução do Deepseek-R1-One é que uma vantagem de liderança pode ser construída com uma infraestrutura mais baixa do que um modelo de privacidade.

No entanto, Prakash explicou que a IA desenvolveu sua infraestrutura para ajudar a aumentar a demanda por cargas de trabalho relacionadas à Deepseek-R1.

“Este é o modelo mais caro para executar a suposição”, disse ele. “Ele contém 671 bilhões de parâmetros e você precisa distribuí -lo em vários servidores. A qualidade é alta, geralmente há uma demanda mais alta, o que significa que você precisa de mais capacidade”.

Além disso, ele observou que o Deepseek-R 1 geralmente tem demandas de longo prazo que duram dois a três minutos. A maior demanda do usuário pelo Deepseek-R1 é posteriormente bombeada para a necessidade de infraestrutura.

Para atender a essa solicitação, a IA criou um serviço juntos, que chama “clusters racionais”, para executar a habilidade dedicada de 128 a 2.000 chips, para executar os modelos em excelente desempenho.

Como a IA ajuda a usar a IA racional para empresas

Existem muitas áreas específicas que veem o uso de modelos racionais juntos. Estes são os seguintes:

  • Agentes de índice: Os modelos racionais ajudam a dividir os grandes problemas em etapas.
  • Reduza a magia: O processo racional ajuda a verificar os lançamentos das amostras, reduzindo assim a ilusão, o que é importante para as aplicações mais importantes.
  • Melhorando modelos irracionais: Os clientes drenam e melhoram a qualidade dos modelos não feitos.
  • Ative a auto -melhoria: O uso do aprendizado de reforço com modelos racionais permite que os modelos repetam o auto-aperfeiçoamento sem depender de dados com nome de humanos.

A IA Agentic também motiva a maior necessidade de infraestrutura

Os usuários da IA ​​estão adotando a IA, o aumento do requisito de infraestrutura juntos.

Prakash explicou que os agentes que terminam a solicitação única -usuário em milhares de chamadas de API para concluir uma tarefa estão colocando um alto requisito de cálculo combinando a infraestrutura de IA.

AI comprou recentemente a IA para ajudar a apoiar as cargas de trabalho da IA CoataSand Caixa. Isso permite que a IA reduza o atraso entre o código das agências e os modelos a serem chamados, o que melhora o desempenho das agências.

Nvidia Blackwell já impactou

Todos os sites de IA enfrentam uma demanda aumentada.

Essa é uma das razões pelas quais a Nvidia está criando um novo silício. O mais recente produto da NVIDIA é o Chip Blackwell GPU, que agora é usado na IA.

Prakash disse que a NVIDIA Blackwell custa 25% maior que a geração anterior dos chips, mas fornecerá desempenho 2x. O sistema operacional GB 200 com chips Blackwell é especialmente relevante para os modelos de treinamento e suposição de amostras de especialistas (MOE), que são treinadas em muitos servidores conectados a InfiniPand. Ele observou que os chips de Blackwell fornecem um ótimo incentivo de desempenho para a suposição de grandes modelos em comparação com modelos pequenos.

O cenário da concorrência do agente AI

O mercado de sites de infraestrutura de IA é rígido.

A IA está enfrentando a concorrência dos provedores de nuvem instalados e das empresas iniciantes de infraestrutura de IA. Todas as hipertells, incluindo Microsoft, AWS e Google, têm reprodução de IA. Há também uma variedade crescente de players centralizados à IA, Croc e Samba Noah, todos destinados a uma parte do mercado lucrativo.

Juntos, a IA tem uma oferta de camada completa, incluindo infraestrutura de GPU. Isso permite que os clientes construam facilmente com modelos de código aberto ou criem seus próprios modelos no sistema operacional da IA ​​juntos. A empresa se concentra nos desenvolvimentos de pesquisa e no rápido horário de operação para suposição e treinamento.

“Por exemplo, servimos o modelo Deepseek-R1 em 85 fichas por segundo. Azur o serve por 7 tokens por segundo”, disse Prakash. “Há uma lacuna muito detalhada no desempenho e custo que podemos oferecer aos nossos clientes”.


Link da fonte