As ondas de choque estão transmitindo ondas de choque pelo mercado de ações, o Vale do Silício falou de gigantes e uma inteligência artificial está progredindo no fim do domínio técnico americano que vem com um título contínuo e piscadela: “A lógica para incentivar o LLMS é através do fortalecimento da educação. “

O Papel de 22 páginasNa semana passada, um scrapy chamado DePSec foi publicado pela start-up da IA ​​chinesa, não desligou imediatamente os alarmes. Os pesquisadores levaram alguns dias para digerir reivindicações de papel e digerir os efeitos descritos. A empresa criou um novo modelo de IA chamado DePSEC-R 1, construído por uma equipe de pesquisadores que alegaram que um pequeno número de chips de AI de segunda categoria foi usado para corresponder ao desempenho dos principais modelos americanos de IA dos modelos americanos de IA.

A DIPSEC disse que a computação bruta fez isso usando engenharia inteligente para alternativas de cavalos de potência. E fez isso na China, um país que muitos especialistas pensavam que a IA global fugiu em segundo lugar.

Alguns observadores industriais responderam inicialmente ao descrente do diplã com descrença. Obviamente, eles pensaram que o depósito havia traído em alcançar os resultados do R1 ou espalhar seu modelo mais impressionante do que o modelo. Talvez o governo chinês esteja promovendo a narrativa americana de dominação da IA. Pode ter Dipsek Nvidia inválida hlees um estoque de 100 chipsA exportação dos EUA é proibida sob controle e mentindo sobre isso. Talvez o R1 tenha realmente um recorde fofo de modelos de IA americanos que não representaram muito em termos de progresso real.

Finalmente, como mais pessoas escavaram os detalhes do DePSEC-R 1-o que foi publicado como software de código aberto, oposto à maioria dos principais modelos de IA, permitindo que os estrangeiros testassem seus trabalhos internos mais de perto a suspeita de ansiedade preocupante.

E até o final da semana passada, quando muitos americanos começaram a usar os modelos Diplosh para si e a Apple Mobile Apple atingiu a App Store da App App na App Store na App Store, ficou totalmente aterrorizada.

Estou cético em relação à aceitação mais dramática que já vi nos últimos dias – como reivindicações, feitos Um investidor do Vale do SilícioIsso é um enredo amplo do governo chinês para destruir a indústria de tecnologia americana. Eu também acho que é louvável que o orçamento da empresa tenha sido gravemente exagerado, ou as empresas americanas de IA tenham se inclinado sobre o progresso da maneira como não foram libertadas.

No entanto, acho que o avanço do DIPSC foi real. Com base na minha conversa com o interno da indústria, e os valiosos especialistas de uma semana estão circulando e experimentando pesquisas em papel, parece ter questionado várias estimativas importantes na indústria de tecnologia americana.

O primeiro é a ideia de que você precisa gastar muito dinheiro em fichas e data centers fortes para criar modelos de IA de corte de corte.

É difícil aumentar o quão básico esse cão se tornou. Empresas como Microsoft, Meta e Google já gastaram alguns bilhões de dólares que acharam que a próxima geração havia criado e operado infraestrutura para fabricar e gerenciar a próxima geração. Eles planejam gastar vários bilhões de bilhões no Openais – cerca de US $ 500 bilhões por meio de uma joint venture com a Oracle e o Softbank anunciados na semana passada.

Dipsec parece ter passado uma pequena fração daquele edifício. Não sabemos a despesa certa e temos Alerta Eles ainda são sobre as estatísticas publicadas até agora. Isso é quase mais de 5,5 milhões, a empresa afirmou que treinou um modelo anterior.

Mesmo que o R1 DeptSec gaste 10 vezes mais em treinamento do que as reivindicações do R1 Depsec, e mesmo se você levar em consideração outras despesas, elas são excluídas, como o custo de fazer o pagamento de engenheiro ou pesquisas básicas, ainda pode ser menor do que americano Ai para encomendar as empresas que gastam os modelos mais capazes a se desenvolver.

A clara conclusão do desenho não é que os gigantes da tecnologia americana estejam desperdiçando seu dinheiro. Os modelos de IA fortes ainda são caros se treinados ainda forem caros, e há uma razão para pensar que o custo de várias centenas de dólares ainda será significativo para empresas como OpenAI e Google, que podem pagar muito para pagar pela cabeça estar na cabeça

No entanto, o progresso do DIPC em desafios caros desafiou a narrativa “melhor” nos últimos anos de que modelos relativamente pequenos poderiam corresponder ou exceder o desempenho do modelo maior quando treinados corretamente.

Em vez disso, isso significa que as empresas de IA podem obter um poder muito mais forte ao investir muito menos que os pensamentos anteriores. E isso sugere que em breve veremos as inundações de investimento em pequenas startups de IA e muitas outras competições para os Giants no Vale do Silício. (O que, porque seus modelos são muitas despesas para treinamento, agora estão competindo entre si)))

Outros, existem razões mais técnicas que todos no Vale do Silício estão prestando atenção aos DEPs. Na pesquisa de pesquisa, a empresa revela alguns detalhes sobre como a empresa foi realmente criada, incluindo algumas técnicas de ponta nas peças do modelo. (Originalmente, significa comprimir grandes modelos de IA nos menores, tornando -os baratos para correr não muito na forma de performance))))))))))))))))))))))))))))))))

Depsec também inclui detalhes Proposto Anteriormente, não era tão difícil quanto pensar no modelo de linguagem AI “baunilha” como um modelo de argumento mais sofisticado, aplicando uma técnica conhecida como reforço de aprendizado no topo. (Estes termos estão no topo da sua cabeça, se você não se preocupar – os métodos de melhoria dos sistemas de IA mantidos anteriormente pelas empresas americanas de tecnologia estão agora na web, gratuitamente para aceitar e fazer transcrição)

Mesmo que os preços das ações dos gigantes da tecnologia americana sejam restaurados nos próximos dias, o sucesso do DIPSC levanta questões importantes sobre suas estratégias de IA de longo prazo. Se uma empresa chinesa puder criar modelos de código aberto, se uma empresa chinesa puder corresponder ao desempenho de modelos americanos caros, por que alguém pagaria por nós? E se você é uma meta-o único monstro de tecnologia dos EUA que seus modelos revelam como software de código aberto gratuito-que Dipsek ou qualquer outra inicial interrompem seus modelos que você gastou bilhões de dólares e os torna modelos menores e baratos que eles Poderia oferecer centavos?

Os diplomanos também reduzem algumas das estimativas geográficas que muitos especialistas americanos criaram sobre a posição da China na corrida de IA.

Primeiro, desafia os detalhes de que a China está significativamente atrás da fronteira, quando se trata de criar modelos fortes de IA. Ao longo dos anos, muitos especialistas da IA ​​(e formuladores de políticas que os ouvem) assumiram que os Estados Unidos tinham pelo menos vários anos de liderança e o progresso feito pelas empresas de tecnologia americana era proibido para as empresas chinesas serem banidas.

No entanto, os resultados dos DIPSS mostram que a China melhorou a capacidade de IA que pode corresponder ou exceder o modelo do OpenAI e de outras empresas e avanços americanas feitas por empresas americanas podem ser trivialmente fáceis para as empresas chinesas – ou, para fazer pelo menos uma empresa chinesa – Para criar uma transcrição, pode -se dentro de algumas semanas.

(O New York Times processou a Microsoft e seu parceiro Microsoft, acusando -os de violação de direitos autorais de conteúdo de notícias no sistema de IA. OpenAI e Microsoft negaram essas demandas.)

Os resultados que o governo dos EUA está tomando para restringir a expansão do forte sistema de IA entre nossos oponentes também aumenta os resultados – a saber, os controles de exportação usados ​​para prevenir a China na China ou estão trabalhando em maneiras novas e mais qualificadas de treinamento se devem se adaptar para levar em consideração.

E, é claro, se a China leva a criar um forte sistema de IA usado por milhões de americanos, há preocupação com o que isso significa para privacidade e censura. Os usuários dos modelos DIPSC notaram que se recusam regularmente a responder a perguntas sobre questões sensíveis na China, como o genocídio da Tiananmen Square e os acampamentos presos dos uheth. Se outros desenvolvedores fizeram no topo dos modelos dípicos, como software de código aberto, esses sistemas de censura podem ser incorporados em todo o setor.

Especialistas em privacidade também são Ansiedade aumentada Sobre o fato de que o governo chinês compartilhado com os modelos DePSEC pode estar acessível ao governo chinês. Se você estiver preocupado em usar os ingressos como materiais de vigilância e promoção, também deve se preocupar com a ascensão do dipsico.

Não tenho certeza ainda AlegarO

Mas agora pensamos que seria aconselhável assumir a possibilidade de que a possibilidade de Ai BringShip esteja agora em uma nova era – as maiores e ricas empresas de tecnologia americana não podiam mais vencer, e os crescentes sistemas de IA fortes podem ser mais difíceis.

Pelo menos, o DIPSEC mostrou que a corrida de armas da AI está realmente acontecendo e, depois de vários anos de caos, a loja tem mais surpresas.

Link da fonte