Há um ano, às vezes parecia que a IA era onipresente de alguma forma, mas isso era apenas uma prévia de como a IA explodiria na vida das pessoas, para melhor ou para pior.
Seria necessária toda uma série de livros para cobrir cada atualização transformadora, lançamento chamativo e passo embaraçoso cometido pelas maiores marcas de IA: ChatGPT da OpenAI, Google Gemini e Apple Intelligence, sem falar de cada desenvolvedor de IA.
Ainda assim, é necessário ter em mente alguns destaques importantes antes de 2025 alterar novamente o cenário.
Atualização infinita do ChatGPT
É difícil falar sobre IA em 2024 sem colocar o ChatGPT no centro. A OpenAI parece determinada a permanecer no centro das atenções, lançando uma atualização revolucionária após a outra.
Em maio, o lançamento do GPT-4o, seguido pelo Leaner GPT-4o, trata da evolução multimodal do ChatGPT para lidar com texto, imagens, áudio e vídeo. O lançamento do modelo o1 em dezembro trouxe um novo nível de raciocínio, com respostas mais nítidas e perspicazes. Está provando ser uma ferramenta inestimável para tudo, desde desafios de codificação até brainstorming criativo.
O modo de voz avançado do ChatGPT traz novas interações vocais para o ChatGPT – uma variedade de vozes animadas, incluindo o Papai Noel. Se você não falar pelo aplicativo, a OpenAI até configurou uma linha direta gratuita 1-800-CHATGPT para ligar e interagir com o ChatGPT.
Os cineastas passaram grande parte do ano aguardando a chegada do Sora, o modelo de texto para vídeo da OpenAI. Embora só recentemente tenha se tornado disponível para cineastas não profissionais, a capacidade de Sora de criar vídeos animados agora está acessível para mentes criativas ou profissionais de marketing dentro de um prazo.
A colaboração criativa foi o mote para o modo Canvas do ChatGPT, que permite a colaboração em tempo real com IA, bem como a edição e o refinamento de projetos. Para manter as coisas organizadas, a OpenAI também introduziu Projetos, um recurso que agrupa conversas e arquivos em pastas organizadas. E a função expandida de pesquisa do ChatGPT ajuda a manter todas essas informações atualizadas e precisas.
Além de tudo isso, a OpenAI encerrou o ano com seu evento festivo “12 Dias de OpenAI”, com atualizações diárias como integração do WhatsApp, um novo nível ChatGPT Pro de US$ 200 por mês e um vislumbre do próximo chatbot modelo O3 que provavelmente devido a uma falha no data center da Microsoft em dezembro ajudou a desviar a atenção da interrupção de uma hora. A propagação da indignação pode não ter sido um grande PR, mas certamente destacou o quanto o ChatGPT se espalhou desde o início de 2024.
Salto do Google Gêmeos
Quando 2024 terminar, o Google Gemini nem existirá. Foi só em fevereiro que Bird se tornou Gemini, e essa reformulação da marca fez parte do esforço de um ano do Google para superar o OpenAI, integrando a IA em tudo. Um novo aplicativo Gemini para Android e um nível de assinatura Gemini Advanced imediatamente começaram a competir com o ChatGPT, e as atualizações logo se seguiram.
Em maio, o Google lançou o Gemini 1.5, uma versão atualizada com mais poder de processamento e uma janela de contexto expandida, tornando-o mais inteligente e melhor na compreensão de consultas complexas. Mas a verdadeira magia começou no verão, quando a Gemini Intelligence chegou aos dispositivos Google Home e assumiu o controle do Google Assistant em muitos outros lugares.
Isso culminou em setembro com o Gemini Live, um recurso que permite conversas de voz em tempo real com IA. A competição ChatGPT continuou com chatbots personalizados chamados Gems e, um mês depois, chegou um aplicativo para iPhone, integrando-se a outros aplicativos do Google no iOS.
O grande final veio em dezembro com o lançamento do Gemini 2.0, uma grande atualização que apresentava respostas melhores e mais rápidas, análise de fotos e muito mais. Sem mencionar que muitos recursos exclusivos para telefones Google Pixel se conectam ainda mais com o resto do ecossistema do Google.
A sabedoria da Apple finalmente amadurece
Rumores sobre os planos da Apple para IA já circulam há anos, mas 2024 finalmente viu a estreia da Apple Intelligence. A Apple fez com que a iniciativa parecesse inevitável e única na WWDC em junho.
O design era definitivamente da Apple, mas havia uma integração significativa com os modelos de IA existentes. Em particular, a Apple permitirá que seu renovado assistente de voz Siri se apoie no ChatGPT para obter respostas e várias perguntas. Ainda estamos aguardando a capacidade prometida da Siri de ver, compreender e executar tarefas em aplicativos
Mesmo com marcas diferentes, as ferramentas de IA da Apple parecem destinadas principalmente a igualar ou superar os recursos disponíveis na OpenAI e no Google. Por exemplo, o Apple Intelligence capacita o criador de imagens Image Playground, bem como o Genmoji, que permite criar seu próprio emoji.
Talvez o aspecto mais distintivo seja como a Apple Intelligence usa a maior parte do hardware Apple para executar processos de IA localmente ou em seus servidores de computação em nuvem privada ultra-seguros. Dessa forma, o Apple Intelligence pode trabalhar mais rápido e prometer mais privacidade.
Embora a OpenAI dominasse as manchetes do Google e da Apple, a IA foi muito mais influente para outras grandes marcas. A Meta, por exemplo, lançou o assistente virtual Meta AI, incorporando-o no Facebook, Instagram e WhatsApp, atualizando e expandindo suas capacidades (incluindo vozes de algumas celebridades) ao longo do ano. Meta configurou o próximo ano para ser o ano dos óculos inteligentes de IA, incorporando Meta AI em fones de ouvido Meta Quest, bem como em óculos inteligentes Meta Ray-Ban. Ah, e quem poderia esquecer a inauguração do protótipo dos óculos de realidade aumentada Orion?
No entanto, nem todas as peças de hardware de IA se saíram tão bem este ano. O hype em torno do Rabbit R1, um pequeno dispositivo focado em IA, e wearables como o Human AI Pin e o Plod NotePin eram altos quando o ano começou, mas desde então desapareceram rapidamente e se tornaram apenas produtos de nicho de sucesso.
Se 2024 prova alguma coisa, é que a inteligência artificial ultrapassou oficialmente a sua nova e brilhante fase tecnológica e invadiu as nossas vidas como uma revolução de desenvolvimento completa. ChatGPT, Gemini, Apple Intelligence e seus concorrentes mostraram como as ferramentas de IA podem brilhar e até ser verdadeiramente eficazes quando usadas da maneira certa.
Isso não quer dizer que 2025 não ficará isento de erros e erros, mas certamente sugere que se tornará uma parte padrão de muitas atividades digitais em algum nível, tentando ter uma noite de jogos com amigos, entreter e educar. Crianças, ou organize nossos planos de refeições e culinária. Este ano mostrou o que a IA pode fazer; No próximo ano, a questão será: o que realmente queremos que a IA faça por nós?