Um prompt é um texto em linguagem natural que você passa para a IA generativa. A engenharia de prompts é a arte de ajustar esses prompts para se comunicar melhor com a IA generativa.
Como explica Arturo Buzzalino, diretor de inovação da Epicor, o valor da engenharia imediata reside na otimização de como a IA interpreta e responde às perguntas. Feito corretamente, isso garante que a IA produza resultados relevantes, precisos e úteis.
Em outras palavras, a engenharia imediata é o processo de projetar entradas para um modelo generativo de IA para produzir resultados valiosos.
“O que acho interessante nesse processo é que, ao longo da história das pessoas no local de trabalho, valorizamos as respostas das pessoas”, afirma Simon Morris, vice-presidente de consultoria de soluções da ServiceNow. “O mundo mudou agora, onde grandes modelos de linguagem contêm todas as respostas, e o prêmio agora está na qualidade das perguntas ou sugestões que podem ser feitas.”
Por que precisamos de engenharia imediata?
Argumentando que vivemos em um mundo de perguntas brilhantes em vez de respostas perspicazes, Morris diz que o valor da engenharia imediata é que o valor do negócio pode ser derivado de grandes modelos de linguagem (LLMs) de uma forma específica ao contexto e orientada para casos de uso.
A qualidade da resposta está diretamente ligada à qualidade do prompt, e uma engenharia de prompt eficaz é fundamental para obter valor desta tecnologia emergente, acredita Morris.
Stefan Leichenauer, vice-presidente de engenharia da SandboxAQ, afirma que a maneira como você solicita um modelo generativo de IA pode fazer uma enorme diferença na produção. Isso é o que torna a engenharia imediata uma habilidade crítica para usar os modelos GenAI de maneira eficaz.
“Em um contexto industrial, a engenharia imediata pode ajudar a alinhar o resultado da IA generativa aos casos de uso de negócios específicos que temos em mente, levando a resultados acionáveis”, disse Leichenauer.
Ramesh Parthasarathy, vice-presidente sênior de engenharia da FreshWorks, concorda. Ele diz que o valor da engenharia imediata reside na sua capacidade de refinar e maximizar o desempenho da IA, abordando as nuances dos modelos subjacentes.
“Esses modelos são treinados em grandes conjuntos de dados, portanto, pequenas alterações nos prompts podem levar a respostas significativamente diferentes”, diz Parthasarathy. Ele enfatizou que, quando bem feita, a engenharia imediata pode ajudar a superar preconceitos, melhorar a análise de dados e adaptar as respostas de IA às necessidades específicas do negócio.
Importância da engenharia imediata
Leichenauer diz que os engenheiros imediatos são especializados em maximizar a utilidade de um modelo GenAI. Sua função é ajustar as entradas da IA, levando a resultados precisos e relevantes.
“Na prática, isso significa que as ferramentas de IA podem ser aplicadas de forma mais eficaz, seja gerando insights do cliente, simplificando a criação de conteúdo ou melhorando a eficiência operacional”, explica. “Sem essas habilidades, as empresas correm o risco de obter resultados muito vagos ou confusos com seus objetivos”.
Da mesma forma, Buzzalino acredita que as empresas precisam estimular os engenheiros a preencher a lacuna entre a intenção humana e a compreensão da máquina usando GenAI. Ele explicou que, à medida que os engenheiros de alerta adaptam as interações com os modelos de IA, eles ajudam a melhorar o desempenho criando prompts que geram respostas específicas. Isto, por sua vez, melhora a eficiência, reduz erros e alinha os resultados da IA com as necessidades específicas do negócio.
Olhando de uma perspectiva técnica, disse Parthasarathy, os engenheiros imediatos visam otimizar o uso do token e os custos resultantes, bem como a resposta mais apropriada com base no contexto do problema.
Ele diz que sem as instruções corretas, os modelos de IA podem produzir respostas abaixo do ideal ou até mesmo enganosas, um fenômeno muitas vezes referido como “entra lixo, sai lixo”.
“Os Prompt Engineers podem ajudar as empresas a aproveitar todo o potencial da GenAI criando insumos alinhados com os objetivos da empresa, melhorando a eficiência e reduzindo riscos como resultados indesejados”, disse Parthasarathy.
Casos de uso imediatos de engenharia
A engenharia imediata pode ser empregada em qualquer processo onde os resultados de um sistema GenAI precisam ser otimizados, explica Parthasarathy.
Pode melhorar a capacidade da IA de realizar análises de dados, fornecer recomendações personalizadas ou abordar preconceitos em modelos. Um dos cenários mais utilizados, explicou ele, é onde o sistema GenAI está sendo usado como um ‘assistente de conteúdo’ que inclui escrever texto, traduzir idiomas, redigir e-mails, etc.
Leichenauer acredita que devemos usar engenharia imediata onde quer que tenhamos GenAI, abrindo-a para uso em todos os setores.
Por exemplo, se você acessar seu chatbot GenAI favorito e fizer uma pergunta sem qualquer contexto adicional, provavelmente obterá uma resposta razoável escrita em alguns parágrafos. Mas se você fizer a mesma pergunta com um resumo executivo no topo que contém alguns pontos importantes, você obterá um resultado apropriado para uma parte interessada sênior. Ou você pode querer detalhes técnicos de nível especializado necessários para a implementação. Leichenauer explica que cada um deles é um exemplo de engenharia rápida projetada para o leitor.
Com base nisso, Buzzalino afirma que a engenharia imediata é importante não apenas para construir agentes conversacionais de IA para atendimento ao cliente, mas também para criar conteúdo de marketing personalizado, gerar relatórios complexos e extrair insights específicos de grandes conjuntos de dados para apoiar a tomada de decisões estratégicas.
Aprofundando ainda mais, Morris disse que os agentes de suporte ao cliente podem usar prompts para encontrar soluções para os problemas dos clientes, redigir respostas de casos e resumos de casos entre agentes. Da mesma forma, o pessoal de marketing pode criar campanhas e elaborar mensagens e visões.
O que é um bom engenheiro rápido?
Morris diz que um bom engenheiro de prompts possui uma combinação de habilidades técnicas e criativas para projetar prompts eficazes. “Mais importante ainda, eles têm conhecimento de domínio dos casos de uso que estão tentando habilitar, por isso é importante que os engenheiros do Prompt também sejam ótimos treinadores e mentores para usuários corporativos regulares”, diz Morris.
Tecnicamente falando, Parthasarathy diz que um bom engenheiro de alerta sabe como guiar modelos de IA com eficiência usando técnicas inteligentes, como prompt zero e disparo múltiplo. Os disparos zero, explica ele, funcionam bem quando você pede algo novo a um modelo, enquanto os disparos múltiplos ajudam a refinar as respostas com exemplos específicos.
Ele diz que um engenheiro ágil também deve compreender os pontos fortes e as limitações dos diferentes modelos. Por exemplo, os prompts que funcionam bem para o modelo Cloud Sonnet podem não ser ideais para um modelo LLaMA, e é por isso que adaptá-los também é uma parte fundamental da introdução.
Ao mesmo tempo, um bom engenheiro alerta está ciente dos riscos, como sequestro imediato ou desbloqueio, e garante que o modelo seja usado de forma responsável e protegido contra essas ameaças.
“Do lado técnico, o equilíbrio entre precisão, latência e custo é muito importante”, diz Parthasarathy “Você quer avisos que sejam eficazes, sem sobrecarregar o sistema ou estourar o orçamento.”