Nevolus AI – Treinamento de Chatbots

Orientações sobre uso das incorporações (ou embeddings):

As Incorporações são uma técnica usada para converter textos em um formato que os chatbots entendam e usem em suas respostas, quando forem pertinentes ao assunto abordado. Tratam-se, portanto, de uma maneira de treinar os chatbots com conteúdos personalizados.

Ao usar Incorporações, você torna as interações com os chatbots mais eficazes e também economiza gastos com tokens, já que pode criar chatbots com contextos mais enxutos que serão complementados automaticamente.

Somente os chatbots com a opção “Consulta Incorporações?” ativa fazem uso das incorporações.

Veja como funciona o fluxo de uso das Incorporações:

  1. Você adiciona uma incorporação.
  2. A IA processa o conteúdo e o reescreve na sua base de conhecimentos.
  3. Quando um usuário faz uma pergunta ao chatbot, o sistema verifica se o assunto faz parte de alguma incorporação. Em caso afirmativo, o conteúdo da incorporação é somado ao contexto do chatbot, que o usará para responder.

Vale destacar que os chatbots não conhecem propriamente as incorporações. Para eles tudo faz parte do contexto (que também pode ser chamado de instruções). Isso porque, as incorporações selecionadas são anexadas ao contexto toda vez que o usuário faz uma pergunta. Segue um exemplo de como você pode referenciar as incorporações no contexto do chatbot:

Você é um assistente especializado em TI. Seu objetivo é prestar suporte técnico aos colaboradores da <EMPRESA>. Use o seu conhecimento de sistemas operacionais e aplicativos, em conjunto com as instruções abaixo, pra fornecer as respostas. Evite falar sobre outros assuntos. NÃO crie ou repasse links para o usuário, exceto os existentes neste contexto.

Outra dica importante: sempre separe as informações do contexto (instruções que o chatbot deve seguir) das incorporações (conteúdos que o chatbot pode consultar para responder ao usuário final). Se você misturar as duas coisas, por exemplo, colocando instruções para o chatbot dentro de uma incorporação, a IA vai tentar seguir estas instruções enquanto reescreve o conteúdo na sua base de conhecimentos (como se fosse um prompt) e pode processá-la de maneira incorreta. Em suma:

  • insira no contexto: informações essenciais e instruções para o chatbot;
  • insira nas incorporações: informações para o chatbot consultar dependendo da pergunta do usuário final.

O uso das incorporações para treinamento dos chatbots está disponível nos planos Starter ou superior.

Somente os chatbots com a opção “Consulta Incorporações?” ativa farão uso dos conteúdos das incorporações.

Os conteúdos que você criar no menu “Incorporações” do painel da conta serão processados automaticamente pela IA e incluídos na sua base de conhecimento. Os chatbots processam o que for cadastrado nos campos “Título”, “Conteúdo” e “Categoria”.

O processamento ocorre a cada 5 minutos e você pode acompanhar o andamento pelo menu “Incorporações” > “Status”. Nesta tela, é possível disparar o processamento manualmente e também visualizar como o conteúdo foi incorporado à base de conhecimento da IA, clicando o link “Ver”.

Quando você exclui uma incorporação, o seu conteúdo é deletado automaticamente da base de conhecimento da IA.

As incorporações devem ser redigidas de acordo com o objetivo principal das conversas, por isso, não há um formato único inidicado para o seu conteúdo.

Por exemplo, se o objetivo for passar procedimentos, é melhor usar:

1. Textos claros e concisos: organize as informações de maneira clara, usando listas numeradas e subtítulos para destacar diferentes seções. Isso facilita a extração de informações específicas.

2. Exemplos diretos: inclua exemplos diretos para cada cenário. Isso pode ajudar o modelo a aprender e inferir corretamente.

3. Destaque de informações críticas: use asteriscos para destacar informações críticas, como passos específicos.

4. Instruções passo a passo: forneça instruções passo a passo para o usuário final, bem detalhadas e precisas.

5. Comentários explicativos: inclua comentários que ajudem a IA a entender a lógica por trás das instruções.

Por outro lado, se o objetivo for falar mais genéricamente sobre determinados temas, as incorporações podem ser criadas a partir de resumos de artigos ou publicações.

Veja um exemplo de conteúdo para uma Incorporação.

Toda vez que você cadastra uma incorporação, a IA processa o seu conteúdo para incorporar na base de conhecimento dos chatbots. Para esse processamento é utilizado um prompt cadastrado no menu: “Incorporações” > “Configurações”.

Existem dois modelos de prompt de reescrita pré-cadastrados: um que faz um resumo da incorporação (opção padrão) e outro que transcreve a incorporação literalmente. Escolha o prompt de resumir quando quiser que a AI tenha uma visão geral dos conteúdos que você cadastrar (ex. notícias, briefings, conceitos gerais). Por outro lado, se você estiver cadastrando procedimentos ou manuais técnicos, o prompt de transcrever é a melhor opção. Sempre que você alterar o prompt de reescrita o sistema irá reprocessar todas as incorporações. Esse processo consome consultas na sua conta (1 consulta por incorporação processada) e gera gastos com processamento de tokens na OpenIA. Portanto, é importante que seja usado com moderação.

As Incorporações são processadas automaticamente, de 5 em 5 minutos, após a sua criação ou edição. Nesse período, elas são listadas com status “Pending” ou “Outdated” no menu “Incorporações” > “Status”. Nesta tela, é possível verificar o texto original da incorporação e o conteúdo processado pela IA para efeito de comparação e realização de ajustes.

As Incorporações são selecionadas pela IA, mas cabe a ela usá-las ou não, dependendo do tema da pergunta. Se as Incorporações estiverem bem escritas e forem relevantes, os chatbots irão utilizá-las. Por outro lado, se acharem que têm outras informações melhores, podem ignorá-las.

Devido a essa característica, a IA pode desconsiderar instruções do tipo “responda exatamente o que estiver no texto”.

Além de criar conteúdos bem estruturados para as incorporações, existem três parâmetros importantes ao seu dispor, no menu “Incorporações” > “Configurações”:

  • Pontuação mínima: corresponde ao score mínimo necessário que as incorporações precisam alcançar para serem selecionadas. A IA define uma nota de 0 a 100 com base no percentual de coincidência de termos entre a incorporação e a pergunta do usuário. Uma pontuação de corte mais elevada torna as respostas mais específicas, mas pode deixar de fora conteúdos importantes. O valor padrão é 75.
  • Quantidade de resultados: corresponde ao número máximo de incorporações a serem usadas nas respostas. Quanto maior número, mais conteúdos serão usados, aumentando a base de informações disponíveis. Para procedimentos mais precisos, recomenda-se trabalhar com valor 1. O valor padrão é 3.
  • Prompt de reescrita: define como a IA vai processar as incorporações para adicioná-las à base de conhecimentos. Os resultados das incorporações processadas são mostrados no menu: “Incorporações” > “Status”.

Se você observar que certas incorporações não estão sendo selecionadas quando deveriam, inclua uma relação determos no final do texto, ex.: PALAVRAS-CHAVE: CURSO, TREINAMENTO, FORMAÇÃO.

Lembrando: o fato das incorporações serem selecionadas, não quer dizer que serão usadas pelos chatbots pois eles sempre levarão em conta o tema da pergunta.

No painel administrativo da sua conta, o menu “Copilotos” abre uma biblioteca de assistentes de IA que ajudam na geração de conteúdo para as incorporações.. Você encontrará assistentes para análise de documentos, análise de páginas web e redação de textos.

Veja para que serve cada copiloto disponível:

  • Análise de Páginas Web: permite extrair textos de sites para geração conteúdos que podem ser usados nas incorporações.
  • Análise de Documentos: analisa documentos PDF e DOCX, facilitando a extração de informações de forma rápida e precisa.
  • Redação de Textos: usa o poder da IA para criar artigos relevantes e envolventes sobre temas de sua escolha.
  • Importação de Sites: gera incorporações automaticamente a partir das páginas existentes em um website.
  • Textos a Partir de Imagens: gera textos descritivos ou inspirados pelas imagens que você carregar.

Sim, usando o copiloto de “Importação do WordPress”, você pode importar posts ou páginas do WordPress para suas Incorporações.

Existem duas opções de importação:

1. Via arquivo XML salvo no formato WordPress Extended RSS.

Um arquivo WordPress Extended RSS (WXR) contém os posts ou páginas exportados a partir do site remoto. Para gerá-lo, entre na área administrativa do WordPress e acesse o menu: “Ferramentas” > “Exportar”. Em seguida, selecione a opção para exportar posts, páginas ou ambos, como desejar. O sistema vai baixar um arquivo XML com as informações.

Coloque o arquivo XML em uma pasta do site remoto. Por segurança, use nomes de pasta e de arquivo difíceis de alguém adivinhar, como, por exemplo: https://www.site_remoto/1agy3k8v/arquivo.xml

Após salvar o arquivo no site, acesse o link que você que você criou no seu navegador para confirmar que o download está acessível. Se o arquivo baixar normalmente, insira o mesmo link no campo “Link para o site ou arquivo XML” do formulário para fazer a importação. Se o processo for bem sucedido, as respectivas incorporações serão criadas.

2. Via REST API do site remoto em: https://www.site_remoto

Nesta modalidade, você apenas informa o endereço (URL) do site remoto no campo “Link para o site ou arquivo XML” do formulário para fazer a importação dos posts e páginas. Para que o processo funcione, é necessário que a REST API do WordPress esteja habilitada no site remoto.

Caso deseje que o sistema refaça a importação do arquivo XML ou via REST API diariamente (2x ao dia), marque essa opção no formulário.

Ao importar o conteúdo, o sistema compara os títulos com os das Incorporações. Tanto os posts/páginas novos quanto os que foram atualizados desde a última importação serão importados. Além disso, os posts que forem excluídos na origem também serão excluídos das Incorporações.

Ao final do processo, as novas Incorporações são processadas automaticamente pelo sistema.

Sim, usando os recursos de “Download” e “Importar”, disponíveis no menu Incorporações, você pode baixar ou carregar incorporações em lote:

A opção “Download” baixa um arquivo ZIP contendo as incorporações em TXT, no formato:

A opção “Importar” faz o caminho inverso, permite carregar um arquivo ZIP contendo as incorporações, desde que os arquivos TXT estejam no formato acima.

Ao final do processo, as Incorporações atualizadas são processadas automaticamente pelo sistema.

A OpenAI amplia com frequência os limites de processamento dos seus modelos computacionais, contudo, é muito importante que você otimize o tamanho dos conteúdos cadastrados nas incorporações. Isso traz dois benefícios: maior velocidade nas respostas e menor gasto com o processamento de tokens.

Por isso, recomendamos que o conteúdo de uma incorporação individual fique sempre abaixo de 16.000 tokens. Para verificar o número de tokens de determinado texto, insira-o aqui: https://platform.openai.com/tokenizer

Caso o tamanho do texto fique acima de 16.000 tokens, você pode dividi-lo em duas ou mais incorporações, ex: FAQ – Parte 1, FAQ – Parte 2, etc. Nas interações com o usuário, a IA vai usar os trechos das incorporações que melhor se relacionarem com o assunto da conversa, portanto, a divisão do texto em partes não afeta negativamente (e pode até melhorar) o resultado final.