Opções de árvore de decisão

IMPORTANTE

Leia mais sobre Datas Workbench Anúncio do fim da vida útil.

O menu Árvore de decisão inclui recursos para definir o caso de uso positivo, filtros, opções de distribuição de folhas, matriz de confusão e outras opções avançadas.

Botões da barra de ferramentas Descrição
Ir Clique em para executar o algoritmo da árvore de decisão e exibir a visualização. Essa opção fica esmaecida até que haja entradas.
Redefinir Apaga entradas e o modelo da árvore de decisão e redefine o processo.
Salvar Salvar a árvore de decisão. É possível salvar a Árvore de decisão em diferentes formatos:
  • Linguagem de marcação preditiva (PMML), um formato de arquivo baseado em XML usado por aplicativos para descrever e trocar modelos de árvore de decisão.
  • Texto exibição de colunas e linhas simples de true ou false, porcentagens, número de membros e valores de entrada.
  • A Dimension com ramificações correspondentes a elementos de resultado previstos.
Opções Consulte a tabela abaixo para ver o menu Opções .
Menu Opções Descrição
Definir Maiúsculas/Minúsculas Positivas Define a seleção do espaço de trabalho atual como o Caso Positivo do modelo. Apaga as letras maiúsculas e minúsculas se não houver nenhuma seleção.
Definir filtro de população Define a seleção do espaço de trabalho atual como o Filtro de população do modelo e será proveniente de visitantes que atendem a essa condição. O padrão é "Todos".
Mostrar descrição de filtro complexo Exibe descrições dos filtros definidos. Clique em para exibir os scripts de filtragem para Caso positivo e Filtro de população.
Ocultar nós Oculta nós com apenas uma pequena porcentagem da população. Esse comando de menu é exibido somente quando a árvore de decisão é exibida.
Matriz de Confusão

Clique em Opções > Matriz de Confusão para visualizar os valores de Precisão, Recall, Precisão e Pontuação F. Quanto mais próximo de 100 por cento, melhor a pontuação.

A Matriz de Confusão fornece quatro contagens de precisão do modelo usando uma combinação de valores:

  • Positivo Real (AP)
  • Positivo previsto (PP)
  • Negativo Real (AN)
  • Previsto Negativo (PN)

Dica: Esses números são obtidos pela aplicação do modelo de pontuação resultante dos dados de 20% de testes retidos e já conhecidos como a verdadeira resposta. Se a pontuação for maior que 50%, é previsto como um caso positivo (que corresponde ao filtro definido). Em seguida, Precisão = (TP + TN)/(TP + FP + TN + FN), Recall = TP / (TP + FN) e Precision = TP / (TP + FP).

Exibir Legenda Permite ativar e desativar uma chave de legenda na Árvore de decisão. Esse comando de menu é exibido somente quando a árvore de decisão é exibida.
Avançado Clique para abrir o menu Avançado para um uso detalhado da Árvore de decisão. Consulte a tabela abaixo para ver as opções de menu.
Menu avançado Descrição
Tamanho do Conjunto de Treinamento

Controla o tamanho do conjunto de treinamento usado para o edifício do modelo. Conjuntos maiores levam mais tempo para treinar, conjuntos menores levam menos tempo.

Normalização de entrada

Permite que o usuário especifique se deseja usar a técnica Min-Max ou a Pontuação Z para normalizar entradas no modelo.

Fator de sobreamostragem SMOTE Quando o caso positivo não ocorre com muita frequência (menos de 10%) na amostra de treinamento, o SMOTE é usado para fornecer amostras adicionais. Essa opção permite que o usuário indique quantas mais amostras serão criadas usando o SMOTE.
Limite de Distribuição de Classe Folha Permite definir o limite assumido para uma folha durante o processo de criação da árvore. Por padrão, todos os membros de um nó devem ser idênticos para que seja uma folha (antes do estágio de poda).

Nesta página