Visão geral do Espaço de trabalho de ciência de dados

NOTE
O Data Science Workspace não está mais disponível para compra.
Esta documentação destina-se aos clientes existentes com direitos anteriores ao Data Science Workspace.

O Adobe Experience Platform Data Science Workspace usa aprendizado de máquina e inteligência artificial para liberar insights de seus dados. Integrado ao Adobe Experience Platform, o Data Science Workspace ajuda você a fazer previsões usando seus ativos de conteúdo e dados nas soluções Adobe.

Os cientistas de dados de todos os níveis de habilidade encontrarão ferramentas sofisticadas e fáceis de usar que oferecem suporte ao rápido desenvolvimento, treinamento e ajuste de receitas de aprendizado de máquina - todos os benefícios da tecnologia de IA, sem a complexidade.

Com o Data Science Workspace, os cientistas de dados podem criar facilmente APIs de serviços inteligentes, viabilizadas pelo aprendizado de máquina. Esses serviços funcionam com outros serviços da Adobe, incluindo o Adobe Target e o Adobe Analytics Cloud, para ajudar você a automatizar experiências digitais personalizadas e direcionadas em aplicativos da Web, da área de trabalho e móveis.

Este guia fornece uma visão geral dos principais conceitos relacionados ao Data Science Workspace.

Introdução

As empresas atuais dão alta prioridade à mineração de big data para previsões e insights que as ajudarão a personalizar as experiências dos clientes e a agregar mais valor aos clientes - e aos negócios.
Mesmo sendo importante, a obtenção de dados para insights pode ter um custo alto. Normalmente, ela requer cientistas de dados qualificados que realizam pesquisas de dados intensivas e demoradas para desenvolver modelos ou receitas de aprendizado de máquina que alimentam os serviços inteligentes. O processo é longo, a tecnologia é complexa e cientistas de dados qualificados podem ser difíceis de encontrar.

Com o Data Science Workspace, o Adobe Experience Platform permite que você ofereça IA com foco em experiência em toda a empresa, simplificando e acelerando a integração de dados e insights no código com:

  • Uma estrutura de aprendizado de máquina e tempo de execução
  • Acesso integrado aos dados armazenados no Adobe Experience Platform
  • Um esquema de dados unificado criado em Experience Data Model (XDM)
  • A potência computacional essencial para o aprendizado de máquina/IA e o gerenciamento de grandes conjuntos de dados
  • Receitas de aprendizado de máquina pré-criadas para acelerar o salto para experiências orientadas por IA
  • Criação, reutilização e modificação simplificadas de receitas para cientistas de dados de vários níveis de habilidade
  • Publicação e compartilhamento inteligentes de serviços com apenas alguns cliques, sem um desenvolvedor, e monitoramento e novo treinamento para otimização contínua de experiências personalizadas do cliente

Cientistas de dados de todos os níveis de habilidade obterão insights mais rapidamente e experiências digitais mais eficazes.

Introdução

Antes de entrar nos detalhes do Data Science Workspace, veja um breve resumo dos termos principais:

Termo
Definição
Data Science Workspace
O Data Science Workspace no Experience Platform permite que os clientes criem modelos de aprendizado de máquina que utilizam dados no Experience Platform e soluções Adobe para gerar insights e previsões inteligentes para unir experiências digitais atraentes do usuário final.
Inteligência artificial
Inteligência artificial é uma teoria e desenvolvimento de sistemas computacionais que são capazes de executar tarefas que normalmente exigem inteligência humana, como percepção visual, reconhecimento de fala, tomada de decisão e tradução entre línguas.
Aprendizado de Máquina
O aprendizado de máquina é o campo de estudo que permite aos computadores a capacidade de aprender sem ser explicitamente programado.
Sensei ML Framework
A Estrutura ML do Sensei é uma estrutura unificada de aprendizado de máquina do Adobe que aproveita os dados do Experience Platform para capacitar cientistas de dados no desenvolvimento de serviços de inteligência orientados por aprendizado de máquina de maneira mais rápida, escalonável e reutilizável.
Experience Data Model
O Experience Data Model (XDM) é o esforço de padronização liderado pelo Adobe para definir esquemas padrão como Profile e ExperienceEvent, para o Gerenciamento de Experiência do Cliente.
JupyterLab
JupyterLab é uma interface baseada na Web de código aberto para o Projeto Jupyter e está totalmente integrada ao Experience Platform.
Fórmulas
Um fórmula é o termo de Adobe Systems para uma especificação de modelo e é um container de nível superior que representa uma aprendizagem de máquina específica, algoritmo de IA ou conjunto de algoritmos, lógica de processamento e configuração necessária para build e executar um modelo treinado e, portanto, ajudar a resolver problemas específicos de negócios.
Modelo
Um modelo é uma instância de uma fórmula de aprendizado de máquina treinada com dados históricos e configurações para resolver em um caso de uso comercial.
Treinamento
Treinamento é o processo de padrões de aprendizado e insights de dados rotulados.
Modelo treinado
Um modelo treinado representa a saída executável de um processo de treinamento de modelo, no qual um conjunto de dados de treinamento foi aplicado à instância do modelo. Um modelo treinado manterá uma referência a qualquer serviço inteligente da Web criado a partir dele. O modelo treinado é adequado para pontuar e criar um serviço web inteligente. As modificações em um modelo treinado podem ser rastreadas como uma nova versão.
Pontuação
A pontuação é o processo de gerar insights dos dados usando um modelo treinado.
Serviço
Um serviço implantado expõe a funcionalidade de uma inteligência artificial, de um modelo de aprendizado de máquina ou de um algoritmo avançado por meio de uma API, para que possa ser consumido por outros serviços ou aplicativos para criar aplicativos inteligentes.

O gráfico a seguir descreve a relação hierárquica entre Receitas, Modelos, Execuções de Treinamento e Execuções de Pontuação.

Noções básicas do Data Science Workspace

Com o Data Science Workspace, seus cientistas de dados podem simplificar o complicado processo de descoberta de insights em grandes conjuntos de dados. Criado com base em uma estrutura comum de aprendizado de máquina e tempo de execução, o Data Science Workspace fornece gerenciamento avançado de fluxo de trabalho, gerenciamento de modelos e escalabilidade. Os serviços inteligentes suportam a reutilização de receitas de aprendizado de máquina para potencializar uma variedade de aplicativos criados com produtos e soluções Adobe.

Acesso a dados de uma parada

Os dados são a pedra angular da IA e da aprendizagem de máquina.

Data Science Workspace é totalmente integrado ao Adobe Experience Platform, incluindo o Data Lake, Real-Time Customer Profilee Unified Edge. Explore todos os seus dados organizacionais armazenados em Adobe Experience Platform de uma só vez, juntamente com big data e bibliotecas de deep learning comuns, como Spark ML e TensorFlow. Se não encontrar o que precisa, assimilar seus próprios conjuntos de dados usando a schema padronizada XDM.

Receitas de aprendizado de máquina previamente construídas

O Data Science Workspace inclui receitas de aprendizado de máquina pré-criadas para necessidades comerciais comuns, como previsão de vendas de varejo e detecção de anomalias, para que cientistas e desenvolvedores de dados não precisem começar do zero. Atualmente três receitas são oferecidas, previsão de compra de produtos, recomendações de produtos e vendas de varejo.

Se preferir, você poderá adaptar uma fórmula pré- criada às suas necessidades, importar uma fórmula ou começar do zero para criar uma fórmula personalizada. No entanto, você começa, depois de treinar e hiperajustar uma fórmula, criar um serviço inteligente personalizado não requer um desenvolvedor, apenas alguns cliques e você está pronto para criar uma experiência digital direcionada e personalizada.

Fluxo de trabalho focado no cientista de dados

Seja qual for o seu nível de conhecimento sobre ciência de dados, o Data Science Workspace ajuda a simplificar e acelerar o processo de busca de insights sobre dados e sua aplicação a experiências digitais.

Exploração de dados

Encontrar os dados certos e prepará-los é a parte mais trabalhosa para criar uma fórmula eficaz. O Data Science Workspace e o Adobe Experience Platform ajudarão você a passar dos dados para os insights mais rapidamente.

No Adobe Experience Platform, os dados entre canais são centralizados e armazenados no esquema padronizado do XDM, de modo que os dados são mais fáceis de encontrar, entender e limpar. Um único armazenamento de dados com base em um esquema comum pode economizar inúmeras horas de exploração e preparação de dados.

Enquanto você navega, use R, Python ou Scala com o Jupyter Notebook hospedado e integrado para navegar pelo catálogo de dados em Platform. Usando uma dessas linguagens, você também pode aproveitar Spark ML e TensorFlow. Comece do zero ou use um dos modelos de bloco de anotações fornecidos para problemas comerciais específicos.

Como parte do fluxo de trabalho de exploração de dados, você também pode assimilar novos dados ou usar recursos existentes para ajudar na preparação dos dados.

Criação

Com Data Science Workspace, você decide como deseja criar receitas.

  • Economize tempo procurando uma fórmula pré-criada que atenda às suas necessidades comerciais, que você pode usar como está ou configurar para atender aos seus requisitos específicos.
  • Crie uma fórmula do zero, usando o tempo de execução de criação no Jupyter Notebook para desenvolver e registrar a fórmula.
  • Carregue uma fórmula criada fora do Adobe Experience Platform para Data Science Workspace ou importe o código da fórmula de um repositório, como Git, usando a autenticação e a integração disponíveis entre Git e Data Science Workspace.

Experimentação

O Data Science Workspace oferece tremenda flexibilidade ao processo de experimentação. Comece com sua fórmula. Em seguida, crie uma instância separada, usando o mesmo algoritmo principal combinado com características exclusivas, como parâmetros de hiperajuste. Você pode criar quantas instâncias forem necessárias, treinando e pontuando cada instância quantas vezes desejar. À medida que você os treina, o Data Science Workspace rastreia receitas, instâncias de receitas e instâncias treinadas, além de métricas de avaliação, para que você não precise fazê-lo.

Operacional

Quando estiver satisfeito com a sua receita, basta alguns cliques para criar um serviço inteligente. Nenhuma codificação necessária - você mesmo pode fazer isso sem inscrever um desenvolvedor ou engenheiro. Por fim, publique o serviço inteligente no Adobe IO e ele estará pronto para ser consumido pela sua equipe de experiência digital.

Aprimoramento contínuo

Data Science Workspace rastreia onde os serviços inteligentes são chamados e o desempenho. À medida que os dados rolam, você pode avaliar a precisão do serviço inteligente para fechar o loop e retreinar as receitas conforme necessário para melhorar o desempenho. O resultado é um refinamento contínuo na precisão do personalização do cliente.

Acesso a novos recursos e conjuntos de dados

Os cientistas de dados podem aproveitar as novas tecnologias e conjuntos de dados assim que estiverem disponíveis pelos serviços da Adobe. Por meio de atualizações frequentes, fazemos o trabalho de integrar conjuntos de dados e tecnologias à plataforma, para que você não precise fazê-lo.

Segurança e tranquilidade

Proteger seus dados é a principal prioridade do Adobe. O Adobe protege seus dados com processos e controles de segurança desenvolvidos para ajudar a cumprir os padrões, regulamentos e certificações aceitos pelo setor.

A segurança é integrada ao software e aos serviços como parte do ciclo de vida seguro do produto Adobe.
Para saber mais sobre segurança de dados e software de Adobe, conformidade e muito mais, visite a página de segurança em https://www.adobe.com/security.html.

Data Science Workspace em ação

As previsões e insights fornecem as informações necessárias para fornecer uma experiência altamente personalizada a cada cliente que visita seu site, entra em contato com sua central de atendimento ou participa de outras experiências digitais. Veja como o seu trabalho diário acontece com o Data Science Workspace.

Definir o problema

Tudo começa com um problema nos negócios. Por exemplo, uma central de atendimento online precisa de contexto para ajudá-la a tornar positivo um sentimento negativo do cliente.

Há muitos dados sobre o cliente. Eles navegaram pelo site, colocaram itens em suas carrinho e até fizeram pedidos. Eles podem ter recebido e-mails, usados cupons ou contatados o central de atendimento anteriormente. A fórmula, então, precisa usar os dados disponíveis sobre o cliente e suas atividades para determinar a propensão para comprar e recomendar uma oferta que o cliente provavelmente apreciará e usará.

No momento do contato com o central de atendimento, o cliente ainda tem dois pares de sapatos na carrinho, mas removeu uma camisa. Com essas informações, o serviço inteligente pode recomendar que o agente central de atendimento oferta um cupom de 20% de desconto nos sapatos durante a chamada. Se o cliente usar a cupom, essas informações serão adicionadas ao conjunto de dados e as previsões se tornam ainda melhores na próxima vez que o cliente chamar.

Explorar e preparar os dados

Com base no problema definido, você sabe que a fórmula deve analisar todas as transações da Web do cliente, incluindo visitas ao site, pesquisas, página exibições, links clicados, carrinho ações, ofertas recebidas, emails recebidos, interações central de atendimento etc.

Um cientista de dados normalmente gasta até 75% do tempo necessário para criar uma fórmula explorando e transformando os dados. Os dados geralmente vêm de vários repositórios e são salvos em esquemas diferentes - eles devem ser combinados e mapeados antes de serem usados para criar uma fórmula.

Se você estiver começando do zero ou configurando uma fórmula existente, inicie sua pesquisa de dados em um catálogo de dados centralizado e padronizado para sua organização, o que simplifica consideravelmente a busca. Você pode até descobrir que outro cientista de dados em sua organização já identificou um conjunto de dados semelhante e optar por ajustar esse conjunto de dados em vez de começar do zero.
Todos os dados no Adobe Experience Platform estão em conformidade com um esquema XDM padronizado, eliminando a necessidade de criar um modelo complexo para unir dados ou obter ajuda de um engenheiro de dados.

Se você não encontrar imediatamente os dados necessários, mas eles existirem fora do Adobe Experience Platform, é uma tarefa relativamente simples assimilar conjuntos de dados adicionais, que também se transformarão no esquema XDM padronizado.
Você pode usar o Jupyter Notebook para simplificar o pré-processamento de dados - possivelmente começando com um modelo de bloco de anotações ou um bloco de anotações usado anteriormente para a propensão à compra.

Criar a fórmula

Se você já encontrou uma fórmula que atende a todas as suas necessidades, poderá seguir para a experimentação. Ou você pode modificar um pouco a fórmula ou criar uma do zero, aproveitando o tempo de execução de criação do Data Science Workspace em Jupyter Notebook. O uso do tempo de execução de criação garante que você possa usar o fluxo de trabalho de treinamento e pontuação do Data Science Workspace e converter a fórmula mais tarde para que ela possa ser armazenada e reutilizada por outras pessoas em sua organização.

Você também pode importar uma fórmula no para Data Science Workspace e aproveitar os fluxos de trabalho de experimentação ao criar seu serviço inteligente.

Experimentar com a fórmula

Com uma fórmula que incorpora seus principais algoritmos de aprendizado de máquina, muitas fórmula instâncias podem ser criadas com um único fórmula. Essas instâncias fórmula são conhecidas como modelos. Um modelo requer treinamento e avaliação para otimizar sua eficiência operacional e eficácia, um processo tipicamente que consiste em tentativa e erro.

À medida que treina seus modelos, treinamento são geradas corridas e avaliações. Data Science Workspace mantém faixa de métricas de avaliação para cada modelo exclusivo e suas treinamento são executadas. As métricas de avaliação geradas por meio de experiências permitirão determinar as treinamento execução com melhor desempenho.

Visite o tutorial da API ou da interface sobre como treinar e avaliar modelos no Data Science Workspace.

Operacionalizar o modelo

Após selecionar a fórmula mais bem treinada para atender às suas necessidades comerciais, você poderá criar um serviço inteligente no Data Science Workspace sem a assistência do desenvolvedor. São apenas alguns cliques - não é necessário codificar. Um serviço inteligente publicado pode ser acessado por outros membros da organização sem a necessidade de recriar o modelo.

Um serviço inteligente publicado pode ser configurado para se treinar automaticamente de tempos em tempos usando novos dados à medida que eles se tornam disponíveis. Isso garante que o serviço mantenha a eficiência e a eficácia com o passar do tempo.

Próximas etapas

O Data Science Workspace ajuda a simplificar o fluxo de trabalho da ciência de dados, desde a coleta de dados até algoritmos e serviços inteligentes para cientistas de dados de todos os níveis de habilidade. Com as ferramentas sofisticadas que o Data Science Workspace oferece, você pode reduzir significativamente o tempo dos dados para os insights.

Mais importante ainda, o Data Science Workspace coloca os recursos de ciência de dados e otimização algorítmica da plataforma de marketing líder do Adobe nas mãos dos cientistas de dados corporativos. Pela primeira vez, as empresas podem trazer algoritmos proprietários para a plataforma, aproveitando os poderosos recursos de aprendizado de máquina e IA do Adobe para fornecer experiências do cliente altamente personalizadas em escala maciça.

Com o casamento da experiência em marcas e a capacidade de aprendizagem de máquina e IA da Adobe, as empresas têm o poder de impulsionar mais valor comercial e fidelidade à marca, dando aos clientes o que eles querem, antes que eles peçam.

Para obter informações adicionais, como um fluxo de trabalho diário completo, comece lendo a documentação de apresentação do Data Science Workspace.

Recursos adicionais

O vídeo a seguir foi criado para ajudá-lo a entender o Data Science Workspace.

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9