数据处理组件 data-processing-components
数据处理组件包括Hadoop、Snowflake、SOLR和Tableau。
Audience Manager使用以下组件来处理数据:
hadoop hadoop
在Audience Manager中,Hadoop是包含Audience Manager所知道的关于用户的所有内容的主数据库。 例如,当配置文件缓存服务器创建包含用户数据的日志文件时,它会将该数据发送到Hadoop进行存储。 其他重要的Hadoop元素包括:
-
配置单元: Hadoop的数据仓库。 Hive管理对存储在Hadoop中的数据进行的特别查询。
-
HBase: 非常大的Hadoop数据库。 它处理和管理入站和出站数据、特征规则、算法建模信息,并执行许多与将数据存储和移动到不同系统相关的其他功能。
客户无法直接访问这些系统。 但是,客户确实会间接使用这些组件,因为这些组件存储有关其网站访客的重要数据。
Snowflake snowflake
Snowflake是一个大型云数据库。 它向许多面板图形及其相关文本框提供数据,这些文本框显示图形中每个项目的%变化。 如果您使用Audience Manager并查看仪表板报告,则表示您正在与Snowflake提供的数据进行交互。
这绝不是全面的列表,但Snowflake负责的一些常见信息板报告包括:
SOLR solr
SOLR是来自Apache的开源数据库和服务器系统。 它提供了针对我们大型数据集的强大而快速的搜索功能。 作为Audience Manager客户,您可以在生成区段时看到SOLR正在起作用。 它向Estimated Historic Segment Size报表提供数据。 由于其速度,SOLR非常适合于此角色。 例如,在您构建规则并向区段添加新特征时,SOLR能够更新历史大小数据。
表格 tableau
Audience Manager使用Tableau显示交互式报表和Audience Optimization报表中的数据。 交互式报表显示特征和区段的性能和重叠数据。 它们不使用按列和行排列的数字,而是使用不同的形状、颜色和大小返回数据。 此外,您可以选择单个数据点或数据点组,并深入查看报告结果以了解更多详细信息。 这些可视化技术和报表交互性有助于使大量数字数据更易于理解。