配置数据仓库设置

目前,仅支持PostgreSQL 9.4或更高版本的数据库作为仓库目标。

您可以配置安全控制台以将数据导出到外部数据仓库。您可以使用此特性获取更丰富的数据集,以便与您自己的内部报告系统(如Business Intelligence工具)集成。导出使用维度模型将提取、转换和加载(ETL)流程执行到目标仓库。

您可以查看此模型的模式在这里

调度

到外部仓库的ETL过程的频率应该根据您的报告需求进行配置。导出的频率与使用历史事实表进行趋势分析的数据点的粒度相匹配。由于可以导出的数据量很大,入库过程可能需要一些时间才能完成。建议的时间表设置为每1周。应该小心地在非关键扫描窗口期间安排此导出,以最小化影响。

配置

数据仓库可以由全局管理员配置。在配置安全控制台设置之前,请确保已配置目标仓库数据库服务器(有关详细信息,请参见部署和配置仓库)。要配置数据仓库导出设置,请执行以下操作:

  1. 点击管理旁边数据仓库政府
  2. 在上输入数据库服务器设置数据库
    • 使出口-指示当前是否启用导出。
    • 数据模型—指定要使用的仓库模式类型。建议和遗产模型是弃用。
    • 服务器地址-目标仓库的IP或主机名。
    • 服务器端口—目标仓库的端口正在接受外部连接。
    • 数据库名称-要导出到模型的数据库的名称。
    • 用户/密码—执行导出操作的用户的凭据。该用户必须对数据库有写访问权限。
    • 加密传输中的数据-如果启用,将在ETL过程中使用到目标数据库的SSL连接。这可确保传输到仓库的所有数据在传输过程中都进行了加密(注意:默认情况下,仓库在静止时不加密)。建议的设置已启用。
    • 身份验证服务器—如果启用,则在启用“传输中加密数据”时验证服务器身份。如果服务器证书未签名且启用了此选项,则导出过程将无法正常运行。禁用此设置允许信任自签名证书,但不再能防止中间人(MitM)攻击。已启用推荐设置。
  3. 使用以下命令测试连接:测试连接按钮。这将尝试建立与目标仓库数据库的连接。任何错误都会出现,您可以适当地重新配置设置或目标仓库数据库,直到连接成功。
  4. 日程页以配置导出频率。
    • 选择启动导出过程的日期和时间
    • 选择重复此过程的时间间隔。建议设置为1周。如果您确实想更频繁地运行它,我们建议运行它的频率不超过24小时一次。
  5. 点击拯救

从遗留模型升级

如果您已经有数据仓库的配置,建议如下:

  1. 将数据模型从遗产维这将把输出模式的结构更改为更易于使用和更全面支持的数据模型。您将被要求更新仓库的任何消费者以使用新模型。当使用新模型时,现有的模式元素将保持不变,但在未来的ETL过程中不再更新。
  2. 启用加密和身份验证:以前不支持这些设置,这意味着在导出过程中没有加密传输中的任何数据。建议继续对传输中的数据进行加密,因此建议您启用加密传输中的数据身份验证服务器设置。这些更改将需要在目标仓库数据库中重新配置SSL。有关更多信息,请参阅“部署和配置仓库”部分。

模式更改

在进行更改时,维度仓库模式保证向后兼容。由Security Console执行的ETL过程可能会定期向模式中添加额外的数据元素,但这不会导致将来对该模式的任何报告或查询中断。以下内容不会在架构中更改:

  • 可用的表、列和函数,包括它们的名称
  • 列和函数数据类型

在ETL过程的未来迭代中需要做以下更改:

  • 将其他列添加到现有表中
  • 添加了新的表或函数

当对模型进行更改时,应用产品升级并执行新的ETL流程将升级目标仓库中的模型。

关于仓库的报告

在导出过程之后,数据仓库可以立即使用以下任何一种方法进行报告:1)直接连接;2)商业智能工具;和/或3)任何额外的定制工具/脚本或现成的软件。在导出(ETL)过程中,将执行许多操纵仓库状态的DDL和DML查询。因此,在此期间不应该访问仓库。

部署和配置仓库

数据仓库是指运行PostgreSQL 9.4及以上版本数据库服务器的主机。数据仓库服务器的管理和配置需要手工操作。仓库必须配置为支持PostgreSQL数据库端口的外部连接,并允许从安全控制台进入网络流量。仓库的最佳性能配置取决于所需的并发连接数量以及磁盘速度和可用ram。

硬件需求:

  • 2ghz +处理器(推荐四核处理器)
  • 最小32gb内存,推荐72gb +内存
  • 1tb硬盘(最低),2tb +硬盘(推荐)
  • 100 Mbps网络接口(最低),1 Gbps(推荐)

按照以下步骤安装和配置新的数据仓库:

  1. 安装PostgreSQL 9.4及以上版本,确保已应用所有可用补丁
  2. 配置postgresql.conf使用以下建议的最低设置(您可以相应地重新配置硬件和连接要求):

所有PostgreSQL版本:

设置

32 GB内存

72 GB RAM

max_connections

10

20.

shared_buffers

8GB

18 GB

工作记忆

419 MB

471 MB

maintenance_work_mem

2 GB

2 GB

checkpoint_segments

128

256

有效缓存大小

24GB

54 GB

checkpoint_completion_target

0.9

0.9

wal_buffers

16 MB

32 MB

auto_vacuum

PostgreSQL 9.6 +:

设置

32gb或72gb内存

min_parallel_relation_size

8 MB

force_parallel_mode

最大工作进程

CPU核数* 2

max_parallel_workers_per_gather

CPU核心数/2

  1. 要启用SSL(以及传输中的数据加密),请获取证书并启用postgresql.conf文件:
    • ssl=on
    • ssl_ciphers = '高:中:+ 3 des: !aNULL”
    • ssl_cert_file = ' server.crt '
    • ssl_key_file = ' server.key '
    • 密码\u加密=打开
  2. 启动postgreSQL进程。