AWS BPA Advanced大数据流程智能化分析平台

服务部署

BPA Advanced 是一个高级的数据分析平台，融合了Spark、Hadoop、ClickHouse等先进技术，旨在为用户提供从数据采集到深度分析的一站式解决方案。其核心工作流程包括：

炎黄盈动公司为简化BPA采集需要的Spark、ClickHouse等服务的部署，提供具体的环境要求、部署文件下载地址、部署步骤。

PMI遵循该部署方案

环境要求

如果Mysql数据库安装在Linux操作系统，需设置表名不区分大小写。

Master节点 (NameNode): 服务器1
Slave节点 (DataNode): 服务器2 和服务器3
Spark
Master节点: 服务器1
Worker节点: 服务器2 和服务器3
MySQL
MySQL主要用于存储元数据（例如，Hive的元数据）。因为它是单机部署，选择一台服务器进行部署即可。
- 服务器1部署MySQL。
  ClickHouse
选择一台服务器进行部署。确保这台服务器有足够的存储空间和高性能硬盘（例如SSD），以支持高速查询。
- 服务器3部署ClickHouse。
  算法包部署
算法包部署依赖于Spark集群进行数据处理和计算。为了减少网络延迟，建议将其部署在Spark Master所在的服务器上
- 服务器1部署算法包。
  CK数据服务
为ClickHouse提供数据查询服务的包，推荐部署在ClickHouse服务器上，这样可以减少数据查询的网络延迟
- 服务器3部署CK数据服务

部署完成后，请确保所有服务的网络配置正确，确保各服务之间可以互相通信。同样，根据您的实际业务流量和数据量，可以随时调整部署策略以优化性能。

服务器配置：本文档以3台服务器配置Hadoop和Spark集群为例。单机部署的步骤与此相同。

软件存放路径：示例中的所有软件都存放在/opt目录。实际部署时，请根据实际情境调整路径。

JDK部署：每台集群服务器都需要安装或配置JDK。每台机器都必须手动进行此操作。

大数据组件部署：Hadoop、Spark、Hive on Spark的安装或配置也需要在所有集群服务器上进行。你可以使用scp命令来复制配置，这样就不必在每台服务器上都进行手动部署（具体步骤会在后面详述）。

其他软件部署：除JDK、Hadoop、Spark和Hive on Spark之外的其他软件，只需在选定的一台服务器上进行安装或配置，具体选择哪台服务器取决于实际需求。

Seven

010-62962343-690

liujx@actionsoft.com.cn

感谢您对该文档的关注！如果您对当前页面内容有疑问或好的建议，请与我联系。如果您需要解答相关技术问题请登录AWS客户成功社区