分域容量扩展

使用本地和远程分域

本地和远程分域

-本地分域是运行 Mesos 管理节点的分域。 -远程区域 仅包含 Mesos 代理节点。远程分域和本地分域通常都存在高延迟。

安装

注意事项

  • 考虑群集中服务的未来需求。尽管安装后可以在分域和分区中添加或删除节点,但是必须在安装时就定义分域和分区。如果需要更新故障域检测脚本,就必须重新安装 DC/OS 。

  • Mesos 管理节点必须位于同一分域,以免它们之间的延迟过高。为了容错,它们分散到不同分区。

  • 分域之间的延迟必须小于 100ms。

安装步骤

  1. 创建故障域检测脚本以在每个节点上运行,从而检测节点的故障域(仅限企业)。安装过程中此脚本的输出被传递到 Mesos。

    脚本输出的推荐格式为:

    {
        "fault_domain": {
            "region": {
                "name": "<region-name>"
            },
            "zone": {
                "name": "<zone-name>"
            }
        }
    }
    

我们提供 AWS 和 Azure 节点的故障域检测脚本。对于具有 aws 节点和 azure 节点的群集,可将两者组合为一个脚本。可以使用这些模型为本地群集创建故障域检测脚本。

重要信息:如果在环境中使用代理,此脚本将不起作用。如果使用代理,则必须进行修改。

  1. 将此脚本添加到 bootstrap 节点的 genconf 文件夹。更多信息

  2. 安装 DC/OS

  3. 测试安装。

    在 DC/OS CLI 中输入 dcos node。您将看到类似以下内容的输出,其中列出了各个节点的分域和分区:

    HOSTNAME        IP                         ID                    TYPE               REGION      ZONE     
    10.0.3.188   10.0.3.188  a2ea1578-22ee-430e-aeb8-82ee1b74d88a-S1  agent            us-east-1  us-east-1a  
    10.0.7.224   10.0.7.224  a2ea1578-22ee-430e-aeb8-82ee1b74d88a-S0  agent            us-east-1  us-east-1b  
    master.mesos.  10.0.5.41                     N/A                    master              N/A         N/A     
    master.mesos.  10.0.6.95                     N/A                    master           us-east-1  us-east-1b      
    master.mesos.  10.0.7.111    a2ea1578-22ee-430e-aeb8-82ee1b74d88a   master (leader)  us-east-1  us-east-1c
    

或者,单击 DC/OS GUI 中的 节点 选项卡。节点表将显示每个代理的分域和分区栏。

使用

用户创建的 Marathon 服务和 Pod 支持树立分区和分域感知。以下 DC/OS 数据服务的 beta 版本支持树立分区感知:Cassandra、Elastic、HDFS、Kafka 和 Spark。请参阅各个服务文档,了解配置 DC/OS 数据服务分区感知的更多信息。

Marathon 服务和 Pod

在 Marathon 服务或 pod 定义中,可以使用 布局约束,以便:

  • 为您的服务或 pod 指定分区和分域,从而将所有实例都安排在该分域和分区。

  • 指定没有具体分区的分域,使给定服务或 Pod 的所有实例都安排在该分域(但不一定在同一分区)。

布局约束指南

  • 如果您的服务或 pod 定义中没有指定分域,则仅为分域安排实例,因为本地分域和远程分域之间存在高延迟。除明确指明应在远程区域启动的实例之外,不会为本地分域以外的代理安排实例。

  • 如果指定没有特定分区的分域,则在给定分域中的任何代理上安排实例。

  • 如果同时指定了分域和分区,则可在给定分域和分区内的任何代理节点安排实例,但不可安排到任何其他分域或分区内。

  • 如果指定主机名 UNIQUE 限制,则远程分域也遵守该约束。

示例

跨 3 个分域的 Mesos 群集:aws-us-east1aws-us-east2local。每个分域都有分区 abcd

仅指定远程分域

{
  "instances": 5,
  "constraints": [
    ["@region", "IS", "aws-us-east1"]
  ]
}
  • 不在本地分域启动任何实例。
  • 5 个实例全都在 aws-us-east1 分域启动。

在同一分域内均衡放置

{
   ...
  "instances": 6,
  "constraints": [
    ["@region", "IS", "aws-us-east1"],
    ["@zone", "GROUP_BY", "4"]
  ]
}
  • 实例全都在 aws-us-east1 分域启动并均匀划分到 aws-us-east1 的分区 abcd

增加群集容量

要增加容量,请 添加新代理 到群集的远程分域或分区,然后更新服务以在相应的一个或多个分域启动实例。

注意:您无法将服务配置为在多个分域运行。