在vSphere群集顶部虚拟化工作负载时,VMware vSphere解决方案内置的基本功能之一就是高可用性。实际上,可以在Essentials Plus许可级别或更高级别上找到VMware HA。如果不使用它,应该使用。除了简单地在vSphere群集上启用VMware HA功能之外,还需要了解vSphere HA高可用性群集的其他网络最佳实践。那些是什么?在使用VMware HA时,让我们深入了解一些网络最佳实践。

什么是vSphere HA?

什么是vSphere HA?作为VMware HA的简要入门,它通过将虚拟机和驻留在集中的主机池化,在vSphere群集中提供了高可用性。监视各个群集主机。如果主机由于某种原因发生故障,则故障主机上的虚拟机将在vSphere群集中剩余的正常主机上重新启动。

针对vSphere HA高可用性集群的vSphere Cloud集群网络最佳实践为vSphere群集打开vSphere HA

在vSphere群集上配置vSphere HA时,会将一台主机选为主主机。该主控主机负责与vCenter Server通信,并监视群集中的其他ESXi主机以及受vSphere HA保护的虚拟机。vSphere HA以独特的方式处理三种“故障”类型:

  • 主机失败 –主机出现故障
  • 网络分区 =主机未在网络上隔离,但无法通过网络与vSphere HA主主机通信
  • 网络隔离 –主机变为网络隔离

确定vSphere HA故障类型

失败 –没有从下级主机接收到心跳,没有与任何数据存储交换心跳,发送到管理IP地址时没有ping响应

网络分区 – 观察到主机的数据存储心跳,但是vSphere HA主服务器无法通过网络查看从属主机。

网络隔离 –主机仍在运行,但是在管理网络上未观察到来自vSphere HA代理的流量。尝试对群集隔离地址执行ping操作。如果这些失败,则主机声明它与网络隔离。

vSphere Proactive HA

在最新的vSphere版本中,新的主动HA功能允许在ESXi主机上的组件发生故障(例如,主机电源等)时主动执行HA操作。当发生这种情况时,可以自动执行HA响应,例如vMotion将VM移至正常主机。

vSphere HA高可用性群集的网络最佳实践

让我们看一下vSphere HA高可用性群集的网络最佳实践,并了解如何在网络领域实施推荐的最佳实践。

vSphere HA Networking最佳做法

关于vSphere网络,有许多注意事项。vSphere HA组件在很大程度上依赖于vSphere群集中ESXi主机之间的网络,以确定主机的各种状态以及在不同的故障状态下需要采取的操作。

在vSphere群集中的ESXi主机上执行维护时,需要使用vSphere HA进行网络考虑。将群集的vSphere HA设置为“打开”后,由于心跳流量无法正常工作,实际上可以引起对故障主机的检测和网络隔离。

如果要在网络更改领域中对ESXi主机执行维护,请暂停对该特定主机的vSphere HA监视。如果不这样做,则可能会无意间导致不必要的尝试,将虚拟机故障转移到vSphere群集中的其他主机。

在群集中的vSphere主机上进行更改之前,请禁用群集的HA,进行网络更改,然后再次在群集级别上打开vSphere HA。这将重新配置群集中的主机以进行HA监视。

使用哪些网络?要了解哪个网络可能导致vSphere HA中断,需要确定用于HA通信的HA网络。

vSphere群集中的 ESXi主机上,vSphere HA使用所有VMkernel网络进行HA通信。

网络隔离地址的重要性

网络隔离地址是什么?这是vSphere HA用于确定主机是否与网络隔离的特殊地址。当主机停止从群集中的所有其他主机接收心跳时,将对网络隔离地址执行ping操作。如果主机可以ping通其网络隔离地址,则该主机知道它未与网络隔离,并且群集中的其他主机很可能已发生故障或已被网络分区。

如果主机无法ping通隔离地址,则主机很可能已与网络隔离。在网络隔离方案中,不会执行任何故障转移操作。

默认情况下,什么配置为网络隔离地址?默认网关。无论配置了多少个管理网络,都将指定一个默认网关。此外,可以使用高级选项(das.isolationaddress)为其他网络添加隔离地址。

在vSphere HA高可用性集群中配置das.isolationaddress-in-vSphere-HA网络最佳实践在vSphere HA中配置das.isolationaddress

有关HA高级选项的更多信息,请参见:https://docs.vmware.com/cn/VMware-vSphere/6.5/com.vmware.vsphere.avail.doc/GUID-E0161CB5-BD3F-425F-A7E0-BF83B005FECA.html

Das.isolationaddress选项 –将地址设置为ping以确定主机是否与网络隔离。仅当未从群集中的任何其他主机接收到心跳信号时,才对此地址执行ping操作。如果未指定,则使用管理网络的默认网关。该默认网关必须是可用的可靠地址,以便主机可以确定它是否与网络隔离。可以为集群指定多个隔离地址(最多10个):das.isolationAddressX,其中X = 0-9。通常,应该为每个管理网络指定一个。指定太多地址会使隔离检测花费太长时间。

网络路径冗余

网络路径冗余对于vSphere群集的所有方面都至关重要。但是,使用vSphere HA功能也至关重要。当仅由于网络通信问题而导致感知到的HA失败时,就不想出现误报。

使多个NIC支持在ESXi服务器上配置的网络,这些网络被上行链接到冗余物理交换机。这有助于确保在NIC故障,网络电缆故障,网络电缆拔除和交换机故障的情况下具有冗余性。

此外,还可以从创建连接到单独的虚拟交换机的第二个管理网络中受益。这将为vSphere HA创建额外的冗余以传达心跳。

写在最后面的话

对于vSphere HA高可用性群集,网络最佳实践肯定是在为vSphere群集配置,故障排除和设计vSphere HA解决方案时需要给予适当注意的领域。通过与上述以及其他最佳实践保持一致,它有助于最大程度地减少与vSphere HA网络相关的问题。