アーティクル - CS438655
1 つ以上の Zookeeper ノードの問題により、ThingWorx プラットフォームのアクティブ/パッシブ高可用性 (HA) のフェイルオーバーが正常に実行されませんでした。
修正日: 04-Mar-2025
適用対象
- ThingWorx Platform 8.4 to 8.5
- Zookeeper
説明
- ThingWorx プラットフォームのアクティブ/パッシブ高可用性 (HA) 構成でメンテナンス タスクを完了しようとすると、常に適切な数のノードが利用可能であるにもかかわらず、ダウンタイムが発生します。
- メンテナンスのため、利用可能な3つのZookeeperノードのうち1つがオフラインになり、ThingWorx Platformにアクセスできなくなりました。
- ThingWorx Platform Active-Passive HA 環境でメンテナンスを実行する際に予期しないダウンタイムが発生する
- 3 つの Zookeeper ノードのうち 2 つだけがクォーラムの一部であったため、Zookeeper ノードの 1 つがオフラインになったときに ThingWorx プラットフォームのダウンタイムが発生しました。
- ThingWorx アクティブ/パッシブ HA 構成で次のノード数がオンラインで使用可能であることを確認しましたが、それでも計画外のダウンタイムが発生しました。
- 1 つの ThingWorx ノード
- 2 つの Zookeeper ノード
- Zookeeper ログは、3 つのノードのうち 2 つだけがクォーラムの一部であることを示しています。
[myid:<ZK ID>] - INFO [QuorumPeer[myid=3](plain=/0:0:0:0:0:0:0:0:2181)(secure=disabled):Leader@1296] - Have quorum of supporters, sids: [ [<ZK ID 1> <ZK ID 2>],[<ZK ID 1>, <ZK ID 2>] ]; starting up and setting last processed zxid: 0x2900000000
- Zookeeper ノードを再起動すると、Zookeeper ログによると、ノードがリーダーであるクォーラムがすぐに形成されました。
[myid:<ZK ID>] - INFO [QuorumPeer[myid=3](plain=/0:0:0:0:0:0:0:0:2181)(secure=disabled):Leader@464] - LEADING - LEADER ELECTION TOOK - <Time> MS- 単一のZookeeperノードを再起動する場合、既存のクォーラムにFOLLOWERとして参加する必要があります。
最新バージョンはこちらを参照ください CS438655