アラート監視
当社の監視サービスは、テクノロジースタックの主要なレイヤー、つまり100を超えるシステムライフポイントをカバーします。当社のプラットフォームには、2つの独立したシステムモニタ(各計算ノードに1つずつ)があり、監視自体を冗長化します。監視は、主要システム、KVMクラスタ、環境(例えば、電力スパイク)、またはその他のリソースの問題を予期します。重大なしきい値を超えると、システム管理者とAlteeveサポートチームにただちにアラートが送信されます。私たちのチームは、クラスタに接続して原因をすばやく判断し、問題を解決まで追跡します。
モニタリングサービスによって収集され、報告されるライフポイントデータには、以下が含まれます:
計算ノード:
- 複数の温度センサ(故障したHVACシステムのインジケータ)
- 内部冷却システム
- パワーレール電圧
- パワードロー
- コンポーネントの障害監視
複製ノードストレージ:
- 個々のドライブ(読み取りエラーを含む)
- メンバーの運転環境(異常な加熱パターンのインジケータ)
- コントローラ、キャッシュ、バッテリ/フラッシュ
クラスタスタックとリソース:
- 予期しない移行とサーバー回復イベント
- レプリケーション・ストレージ・イベント
- 予期しないクラスタメンバーシップの変更
ネットワーキング:
- 個々のリンク
- リンク速度またはデュプレックスの変更
- スイッチ
電力:
- ライン歪み
- オーバー/アンダー電圧イベント
- 完全な停電
- バッテリーの寿命末期
アラート監視
当社の監視サービスは、テクノロジースタックの主要なレイヤー、つまり100を超えるシステムライフポイントをカバーします。当社のプラットフォームには、2つの独立したシステムモニタ(各計算ノードに1つずつ)があり、監視自体を冗長化します。監視は、主要システム、KVMクラスタ、環境(例えば、電力スパイク)、またはその他のリソースの問題を予期します。重大なしきい値を超えると、システム管理者とAlteeveサポートチームにただちにアラートが送信されます。私たちのチームは、クラスタに接続して原因をすばやく判断し、問題を解決まで追跡します。
モニタリングサービスによって収集され、報告されるライフポイントデータには、以下が含まれます:
計算ノード:
- 複数の温度センサ(故障したHVACシステムのインジケータ)
- 内部冷却システム
- パワーレール電圧
- パワードロー
- コンポーネントの障害監視
複製ノードストレージ:
- 個々のドライブ(読み取りエラーを含む)
- メンバーの運転環境(異常な加熱パターンのインジケータ)
- コントローラ、キャッシュ、バッテリ/フラッシュ
クラスタスタックとリソース:
- 予期しない移行とサーバー回復イベント
- レプリケーション・ストレージ・イベント
- 予期しないクラスタメンバーシップの変更
ネットワーキング:
- 個々のリンク
- リンク速度またはデュプレックスの変更
- スイッチ
電力:
- ライン歪み
- オーバー/アンダー電圧イベント
- 完全な停電
- バッテリーの寿命末期