アラート監視

当社の監視サービスは、テクノロジースタックの主要なレイヤー、つまり100を超えるシステムライフポイントをカバーします。当社のプラットフォームには、2つの独立したシステムモニタ(各計算ノードに1つずつ)があり、監視自体を冗長化します。監視は、主要システム、KVMクラスタ、環境(例えば、電力スパイク)、またはその他のリソースの問題を予期します。重大なしきい値を超えると、システム管理者とAlteeveサポートチームにただちにアラートが送信されます。私たちのチームは、クラスタに接続して原因をすばやく判断し、問題を解決まで追跡します。

モニタリングサービスによって収集され、報告されるライフポイントデータには、以下が含まれます:

 

計算ノード:

  • 複数の温度センサ(故障したHVACシステムのインジケータ)
  • 内部冷却システム
  • パワーレール電圧
  • パワードロー
  • コンポーネントの障害監視

複製ノードストレージ:

  • 個々のドライブ(読み取りエラーを含む)
  • メンバーの運転環境(異常な加熱パターンのインジケータ)
  • コントローラ、キャッシュ、バッテリ/フラッシュ

クラスタスタックとリソース:

  • 予期しない移行とサーバー回復イベント
  • レプリケーション・ストレージ・イベント
  • 予期しないクラスタメンバーシップの変更

ネットワーキング:

  • 個々のリンク
  • リンク速度またはデュプレックスの変更
  • スイッチ

電力:

  • ライン歪み
  • オーバー/アンダー電圧イベント
  • 完全な停電
  • バッテリーの寿命末期

© 2023 Alteeve's Niche! Inc., Toronto, Ontario, Canada

Log in with your credentials

Forgot your details?