Server Managementを使用すると、危機的な障害、またはTVIアラートをTeradataに直ちに報告することができます。Server Managementによるロギングはデフォルトで有効になっていますが、agent.propertiesまたはdaemon.propertiesのlogger.useTviLoggerプロパティの値をfalse.に設定することで無効にできます。
次に、Data Moverによって報告されるServer ManagementエラーをメッセージID番号別に示します。すべてのエラーは危機的なエラーです。
- 4601001
- 概要: デーモンのポートが使用中です。
- 説明: エージェントからの着信ソケット接続に使用されるデーモンのポートが別のプロセスによって使用されています。
- 推定原因: デーモンのポートが別のプロセスによって使用されています。
- 対応策: デーモンのポートを使用可能なポート番号に変更するか、既存のデーモンのポートを使用しているプロセスを終了させます。
- 4601002
- 概要: リポジトリが予期しない状態です。
- 説明: Data Moverリポジトリが予期しない状態になっています。
- 推定原因: Data Moverリポジトリ サーバーが停止しているか、またはリポジトリに適切なテーブル群がない可能性があります。
- 対応策: Data Moverリポジトリとして使用されているPostgresインスタンスでログオンが有効になっていない可能性があります。または、インスタンスの再起動が必要です。リポジトリが適切なテーブル群で更新されるように、Data Moverデーモンを再インストールする必要がある場合もあります。
- 4601003
- 概要: デーモンがJMSブローカーに接続できません。
- 説明: デーモンからJMSブローカーに到達できません。
- 推定原因: ActiveMQサービスがダウンしているか、デーモンのブローカー ポートまたはURLの構成が正しくない可能性があります。
- 対応策: ActiveMQサービスを再起動します。デーモンのブローカー ポートまたはURLを確認します。
- 4601004
- 概要: デーモンがエージェントに接続できません。
- 説明: Data Mover エージェントに到達できません。
- 推定原因: Data Moverエージェントが停止している可能性があります。
- 対応策: Data Moverエージェントを再起動します。
- 4601005
- 概要: ジョブ リポジトリが領域不足です。
- 説明: Data Moverのジョブ リポジトリの領域が不足しています。
- 推定原因: ジョブ リポジトリに対する領域の割り当てが不十分です。
- 対応策: ディレクトリ/var/opt/teradata/postgres/dataのディスク領域を確認してください。このディレクトリにより多くの領域を割り当てるか、古いジョブをクリーンアップするか、ディレクトリ/var/opt/teradata/postgres/data/log/内の古いログ ファイルを削除します。
- 4601006
- 概要: デーモンが、指定したイベント テーブルに書き込むことができません。
- 説明: Data Moverジョブが、指定したイベント テーブルにイベントを書き込むことができません。
- 推定原因: イベント テーブルにアクセスできないか、またはイベント テーブル データベースに利用可能な領域がありません。
- 対応策: イベント テーブルがData Moverデーモン サーバーからアクセス可能かどうかを確認します。イベント テーブル データベースに新規イベントの格納に十分な領域があるかどうかも確認します。
- 4601007
- 概要: デーモン リポジトリ パージ タスクが複数回タイムアウトしました。
- 説明: Data Moverジョブ リポジトリが正しくクリーニングされていません。
- 推定原因: データベースがロックされている、またはオーバーロードされている可能性があります。
- 対応策: Data Moverリポジトリが別のプロセスによってロックされていないことを確認します。Data Moverリポジトリが、他の要求で頻繁にビジー状態になる共有データベース上にないことを確認します。
- 4601008
- 概要: Data Moverリポジトリがしきい値を超えました。
- 説明: 1つまたは複数のリポジトリ テーブルの行数がしきい値の上限である100万行を超えました。
- 推定原因: Data Moverのパフォーマンスが低下し、障害が発生することがあります。
- 対応策: Data Moverパージ サービスが有効になっていることを確認します。パージ サービスがすでに有効になっている場合は、追加データをパージするようにパージ プロセスを変更します。
- 4602001
- 概要: エージェントがJMSブローカーに接続できません。
- 説明: エージェントからJMSブローカーに到達できません。
- 推定原因: ActiveMQサービスが停止しているか、またはエージェントのブローカー ポートやURLの構成が正しくない可能性があります。
- 対応策: ActiveMQサービスを再起動します。エージェントのブローカー ポートまたはURLを確認します。
- 4603001
- 概要: Data Moverデーモン コンポーネントが使用できません。
- 説明: Data Moverモニタリング サービスは、Data Moverデーモン コンポーネントを検出できません。
- 推定原因: Data MoverデーモンまたはData Moverデーモン サーバーが停止している可能性があります。
- 対応策: DMコンポーネントをスタンバイで実行するように切り替えるフェールオーバーが開始されました。障害の根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603002
- 概要: Data Moverリポジトリが使用できません。
- 説明: Data Moverモニタリング サービスは、Data Moverリポジトリ データベースを検出できません。
- 推定原因: Data Moverリポジトリ データベースが実行されていないか、またはData Moverリポジトリ サーバーが停止している可能性があります。
- 対応策: DMコンポーネントをスタンバイで実行するように切り替えるフェールオーバーが開始されました。障害の根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603003
- 概要: すべてのData Moverエージェント コンポーネントが使用できません。
- 説明: Data Moverモニタリング サービスは、実行中のData Moverエージェント コンポーネントを検出できません。
- 推定原因: すべてのData Moverエージェント コンポーネントが停止している可能性があります。
- 対応策: DMコンポーネントをスタンバイで実行するように切り替えるフェールオーバーが開始されました。障害の根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603005
- 概要: アクティブ サーバーでData Mover同期モニターを使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、DMコンポーネントがアクティブ サーバーで実行されているときにレプリケーションの進行状況を追跡する同期モニターを検出できません。
- 推定原因: 同期モニターが実行されていない可能性があります。
- 対応策: アクティブ サーバーのDM同期ログを確認します。レプリケーション サービスが破損している場合は、「dmcluster switchback」を実行して再構成します。
- 4603009
- 概要: ActiveMQコンポーネントを使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、ActiveMQコンポーネントを検出できません。
- 推定原因: ActiveMQコンポーネントが実行されていない可能性があります。
- 対応策: DMコンポーネントをスタンバイで実行するように切り替えるフェールオーバーが開始されました。障害の根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603011
- 概要: Data Mover RESTコンポーネントを使用できません。
- 説明: Data Moverモニタリング サービスは、Data Mover RESTコンポーネントを検出できません。
- 推定原因: Data Mover RESTコンポーネントが停止している可能性があります。
- 対応策: DMコンポーネントをスタンバイで実行するように切り替えるフェールオーバーが開始されました。障害の根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603101
- 概要: Data Moverデーモン コンポーネントが使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、Data Moverデーモン コンポーネントを検出できません。
- 推定原因: Data MoverデーモンまたはData Moverデーモン サーバーが停止している可能性があります。
- 対応策: 以前のフェールオーバーによってDMコンポーネントはすでにスタンバイで実行されているため、フェールオーバーは発生しません。フェールオーバーの根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603102
- 概要: Data Moverリポジトリが使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、Data Moverリポジトリ データベースを検出できません。
- 推定原因: Data Moverリポジトリ データベースが実行されていないか、またはData Moverリポジトリ サーバーが停止している可能性があります。
- 対応策: 以前のフェールオーバーによってDMコンポーネントはすでにスタンバイで実行されているため、フェールオーバーは発生しません。フェールオーバーの根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603103
- 概要: すべてのData Moverエージェント コンポーネントが使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、実行中のData Moverエージェント コンポーネントを検出できません。
- 推定原因: すべてのData Moverエージェント コンポーネントが停止している可能性があります。
- 対応策: 以前のフェールオーバーによってDMコンポーネントはすでにスタンバイで実行されているため、フェールオーバーは発生しません。フェールオーバーの根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603109
- 概要: ActiveMQコンポーネントを使用できません。
- 説明: Data Moverフェールオーバー モニタリング サービスは、ActiveMQコンポーネントを検出できません。
- 推定原因: ActiveMQコンポーネントが実行されていない可能性があります。
- 対応策: 以前のフェールオーバーによってDMコンポーネントはすでにスタンバイで実行されているため、フェールオーバーは発生しません。フェールオーバーの根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4603111
- 概要: Data Mover RESTコンポーネントを使用できません。
- 説明: Data Moverモニタリング サービスは、Data Mover RESTコンポーネントを検出できません。
- 推定原因: Data Mover RESTコンポーネントが停止している可能性があります。
- 対応策: 以前のフェールオーバーによってDMコンポーネントはすでにスタンバイで実行されているため、フェールオーバーは発生しません。フェールオーバーの根本原因を調べ、問題を解決したらアクティブ サーバーで「dmcluster switchback」を実行してください。
- 4604001
- 概要: Data Mover同期モニター サービスが実行を停止したか、開始できません。
- 説明: エラーのため、同期モニター サービスが停止しました。
- 推定原因: 同期モニター サービスがアクティブなリポジトリに接続できないか、レプリケーションが破損しています。
- 対応策: 同期サービス ログで、データベース接続エラーがないかどうかを確認します。レプリケーションが破損している場合は、dmsync configを実行して、アクティブ リポジトリとスタンバイ リポジトリ間のレプリケーションサービスを再構成します。
- 4604002
- 概要: スタンバイ リポジトリのデータ遅延が大きすぎます。
- 説明: スタンバイ リポジトリのデータ レプリケーションが、指定されたデータ遅延しきい値より遅れています。
- 推定原因: スタンバイ リポジトリのデータ レプリケーションが遅すぎるか、動作を停止しています。
- 対応策: 同期サービス ログとpostgresログでエラー メッセージを確認します。
- 4604003
- 概要: レプリケーション スロットがスタンバイに対してアクティブでないか、レプリケーション データ遅延の値がnullです。
- 説明: スタンバイ レプリケーション スロットのアクティブ フラグ値がfalseか、データ遅延の値がnullです。
- 推定原因: アクティブ リポジトリとスタンバイ リポジトリ間のレプリケーションが破損しています。
- 対応策: dmsync configを実行して、アクティブ リポジトリとスタンバイ リポジトリ間のレプリケーション サービスを再構成します。
Data Moverが報告するServer Managementライフ サイクル エラーをメッセージID番号別に以下に示します。
- 1601001
- 概要: Data Moverデーモンが開始されました。
- 説明: Data Moverデーモン コンポーネントが開始されています。
- 推定原因: Data Moverデーモン コンポーネントが再起動されたか、またはノードが再起動されました。
- 対応策: なし。
- 1602001
- 概要: Data Moverエージェントが開始されました。
- 説明: Data Moverエージェント コンポーネントが開始されています。
- 推定原因: Data Moverエージェント コンポーネントが再起動されたか、またはノードが再起動されました。
- 対応策: なし。