ジョブレベルにおけるシステムリソースの使用状況の判定

ジョブレベルにおけるシステムリソースの使用状況の判定 - Parallel Transporter

Teradata® Parallel Transporter ユーザーガイド

Product

Parallel Transporter

Release Number

17.20

Published

2022年6月

Language

日本語

Last Update

2022-08-22

dita:mapPath

ja-JP/uzp1645128359760.ditamap

dita:ditavalPath

ja-JP/tvt1507315030722.ditaval

dita:id

B035-2445

Product Category

Teradata Tools and Utilities

インスタンス数の使用状況の判定

Teradata PTのほとんどのオペレータは、複数のインスタンスを使用するスケールアップによって最大限のスループットを達成できますが、逆に限度を超えてインスタンスの数が増えると、並列処理過剰になり、パフォーマンスに悪影響が生じます。ジョブにインスタンスを追加するたびに、データ転送により多くのデータストリームが発生し、メモリの共有度が上昇し、セマフォも顕著化して、システムプロセスも増えます。

インスタンス数の利用状況を管理するには以下の方法を推奨します。

必要以上の数のインスタンスを作成しないでください。システムリソースの消費量が無駄に増えるだけです。最初はインスタンス2つから始めて、必要に応じて増やします。
どのようなオペレータの場合も、おそらくほとんどのロードシナリオで、インスタンスは1つから4つで十分です。ただし、ディレクトリスキャンやLOB/JSON/XMLロードのようなシナリオでは、いずれも、より多くのプロデューサインスタンスとコンシューマインスタンスが必要な場合もあります。
データをロードする際に、どこがボトルネックになるかよく判断してください。 Teradata PTでは、スケールアップにより、データI/OとロードプロセスCPUのボトルネックを解消できます。
TWB_STATUSプライベートログを読み取ってください。このログには、インスタンスごとに処理したデータ量の統計が表示されます。ジョブパフォーマンスはCPUの処理速度の秒数とTWB_STATUSログの経過時間の秒数で評価してください。
利用率が低いオペレータのインスタンスが見つかったら、インスタンスの数を減らします。オペレータのプライベートログとTWB_STATUSログのどちらでもインスタンスレベルでの詳細情報が提供されます。<Teradata PTジョブの管理とモニター>の「TWB_STATUSプライベートログでジョブステータスを把握」を参照してください。

共有メモリの使用状況の判断

ジョブ内にオペレータのインスタンスが多いほど、データストリームに割り当てる必要がある共有メモリが増えます。TPTは、スクリプト内のすべての情報(インスタンスの総数やスキーマのサイズ)に基づいて、そのジョブに最適な共有メモリ量を決定するように最善を尽くします。

ジョブの共有メモリ量を決定するために使用される式を以下に示します。

スクリプトでDataConnectorプロデューサ(ファイルリーダーなど)が指定されていない場合の式。

TotalSharedMemorySize =  ( ( ProducerCount + ConsumerCount  x  (ProducerCount x QueueDepth  + 1) )  x  MaxRowSizeInSchema  )  x 1.3

スクリプトでDataConnectorプロデューサ(ファイルリーダーなど)が指定されている場合の式。
```
TotalSharedMemorySize =  ( ( ( ProducerCount + ConsumerCount  x  (ProducerCount x QueueDepth  + 1) )  x  MaxRowSizeInSchema  ) x 1.3 ) + (3MB x DCProducerInstanceCount)
```
説明
- QueueDepthは現時点では2に設定されています。
- MaxRowSizeInSchemaは、ジョブのスキーマの最大サイズです。
  MaxRowSizeInSchemaが1MB未満である場合は、MaxRowSizeInSchemaの最小サイズとして1MBが使用されます。

例1

Exportオペレータの1つのインスタンスと2つのコンシューマインスタンスで使用される共有メモリ量。

((1 + 1) * ((1 * 2) + 1)) * 1048576) * 1.3 = ~8,178,893 bytes (~8MB)

例2

Exportオペレータの2つのインスタンスと2つのコンシューマインスタンスで使用される共有メモリ量。

((2 + 2) * ((2 * 2) + 1)) * 1048576) * 1.3 = ~27,262,976 bytes (~26MB)

例3

DCプロデューサの1つのインスタンスと1つのコンシューマインスタンスで使用される共有メモリ量。

(((1 + 1) * ((1 * 2) + 1)) * 1048576) * 1.3) + (3MB * 1) = ~11,324,621 bytes (~11MB)

ディレクトリスキャンに関する考慮事項

ディレクトリスキャン機能では、DataConnectorオペレータは、処理するすべてのファイルに関する情報を、ジョブの実行のさまざまな時点でチェックポイントレコードに格納する必要があります。ディレクトリから非常に多くのファイル(500個超)を読み取るディレクトリスキャンでは、追加の共有メモリの割り当てが必要になることがあります。ベストプラクティスとして、必要となる共有メモリ量を決定し、「共有メモリの使用状況の判断」で決定された計算にその追加の共有メモリ量を追加します。

チェックポイントレコードに必要な共有メモリの量を決定するには、次の式を使用します。

((12K * FileCount) + 12K) * 2 bytes

tbuildの-hオプションを使用すると、共有メモリサイズを増やすことができます。<Teradata® Parallel Transporterリファレンス, B035-2436>の「tbuild」を参照してください。

例

1,000個のファイルのディレクトリスキャンで必要となる共有メモリ量:

((12K * 1000) + 12K) * 2 = ~24MB bytes of extra shared memory

ジョブごとのセマフォ使用状況の判断

セマフォには、並列処理環境下で、プロセスとリソースアクセスを同期させるという目的があります。例えば、プロデューサインスタンス(あるプロセス)からコンシューマインスタンス(別のプロセス)に、データストリームでバッファデータを転送するとき、プロデューサインスタンスとコンシューマインスタンスが共有するデータストリームに対するアクセスはセマフォで同期させます。ジョブで使用するインスタンス数が増えれば増えるほど、必要なセマフォ数も増えます。

プロデューサとコンシューマの複数のインスタンスがあるジョブで必要となるセマフォ数を計算するには、次の式を使用します。

Nprocs = MAX( 25, Consumer_count + Producer_count + 2)
Semaphores = 2 * (Nprocs + 3) + 5

説明:

Nprocsは、ジョブプロセス数です。Teradata PTインフラストラクチャが使用するプロセスもこの値に含まれます。

インスタンス数の使用状況の判定

共有メモリの使用状況の判断

例1

例2

例3

ディレクトリ スキャンに関する考慮事項

例

ジョブごとのセマフォ使用状況の判断

ディレクトリスキャンに関する考慮事項