データの圧縮と性能 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - データベースの管理

Product
Advanced SQL Engine
Teradata Database
Release Number
17.05
17.00
Published
2020年6月
Language
日本語
Last Update
2021-03-30
dita:mapPath
ja-JP/rgu1556127906220.ditamap
dita:ditavalPath
ja-JP/rgu1556127906220.ditaval
dita:id
B035-1093
Product Category
Software
Teradata Vantage
圧縮はディスク領域を追加して解放するときには便利ですが、使用する圧縮のタイプ、ワークロード、データ アクセスの頻度、システム能力によって、パフォーマンスが向上することも、あるいはしないこともあります。一般に、圧縮はパフォーマンスに以下のような影響を及ぼします。
  • データのアクセスと格納のために必要になる圧縮と再圧縮のサイクルでは、データを圧縮しない場合に比較して、CPUの使用量が大幅に増大する可能性があります。
  • データを高密度に圧縮された状態で格納すると、必要な入出力数が減少する可能性があります。

圧縮方法の詳細については、<Teradata Vantage™ - データベースの設計、B035-1094>を参照してください。

複数値圧縮(MVC)

MVCは、列内の再帰値を、テーブル ヘッダー内の単一の値に圧縮します。

性能の影響

MVCを使用すると、呼び出しレコード詳細やクリック ストリーム データなどの高データ ボリューム アプリケーションの性能が高くなり、特定目的のワークロード全般やフル テーブル スキャン アプリケーションの性能が大幅に向上します。

物理行サイズが小さくなれば、データ ブロックの数や入出力量は小さくなり、全体として性能が向上します(ただし、アーカイブされた圧縮の量によります)。

選択操作や削除操作では、いずれにしてもそれに見合った改善が見られます。挿入と更新の場合は、中間的な結果が得られます。ロード ユーティリティには、値の圧縮によるメリットがあります。

アルゴリズム圧縮(ALC)

ALCは以下のもので構成されます。
  • 様々なタイプの文字データを圧縮するための、Teradataが提供するUDF
  • カスタムUDFアルゴリズムを作成する能力

性能の影響

Teradata標準のALC UDFは、入出力を減らす傾向がありますが、CPU使用量は増える可能性があります。圧縮/圧縮解除の詳細については、<Teradata Vantage™ - SQL演算子およびユーザー定義関数、B035-1210>を参照してください。

ブロック レベルの圧縮

BLCでは、データ ブロック レベルでデータを圧縮します。

ソフトウェア ベースのBLCはCPU集中型なので、このタイプのBLCを使用する場合には、使用しているVantageプラットフォームのCPU能力を考慮する必要があります。

非常に高いCPU能力を持つTeradataアプライアンス システムでBLCを使用する場合、以下を行なうことができます。
  • 許容されるすべてのデータ型へのBLCの適用。
  • データを頻繁に圧縮解除しても十分なCPU能力がある状況での、データの随時ロードおよびアクセス。
CPU能力の低いその他のプラットフォームでBLCを使用する場合、以下が必要になる場合があります。
  • オフピーク時のテーブルのロード。
  • クリティカルなスループットが要求される時間帯中の圧縮されたテーブルへのアクセスの制限。

一部の操作(クエリー、挿入/更新、CheckTableなど)は、圧縮されたテーブルに対して実行するとCPUの使用量が大幅に増えることがあります。システムのCPUにかなりの余裕がある場合を除いて、これらの操作は他のワークロードに影響を及ぼすため、応答時間が長くなる可能性があります。