- データのアクセスと格納のために必要になる圧縮と再圧縮のサイクルでは、データを圧縮しない場合に比較して、CPUの使用量が大幅に増大する可能性があります。
- データを高密度に圧縮された状態で格納すると、必要な入出力数が減少する可能性があります。
圧縮方法の詳細については、<Teradata Vantage™ - データベースの設計、B035-1094>を参照してください。
複数値圧縮(MVC)
MVCは、列内の再帰値を、テーブル ヘッダー内の単一の値に圧縮します。
性能の影響
MVCを使用すると、呼び出しレコード詳細やクリック ストリーム データなどの高データ ボリューム アプリケーションの性能が高くなり、特定目的のワークロード全般やフル テーブル スキャン アプリケーションの性能が大幅に向上します。
物理行サイズが小さくなれば、データ ブロックの数や入出力量は小さくなり、全体として性能が向上します(ただし、アーカイブされた圧縮の量によります)。
選択操作や削除操作では、いずれにしてもそれに見合った改善が見られます。挿入と更新の場合は、中間的な結果が得られます。ロード ユーティリティには、値の圧縮によるメリットがあります。
アルゴリズム圧縮(ALC)
- 様々なタイプの文字データを圧縮するための、Teradataが提供するUDF
- カスタムUDFアルゴリズムを作成する能力
性能の影響
Teradata標準のALC UDFは、入出力を減らす傾向がありますが、CPU使用量は増える可能性があります。圧縮/圧縮解除の詳細については、<Teradata Vantage™ - SQL演算子およびユーザー定義関数、B035-1210>を参照してください。
ブロック レベルの圧縮
BLCでは、データ ブロック レベルでデータを圧縮します。
ソフトウェア ベースのBLCはCPU集中型なので、このタイプのBLCを使用する場合には、使用しているVantageプラットフォームのCPU能力を考慮する必要があります。
- 許容されるすべてのデータ型へのBLCの適用。
- データを頻繁に圧縮解除しても十分なCPU能力がある状況での、データの随時ロードおよびアクセス。
- オフピーク時のテーブルのロード。
- クリティカルなスループットが要求される時間帯中の圧縮されたテーブルへのアクセスの制限。
一部の操作(クエリー、挿入/更新、CheckTableなど)は、圧縮されたテーブルに対して実行するとCPUの使用量が大幅に増えることがあります。システムのCPUにかなりの余裕がある場合を除いて、これらの操作は他のワークロードに影響を及ぼすため、応答時間が長くなる可能性があります。