圧縮と圧縮解除 - Access Module

Teradata® Tools and Utilities Access Moduleリファレンス

Product
Access Module
Release Number
16.20
Published
2019年9月
Language
日本語
Last Update
2020-01-29
dita:mapPath
ja-JP/igy1527114222333.ditamap
dita:ditavalPath
ja-JP/igy1527114222333.ditaval
dita:id
B035-2425
Product Category
Teradata Tools and Utilities

GZIPデータ圧縮は、インポートとエクスポートの両方でサポートされます。

エクスポートでは、オブジェクト名が".gz"で終わる場合に生成されたオブジェクトは圧縮されます。"S3SinglePartFile=True"の場合は、1つの圧縮されたオブジェクトが作成され、.gzで終わる名前が指定されます。"S3SinglePartFile=False"の場合は、F000000、F000001...と続くファイルを保持する明白なディレクトリに.gzで終わる名前が付けられます。"明白な"ディレクトリ内の個別のオブジェクトには.gz接尾辞は付けられません。オブジェクトはgzで終わる名前でなくとも圧縮されますが、これは指定されたオブジェクトが.gzで終わるからです。それらのオブジェクトは圧縮解除のために連結する必要があります。コネクタはロード時これを自動で実行します。オブジェクトは個別には圧縮解除できません。"aws s3 cp"により手動でダウンロードされた場合は、再試行するピースを連結する必要があり、その結果.gzという名前のファイルが作成されます。

インポートでは、オブジェクト名が.gzで終わる場合は圧縮解除されます。S3SinglePartFile=Falseでは、指定されたオブジェクト名が.gzで終わる場合は、すべてのFxxxxxxファイルが連結され単一オブジェクトであるかのように圧縮解除されます。これは、上述のエクスポートと同様に、Fxxxxxファイルが.gzで終わらない場合にも該当します。S3SinglePartFile=Trueでワイルドカードの指定を使用しない場合、オブジェクト名が.gzで終われば、そのオブジェクトの読み取り時に圧縮解除されます。S3SinglePartFile=Trueでワイルドカードの指定を使用する場合、個別の一致が点検され、.gz接尾辞の有無に応じて圧縮解除されるかまたはされません。

圧縮解除を必要とする各オブジェクトは、個別に圧縮解除されます。オブジェクトは、オプションの圧縮解除の操作後に連結され、TPTに送られます。実際その状態が起こるのは奇妙にも見えますが、圧縮オブジェクトと圧縮解除オブジェクトは混在できます。このような結果の連結はストリーミング操作であり、メモリの制約はありません。データはディスク上に配置されません。この方法では、他のクラウド データベースの圧縮ファイル形式がサポートされます。例えば、単一のRedShiftエクスポートでエクスポートされる.gzで終わるファイルのリストは、この方法で読み込むことができます。チェックポイント/再始動は圧縮オブジェクトで実装されますが、再始動のシーク フェーズは正しい格納場所が見つかるまでオブジェクトを読み込んで圧縮解除することにより実装されます。このような処理でも、ジョブを最初から再始動するよりは速いと考えられます。