Parquetファイルの並行配布 - Analytics Database - Teradata Vantage

Teradata Vantage™ - Analytics Databaseリリース サマリー - 17.20 新機能

Deployment
VantageCloud
VantageCore
Edition
Enterprise
IntelliFlex
VMware
Product
Analytics Database
Teradata Vantage
Release Number
17.20
Published
2022年6月
Language
日本語
Last Update
2024-02-01
dita:mapPath
ja-JP/jva1628096041737.ditamap
dita:ditavalPath
ja-JP/qkf1628213546010.ditaval
dita:id
weq1472245453190
Product Category
Teradata Vantage

リリース17.20より前では、Vantageはファイル サイズに基づいてAMP全体にParquetファイルを配布し、すべてのAMP間で負荷を分散していました。この配布は、AMPよりもファイルが少ない場合またはファイルのサイズが大幅に異なる場合に、スキューを引き起こす原因にもなります。

現在、Vantageは行グループの境界に基づいてAMP全体にParquetファイルを配布できるようになりました(並行配布)。

利点

  • スキューを排除し、Parquetテーブルからクエリーを取得するパフォーマンスを向上させます。

    ファイル数がAMP数の倍数でない場合、またはファイル サイズ間の差が大きい場合に、顕著な改善になります。

考慮事項

  • この機能はデフォルトで有効です。

    Vantageがファイル サイズに基づいてParquetファイルをAMP全体に配布するようにするには、SET QUERY_BAND BINPACKALGO4PARQUET=1を使用します。