リリース17.20より前では、Vantageはファイル サイズに基づいてAMP全体にParquetファイルを配布し、すべてのAMP間で負荷を分散していました。この配布は、AMPよりもファイルが少ない場合またはファイルのサイズが大幅に異なる場合に、スキューを引き起こす原因にもなります。
現在、Vantageは行グループの境界に基づいてAMP全体にParquetファイルを配布できるようになりました(並行配布)。
利点
- スキューを排除し、Parquetテーブルからクエリーを取得するパフォーマンスを向上させます。
ファイル数がAMP数の倍数でない場合、またはファイル サイズ間の差が大きい場合に、顕著な改善になります。
考慮事項
- この機能はデフォルトで有効です。
Vantageがファイル サイズに基づいてParquetファイルをAMP全体に配布するようにするには、SET QUERY_BAND BINPACKALGO4PARQUET=1を使用します。