河川流量データのオブジェクトストアの設定 - Advanced SQL Engine

河川流量データのオブジェクトストアの設定 - Advanced SQL Engine - Teradata Database

Teradata Vantage™ - SQL演算子およびユーザー定義関数

Product

Advanced SQL Engine

Teradata Database

Release Number

17.10

Published

2021年7月

Language

日本語

Last Update

2021-09-23

dita:mapPath

ja-JP/fsi1592016213432.ditamap

dita:ditavalPath

ja-JP/wrg1590696035526.ditaval

dita:id

B035-1210

Product Category

Software

Teradata Vantage

多くの例で、河川流量データセットのサンプルを使用しています。U.S. Geological Surveyのご厚意により、USGS Surface-Water Data Setが提供されています。

例を実行するには、Teradata提供のパブリックバケットから河川流量データを使用します。または、データセットの小さなオブジェクトストアを設定することもできます。

以下の手順では、独自の外部オブジェクトストアで河川流量データを設定する方法について説明します。

外部オブジェクトストアは、Advanced SQL Engineのアクセスを許可するように設定する必要があります。

外部ストレージを設定する場合は、信頼証明を外部オブジェクトストアに設定します。この信頼証明は、SQLコマンドで使用されます。USERとPASSWORD(CREATE AUTHORIZATIONコマンドで使用)およびACCESS_IDとACCESS_KEY(READ_NOSとWRITE_NOSで使用)のサポートされる信頼証明は、次の表に示す値に対応しています。

システム/スキーマ	USER	PASSWORD
AWS	アクセスキーID	アクセスキーシークレット
Azure/共有キー	ストレージアカウント名	ストレージアカウントキー
Azure共有アクセス署名(SAS)	ストレージアカウント名	アカウントSASトークン
Google Cloud (S3相互運用モード)	アクセスキーID	アクセスキーシークレット
Google Cloud (ネイティブ)	クライアントの電子メール	秘密鍵
オンプレミスオブジェクトストア	アクセスキーID	アクセスキーシークレット
パブリックアクセスオブジェクトストア	<空の文字列> 空の文字列を左右の区別がない一重引用符で囲む: USER ''	<空の文字列> 空の文字列を左右の区別がない一重引用符で囲む: PASSWORD ''

次に、外部オブジェクトストアでの信頼証明の設定について詳しく説明します。

Platform(プラットフォーム)	注意
Amazon S3 IAM	IAMは、アクセスキーとパスワードを使用してS3バケットを保護する代わりに使用できます。IAMを使用するS3バケットへのAdvanced SQL Engineアクセスを許可するには、バケットへのアクセスを許可するロールに対して、S3バケットポリシーを次のアクションで設定する必要があります。 S3:GetObject S3:ListBucket S3:GetBucketLocation WRITE_NOSの場合: S3:PutObject S3:HeadBucket、S3:HeadObject、S3:ListBucketなどの他のアクションも許可されます。
Azure BlobストレージおよびAzure Data Lake Storage Gen2	アクセスキー情報を持つユーザーは、アカウント全体を完全に制御できます。または、SASをコンテナまたはコンテナ内のオブジェクトに対して定義できるので、SASはより詳細な許可アプローチとなります。NOSはいずれのタイプの許可も使用するので、どのタイプの秘密が供給されているかを知る必要はありません。アカウントSASトークンのみがサポートされます。サービスSASトークンではエラーが表示され、拒否されます。
Google Cloud Storage	Advanced SQL Engineのアクセスを許可するには、次の権限が必要です。 storage.objects.get storage.objects.list

Platform(プラットフォーム)

注意

Amazon S3 IAM

IAMは、アクセスキーとパスワードを使用してS3バケットを保護する代わりに使用できます。IAMを使用するS3バケットへのAdvanced SQL Engineアクセスを許可するには、バケットへのアクセスを許可するロールに対して、S3バケットポリシーを次のアクションで設定する必要があります。

S3:GetObject
S3:ListBucket
S3:GetBucketLocation

WRITE_NOSの場合:

S3:PutObject

S3:HeadBucket、S3:HeadObject、S3:ListBucketなどの他のアクションも許可されます。

Azure BlobストレージおよびAzure Data Lake Storage Gen2

アクセスキー情報を持つユーザーは、アカウント全体を完全に制御できます。または、SASをコンテナまたはコンテナ内のオブジェクトに対して定義できるので、SASはより詳細な許可アプローチとなります。NOSはいずれのタイプの許可も使用するので、どのタイプの秘密が供給されているかを知る必要はありません。

アカウントSASトークンのみがサポートされます。サービスSASトークンではエラーが表示され、拒否されます。

Google Cloud Storage

Advanced SQL Engineのアクセスを許可するには、次の権限が必要です。

storage.objects.get
storage.objects.list

外部オブジェクトストアアカウントの作成手順については、クラウドベンダーのドキュメントを参照してください。

以下の手順では、パブリッククラウド管理者の支援が必要な場合があります。

Teradataがサポートする外部オブジェクトストレージプラットフォーム上に外部オブジェクトストアを作成します。外部オブジェクトストアに固有の名前を付けます。Teradataが提供する例では、バケット/コンテナはtd-usgsと呼ばれます。バケット/コンテナ名は固有である必要があるので、td-usgs以外の名前を選択してください。
Amazonでは、バケットのアクセスIDおよび一致するシークレットキーを生成するか、Identity and Access Management(IAM)ユーザー信頼証明を生成します。Azureでは、td-usgsコンテナのアカウントSASトークン(サービスSASトークンではない)を生成します。Google Cloud Storageでは、バケットのアクセスIDおよび一致する秘密キーを生成します。
サンプルデータをhttps://downloads.teradata.com/(NOSダウンロードデータを探す)からクライアント/ラップトップにダウンロードします。ZIPファイルには、CSV、JSON、およびParquetデータ形式による河川流量のサンプルデータが含まれています。
データディレクトリ構造を保持するように注意しながら、サンプルデータをバケットまたはコンテナにコピーします。例えば、次のような場所を使用します。
- Amazon S3: /S3/YOUR-BUCKET.s3.amazonaws.com/JSONDATA
- Azure BlobストレージおよびAzure Data Lake Storage Gen2: /az/YOUR-STORAGE-ACCOUNT.blob.core.windows.net/td-usgs/CSVDATA/
- Google Cloud Storage: /gs/storage.googleapis.com/YOUR-BUCKET/CSVDATA/
Amazon S3またはAzure管理コンソール、またはAWS CLIなどのユーティリティを使用して、データを外部オブジェクトストアにコピーできます。Google Cloud Storageの場合は、gsutilツールを使用してデータを外部オブジェクトストアにコピーできます。
サンプルコードで、td-usgs、YOUR-BUCKET、およびYOUR-STORAGE-ACCOUNTをオブジェクトストアの場所に置き換えます。
YOUR-ACCESS-KEY-IDとYOUR-SECRET-ACCESS-KEYを、外部オブジェクトストアのアクセス値に置き換えます。