DataConnectorオペレータでは、以下のいずれかの処理を実行できます。
- フラット ファイル、アクセス モジュール、またはHadoopのファイルとテーブルからのデータの読み取り。 リーダーとして、Producerオペレータ、つまりデータ ストリームを生成するものとみなされます。
- フラット ファイル、アクセス モジュール、またはHadoopのファイルとテーブルへのデータの書き込み。 ライターとして、 Consumerオペレータ、つまりデータ ストリームを消費するものとみなされます。
DataConnectorオペレータは、処理するファイルのディレクトリをスキャンするためにに使用することもできます。TPTドキュメントでは、これを「バッチ ディレクトリ スキャン」と呼びます。スキャンは時間間隔に基づいて連続的な方法で行なうことができます。TPTドキュメントでは、これを「アクティブ ディレクトリ スキャン」と呼びます。詳細については、<Teradata Parallel Transporterユーザー ガイド、B035-2445>を参照してください。
Hadoopファイルの処理にHDFSインターフェースを使用する場合は、アクティブ ディレクトリ スキャン機能がサポートされます。
Hadoopファイルおよびテーブルの処理にTDCH-TPTインターフェースを使用しているときはサポートされません。
DataConnectorオペレータのHadoopインターフェースの詳細については、Hadoopのファイルとテーブルの処理を参照してください。
並列処理は、オペレータの複数のインスタンスを指定することによって達成されます。