WebHDFSとJDBCの組み合わせを使用して、入力ファイルからテーブルにデータをロードするには、データ ロード ウィザードを使用します。入力ファイルは区切り文字付きテキストファイルでなければなりません。テーブルが空でない場合、データ ロード ウィザードはデータを追加するか、既存のデータを置き換えます。
- データ転送パースペクティブを開きます。
- データ ソース エクスプローラで、宛先テーブルとしてHadoopテーブルを選択します。
- テーブルを右クリックし、 を選択します。
- データ転送ウィザードで、ソース タイプとして外部ファイルを選択します。
- 起動をクリックします。
- 入力ファイルで、インポートするデータを含むファイルのディレクトリ パスと名前を入力します。ファイル システム内のファイルを検索するには、参照をクリックし、ファイルを選択して開くをクリックします。
- (オプション)ソース ファイル内のデータで宛先ファイルの既存のデータを置き換えるよう指定するには、既存データの置換を選択します。
- 行セパレータで、データのインポート元のオペレーティング システムに基づいて次のいずれかのオプションを選択します。このオプションでは、キャリッジ リターン(CR)のみ、ライン フィード(LF)のみ、またはキャリッジ リターンとライン フィード(CRとLF)の両方を持つファイルをインポートできます。
- Windows OS(CRとLF)
- Mac OS X v10.0より前(CR)
- Unix、Linux、Mac OS X v10.0以降(LF)
- ファイル エンコーディングで、データのエンコードに使用する文字セットを選択します。オプションは、UTF-8、UTF-16、ISO-8859-1、UTF-16BE、UTF-16LE、US-ASCB、およびCp1252です。 選択したオプションに基づく入力ファイルのサンプルは、ファイルのオプションの下に表示されます。ファイルのオプション フィールドで選択した値を変更すると、サンプルの行の表示も変更されます。
- 終了をクリックします。終了をクリックすると、転送進行状況ビューでファイル転送ジョブが開始します。転送が完了したら、転送履歴ビューに表示されます。