2013年4月18日木曜日

初めてのPentaho Data Integration 2 テキストファイルからOracle DBへの取り込み

テキストファイルからOracle DBへの取り込みの方法を説明します。

  1. CSV file inputをドラッグ
  2. ドラッグしたCSV file inputをダブルクリックして設定する
    1. ファイル名を入力する
      • C:\Program Files\Pentaho\data-integration-4.4.0\samples\transformations\files\sales_data.csv としてみます。
    2. 区切り文字を入力する
    3. 「フィールドを取得」を押しフィールドを自動設定する
      • データタイプ、書式、長さを読み取ったデータから 推定してくれます
      • プレビューすることも出来ます
      • 今回のデータにはASCII文字以外が含まれていることが見えます
  3. 不要な列を削除する為にSelect valuesをドラッグ
  4. Shiftを押しながらCSV file inputからSelect valuesまでドラッグして結合する
  5. Select Valueをダブルクリックして設定する
    • 削除フィールドでPRODUCTCODE, ADDRESSLINE1, CONTACTFIRSTNAMEを選択する
    • 選択フィールド : 残すフィールドを選択
      • フィールド名を変更する事も出来る。
      • 「フィールドの選択」を押すと入力ステップの全フィールドが入力される
    • 除去フィールド :除去するフィールドを選択
      • 「フィールドの除去」 を押すと入力ステップの全フィールドが入力される
    • メタ情報  : データタイプやフィールド名を変更
      • 「フィールドの変更」 を押すと入力ステップの全フィールドが入力される
  6.  Table outputをドラッグ
  7. Shiftを押しながらSelect valuesからTable outputまでドラッグして結合する
  8. Table outputをダブルクリックして設定する
    1. 「全般」タブの開始時にテーブル内容を削除する」にチェックを入れる
    2. データソースをクリックして接続に必要な情報を設定
      • テスト接続を押して設定が正しいか確認出来ます  
    3.  出力先のテーブル名を「全般」タブのテーブル名に入力
    4.  「全般」タブのSQL→実行を押し、テーブルを作成
      • テーブルが無ければ作成するSQLが自動的に作成される
      • テーブルがあれば、入力フィールドと一致しない部分を修正するSQLが作成される
    5. 「列名」タブのフィールドマッピングを押す
    6.  自動を押し入力フィールドとデータベース列名を対応させます
  9. 「ファイル→名前を付けて保存」で出来上がったファイルを保存
  10. 「Action→実行」で動作!

動画はこちら

0 件のコメント:

コメントを投稿