tPatternMaskingの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtPatternMaskingを設定するために使われます。
標準のtPatternMaskingコンポーネントは、データクオリティファミリーに属しています。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 ジョブで接続している先行コンポーネントからスキーマを取得するためには、[Sync columns] (カラムを同期)をクリックします。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
このコンポーネントの出力スキーマには、読み取り専用カラムが含まれています。
|
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Modifications] (変更) |
テーブルで変更するフィールドと変更方法を定義します: [Column to mask] (マスクするカラム): 入力フローからカラムを選択し、値を変更して同種のデータを生成します。 異なる複数のカラムからのデータをマスクできますが、マスクするフィールドの順序に従う必要があります。 各カラムは順次処理されます。すなわち、最初のカラムからのデータに対してデータマスキングオペレーションが実行され、2番目以降のカラムも同様に実行されます。 カラム内では、最後のデータフィールドを除いて、各データフィールドが固定長フィールドになっています。 固定長フィールドの場合は、たとえば、"30001,30002,30003"または"FR,EN"のように、各値に含まれる文字数が同じである必要があります。 カラム内の最後の[Enumeration] (列挙)または[Enumeration from file] (ファイルからの列挙)データフィールドは、可変長フィールドです。 可変長フィールドの場合は、たとえば、"30001,300023,30003"または"FR,ENG"のように、各値に含まれる文字数は常に同じとは限りません。 [Field type] (フィールドタイプ): データが属しているフィールドタイプを選択します。
[Values] (値)、[Path] (パス)、[Range] (範囲)および[Date Range] (日付範囲)に入力する値は、二重引用符で囲む必要があります。 入力データが無効な場合、すなわち、値がコンポーネントで定義したパターンにマッチしない場合、生成される値はnullとなります。 |
詳細設定
メソッド |
コンポーネントは、フォーマット保持暗号化(FPE)方式を使用して、マスクされた出力値を入力値と同じフォーマットで生成します。 FPE方式は微調整を使用する場合を除き、全単射方式です。 [Basic] (基本)方式がデフォルトのアルゴリズムです。 情報メモ注: マスキング方法は強力なので、[Basic] (基本)方式よりもFF1アルゴリズムを使うことをお勧めします。
[FF1 with AES] (FF1およびAES)方式は、CBCモードではAdvanced Encryption 標準をベースとしています。[FF1 with SHA-2] (FF1およびSHA-2)メソッドは、セキュアハッシュファンクションHMAC-256に依存します。 これらのメソッドは、コンポーネントが入力パターンから生成できる可能な値の数が1,000,000以上である場合に限り使用できます。 情報メモ注: Java 8u161は、[FF1 with AES] (FF1およびAES)方式を使用するために最低限必要なバージョンです。8u161よりも前のJavaバージョンを使ってこのFPE方式を使えるようにするには、Java Cryptography Extension (JCE)無制限強度管轄ポリシーファイルをOracle Webサイトからダウンロードします。
[FF1 with AES] (FF1およびAES)と[FF1 with SHA-2] (FF1およびSHA-2)のメソッドでは、一意のマスク値を生成するために、[Advanced settings] (詳細設定)の[Password for FF1 methods] (FF1メソッドのパスワード)フィールドにパスワードを設定する必要があります。 |
[Password for FF1 methods] (FF1メソッドのパスワード) |
[FF1 with AES] (FF1およびAES)と[FF1 with SHA-2] (FF1およびSHA-2)のメソッドで一意のマスク値を生成するために必要なパスワードを設定します。パスワードを設定しないと、ジョブの実行時に毎回ランダムパスワードが作成されます。[FF1 with AES] (FF1およびAES)と[FF1 with SHA-2] (FF1およびSHA-2)のメソッドとパスワードを使っている時、[Seed for random generator] (ランダムジェネレーターをシード)フィールドからのシードは使われません。 |
[Use tweaks with FF1 Encryption] (FF1暗号化で微調整を使用) |
微調整を使用するには、このチェックボックスをオンにします。各レコードに対して一意の調整が生成され、レコードのすべてのデータに適用されます。 全単射マスキングが必要な場合は、この機能を使わないでください。微調整の詳細は、データマスキングファンクションをご覧ください。 |
[Seed for random generator] (ランダムジェネレーターをシード) |
ジョブの実行ごとに同じサンプルの代替データを生成する場合は、乱数を設定します。シードはデフォルトでは設定されません。 シードを設定しないと、コンポーネントが各ジョブの実行に対して新しいランダムシードを作成します。シードを変更して実行を繰り返すと、異なるサンプルが生成されます。 |
[Encoding] (エンコーディング) |
リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。[Custom] (カスタム)を選択し、フィールドを空のままにすると、サポートされているエンコーディングは使用しているJVMに依存します。このフィールドはファイルエンコーディングには必須です。 [Field type] (フィールドタイプ)を[Enumeration from file] (ファイルからの列挙)に設定する場合は、[Path (CSV File)] (パス(CSVファイル))でファイルパスを定義します。 |
[Output the original row?] (元の行を出力しますか?) |
このチェックボックスをオンにすると、代替データに加えて元のデータ行が出力されます。元のデータと代替データの両方を出力すると、デバッグやテストのプロセスで役に立つ場合があります。 |
[Should Null input return NULL?] (Nullの入力でNullが返されるようにしますか?) |
このチェックボックスはデフォルトで選択されています。選択すると、入力値がnullの場合、コンポーネントによりnullが出力されます。それ以外の場合は、入力がnullの場合はデフォルト値、文字列値には空の文字列、数値の場合は0、日付値には現在の日付が返されます。 入力がnullの場合、チェックボックスがオンでも[Generate Sequence] (シーケンスの生成)ファンクションによりnullは返されません。 |
[Should EMPTY input return EMPTY?] (空の入力で空が返されるようにしますか?) |
このチェックボックスをオンにすると、出力データ内で空の値は変わらずそのままになります。それ以外の場合は、選択した関数が入力データに適用されます。 |
[Send invalid data to "Invalid" output flow] (無効なデータを"無効な"出力フローに送信) |
このチェックボックスはデフォルトで選択されています。
|
[tStat Catcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
使用方法
使用ルール |
このコンポーネントは、中間ステップです。入力フロート出力フローが必要になります。 |