tPatternMasking
特定のパターンに従うデータをマスキングします。また、必要に応じて元のデータを規則的に変換できます。
異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、tDataMaskingをご覧ください。
異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、Talend Help Center (https://help.talend.com (英語のみ))でtDataMaskingのドキュメンテーションをご覧ください。
tPatternMaskingは、パターン固有のデータや汎用データを指定範囲の日付や数値、または名前付きの値のセットからのランダムな文字に置換します。機密性の高い実際のデータを表示することが勧められない場合、実データは保護され、代替データが使用できるようになります。
実際のデータとそっくりなデータで一貫性を保ちつつ、テストやトレーニングなどの目的で使用できます。マスキングを必要とする最も一般的なデータ型として、個人を特定できる情報(PII)または機密個人データ(SPD)を含むデータがあります。
- コンポーネントは、入力内のスペース、スラッシュ(/)、ダッシュ(-)、ポイント(.)を区切りとして識別します。
- コンポーネントは、マスキングされた出力内の入力値のパターンを維持します。
- コンポーネントは、各入力行について1行を生成します。
たとえば、615/67/7489をマスキングした出力の例として、379/48/1789が考えられます。
定義したパターンに入力データが一致しない場合、tPatternMaskingはnullを出力します。
ローカルモードでは、Apache Spark 1.6、2.2、2.3、2.4、3.0がサポートされています。
Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。
使用しているTalend製品に応じて、このコンポーネントは、次のジョブのフレームワークの1つ、一部、またはすべてで使用できます。
-
標準:tPatternMaskingの標準プロパティをご覧ください。
このフレームワーク内のコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
-
Spark Batch:Apache Spark BatchのtPatternMaskingプロパティをご覧ください。
このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend Platform製品すべて、およびTalend Data Fabricで利用できます。
-
Spark Streaming:Apache Spark StreamingのtPatternMaskingプロパティをご覧ください。
このコンポーネントは、Talend Real Time Big Data PlatformおよびTalend Data Fabricで利用できます。