tTransliterate
文字列を世界の多数の言語の標準文字セット UCS (Universal Coded Character Set)に変換します。
tTransliterateコンポーネントでは、文字列が表す音声に基づき、元の文字列と同等の文字列をUCSで作成を試行します。
tTransliterateは、世界の多数の言語体系によるテキストを、Unicode標準のレパートリーに基づいて判読可能な文字にエンコーディングします。これにより、元のスクリプトで文字が残されている場合よりも、異なる言語の単語を認識して解釈しやすくなります。UnicodeおよびUnicode標準の詳細は、Unicode (英語のみ)およびUnicode標準 (英語のみ)をご確認ください。
ローカルモードでは、Apache Spark 2.0、2.3、2.4、3.0がサポートされています。
Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。
使用しているTalend製品に応じて、このコンポーネントは、次のジョブのフレームワークの1つ、一部、またはすべてで使用できます。
-
標準:tTransliterateの標準プロパティをご覧ください。
このフレームワーク内のコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
-
Spark Batch:Apache Spark BatchのtTransliterateプロパティをご覧ください。
このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend Platform製品すべて、およびTalend Data Fabricで利用できます。
-
Spark Streaming:Apache Spark StreamingのtTransliterateプロパティをご覧ください。
このコンポーネントは、Talend Real Time Big Data PlatformおよびTalend Data Fabricで利用できます。