入力データを設定
DBFSからジョブにデータをロードするようにtFileInputDelimitedコンポーネントを設定します。
始める前に
-
DBFS (Databricks File System)にファイルをアップロードの説明に従い、movies.csvとdirectors.txtというソースファイルがHDFSにロードされていること。
-
[Repository] (リポジトリー)の[ delimited] (ファイル区切り)ノードの下で、movie.csvファイルのメタデータが設定されていること。
設定されていない場合は、映画メタデータを準備に従ってメタデータを作成してください。
手順
タスクの結果
これで、映画データとディレクターデータをジョブにロードするように入力コンポーネントが設定されました。