入力データ フローを 列の値でピボットして正規化の度合いを低くすることによって圧縮します ピボット列のデータが変更されるたびにピボットが行われるため 入力データをピボット列で並べ替える必要があります 注意: この変換は 重複する行があると失敗します ...

入力データ フローを、列の値でピボットして正規化の度合いを低くすることによって圧縮します。ピボット列のデータが変更されるたびにピボットが行われるため、入力データをピボット列で並べ替える必要があります。注意: この変換は、重複する行があると失敗します。
入力テキストに長すぎる文があるので 用語抽出変換で入力テキストを処理できません 対象の文は 複数の文に分割されます 入力データ ファイルの形式を このダイアログ ボックスで選択した行および列の区切り記号プロパティで定義するか フォーマット ファイルで指定された形式で定義するかを示します 入力データ フローから特定の割合の行を無作為にサンプル抽出します たとえば データ マイニング モデルを作成する際にこの変換を 2 回使用して 1 回目でモデルのトレーニング用のサンプルを作成し 2 回目でモデルのテスト用のサンプルを作成することができます ... 入力データ フローから特定の数の行を無作為にサンプル抽出します たとえば Web サイトで取り上げる製品を無作為に選択できます 入力データ フローを 列の値でピボットして正規化の度合いを低くすることによって圧縮します ピボット列のデータが変更されるたびにピボットが行われるため 入力データをピボット列で並べ替える必要があります 注意: この変換は 重複する行があると失敗します ... 入力データの挿入を停止する行を指定します 既定値は 0 で 指定されたデータ ファイルの最終行を示します 入力データの挿入を開始する行を指定します 既定値は 1 で 指定されたデータ ファイルの先頭行を示します 入力データは 指定したテスト用データの割合とテスト データ内のケースの最大数に基づいて 2 つのセット (トレーニング セットとテスト セット) にランダムに分割されます トレーニング セットは マイニング モデルの作成に使用されます テスト ... 入力トレース ファイルが存在しないか 無効であるか または壊れています コントローラーのローカル パスが前処理構成ファイルで指定されていることを確認してください