アーティクル - CS294545
ThingWorx Analytics 8.3 で特定のモデルをトレーニングする際に、「すべての学習が失敗しました」というエラーが報告される
修正日: 03-Nov-2022
適用対象
- ThingWorx Analytics 8.3.1 to 9.5
説明
- 特定のトレーニングジョブが失敗した後、ジョブの詳細に次のエラーが表示されます。
トレーニングの学習でエラーが発生しました [トレーナー = マルチ目標トレーナー [学習 [トレーナー = SoloistModel [] すべての学習受講 maxNumberOfMiningFields のトレーニング. NeuralNetTransformerFactory [= 15 useredundxforms Yfilter = true 拡張 = true]]], 変圧器 = com SparkAnnTrainer@7688546................--------------------NormalizeTransformerFactory@5abe2624SoloistModel [] すべての学習受講を行います。 maxNumberOfMiningFields = neuralnet. SparkAnnTrainer@7688546、トランスフォーマー = NeuralNetTransformerFactory [= 15 Useredundxforms Yfilter = true 拡張 = true]]]]、変圧器 = com.. この学習に失敗したすべての学習 NormalizeTransformerFactory@5abe2624 ユーザーは、トレーニングに失敗しました。サポート事例として、このログタグを指定してください: c6ab0554-a524-4a2c-a7a2-865dba986ac4
- Worker .log ファイルに次のエラーが発生しました
TrainingFailedException: エラートレーニングを受講しました [トレーナー = 複数目標のトレーナー...
internalTrainModel (学習した java: 109) での操作を実行します。
trainForGoals (学習した java: 186 のみ) を実行しています。
trainWithSpecificLookback (学習した java: 180) を実行しています。
trainByParameters (学習した java: 128) を実行しています。
TrainingRunner (TrainingRunner.. 94.) によって発生しました: java. RuntimeException: すべての学習者によるトレーニングに失敗しました。
AbstractEnsembleModel で executeTrainingOnLearners (AbstractEnsembleModel:81) を実行して、() を実行します。
AbstractEnsembleModel-trainAllTrainers (AbstractEnsembleModel: 100) で、() の解析を行います。
AbstractEnsembleModel-ensembleTrainModel (AbstractEnsembleModel:95) での操作についてのトレーニングを行います。
SoloistEnsemble-trainModel (SoloistEnsemble:32) で、() を実行してください。
internalTrainModel (学習した java: 101) を実行しています。
...19個の共通フレームが省略されています
internalTrainModel (学習した java: 109) での操作を実行します。
trainForGoals (学習した java: 186 のみ) を実行しています。
trainWithSpecificLookback (学習した java: 180) を実行しています。
trainByParameters (学習した java: 128) を実行しています。
TrainingRunner (TrainingRunner.. 94.) によって発生しました: java. RuntimeException: すべての学習者によるトレーニングに失敗しました。
AbstractEnsembleModel で executeTrainingOnLearners (AbstractEnsembleModel:81) を実行して、() を実行します。
AbstractEnsembleModel-trainAllTrainers (AbstractEnsembleModel: 100) で、() の解析を行います。
AbstractEnsembleModel-ensembleTrainModel (AbstractEnsembleModel:95) での操作についてのトレーニングを行います。
SoloistEnsemble-trainModel (SoloistEnsemble:32) で、() を実行してください。
internalTrainModel (学習した java: 101) を実行しています。
...19個の共通フレームが省略されています
- そしてまた:
TrainingFailedException: エラートレーニング学習器 [トレーナー = com SparkAnnTrainer@29a88d64., maxNumberOfMiningFields = NeuralNetTransformerFactory [= 10 useRedundancyFilter = true 拡張 = true]] の順に選択した場合、このエラーが発生しています。
internalTrainModel (学習した java: 109) での操作を実行します。
AbstractEnsembleModel. lambda $ executeTrainingOnLearners $ 0 (AbstractEnsembleModel:72) を実行しています ($ 0 ()
原因: SparkException: ステージの失敗によってジョブが中止されました: ステージ18.0 のタスク2が1回失敗しました。最新の失敗 2.0: ステージ 18.0 (TID 34、localhost、エクゼキュータ driver): java. OutOfMemoryError: Java ヒープ空間
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)
ドライバースタックトレース:
org $ apache $ spark $ scheduler $ DAGScheduler $ $failJobAndIndependentStages (DAGScheduler. スケール a: 1499) のようになっています。
1487 $ abortStage $ $anonfun $ abortStage $1. 適用 (DAGScheduler.......)
...
原因: OutOfMemoryError: ヒープ空間を Java
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)
internalTrainModel (学習した java: 109) での操作を実行します。
AbstractEnsembleModel. lambda $ executeTrainingOnLearners $ 0 (AbstractEnsembleModel:72) を実行しています ($ 0 ()
原因: SparkException: ステージの失敗によってジョブが中止されました: ステージ18.0 のタスク2が1回失敗しました。最新の失敗 2.0: ステージ 18.0 (TID 34、localhost、エクゼキュータ driver): java. OutOfMemoryError: Java ヒープ空間
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)
ドライバースタックトレース:
org $ apache $ spark $ scheduler $ DAGScheduler $ $failJobAndIndependentStages (DAGScheduler. スケール a: 1499) のようになっています。
1487 $ abortStage $ $anonfun $ abortStage $1. 適用 (DAGScheduler.......)
...
原因: OutOfMemoryError: ヒープ空間を Java
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)
最新バージョンはこちらを参照ください CS294545