アーティクル - CS294545

ThingWorx Analytics 8.3 で特定のモデルをトレーニングする際に、「すべての学習が失敗しました」というエラーが報告される

修正日: 03-Nov-2022   


注記:ここに記載されている情報は、お客様の利便性向上のため機械翻訳ソフトを使用しています。PTCは、ここに記載されている情報の翻訳の正確性について、一切の責任を負いませんので、ご了承ください。英語の原文を参照するには、こちら。この機械翻訳に関する詳細は、こちら。
お知らせいただき、ありがとうございます。この機械翻訳をレビューします。

適用対象

  • ThingWorx Analytics 8.3.1 to 9.5

説明

  • 特定のトレーニングジョブが失敗した後、ジョブの詳細に次のエラーが表示されます。
トレーニングの学習でエラーが発生しました [トレーナー = マルチ目標トレーナー [学習 [トレーナー = SoloistModel [] すべての学習受講 maxNumberOfMiningFields のトレーニング. NeuralNetTransformerFactory [= 15 useredundxforms Yfilter = true 拡張 = true]]], 変圧器 = com SparkAnnTrainer@7688546................--------------------NormalizeTransformerFactory@5abe2624SoloistModel [] すべての学習受講を行います。 maxNumberOfMiningFields = neuralnet. SparkAnnTrainer@7688546、トランスフォーマー = NeuralNetTransformerFactory [= 15 Useredundxforms Yfilter = true 拡張 = true]]]]、変圧器 = com.. この学習に失敗したすべての学習 NormalizeTransformerFactory@5abe2624 ユーザーは、トレーニングに失敗しました。サポート事例として、このログタグを指定してください: c6ab0554-a524-4a2c-a7a2-865dba986ac4
  • Worker .log ファイルに次のエラーが発生しました
TrainingFailedException: エラートレーニングを受講しました [トレーナー = 複数目標のトレーナー...
internalTrainModel (学習した java: 109) での操作を実行します。
trainForGoals (学習した java: 186 のみ) を実行しています。
trainWithSpecificLookback (学習した java: 180) を実行しています。
trainByParameters (学習した java: 128) を実行しています。
TrainingRunner (TrainingRunner.. 94.) によって発生しました: java. RuntimeException: すべての学習者によるトレーニングに失敗しました。
AbstractEnsembleModel で executeTrainingOnLearners (AbstractEnsembleModel:81) を実行して、() を実行します。
AbstractEnsembleModel-trainAllTrainers (AbstractEnsembleModel: 100) で、() の解析を行います。
AbstractEnsembleModel-ensembleTrainModel (AbstractEnsembleModel:95) での操作についてのトレーニングを行います。
SoloistEnsemble-trainModel (SoloistEnsemble:32) で、() を実行してください。
internalTrainModel (学習した java: 101) を実行しています。
...19個の共通フレームが省略されています
  • そしてまた:
TrainingFailedException: エラートレーニング学習器 [トレーナー = com SparkAnnTrainer@29a88d64., maxNumberOfMiningFields = NeuralNetTransformerFactory [= 10 useRedundancyFilter = true 拡張 = true]] の順に選択した場合、このエラーが発生しています。
internalTrainModel (学習した java: 109) での操作を実行します。
AbstractEnsembleModel. lambda $ executeTrainingOnLearners $ 0 (AbstractEnsembleModel:72) を実行しています ($ 0 ()
原因: SparkException: ステージの失敗によってジョブが中止されました: ステージ18.0 のタスク2が1回失敗しました。最新の失敗 2.0: ステージ 18.0 (TID 34、localhost、エクゼキュータ driver): java. OutOfMemoryError: Java ヒープ空間
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)

ドライバースタックトレース:
org $ apache $ spark $ scheduler $ DAGScheduler $ $failJobAndIndependentStages (DAGScheduler. スケール a: 1499) のようになっています。
1487 $ abortStage $ $anonfun $ abortStage $1. 適用 (DAGScheduler.......)
...
原因: OutOfMemoryError: ヒープ空間を Java
java. nio. HeapByteBuffer < init > (HeapByteBuffer. java:57)
は、java. nio. ByteBuffer. を割り当てます (バイトバッファ. java: 335)
$19 に保存します。 BlockManager $ $anonfun (BlockManager. (ブロック) a: 1140)
最新バージョンはこちらを参照ください CS294545