2021.01.05
摘要
一種強化式學習之訓練系統與訓練方法被揭露。該系統包含第一計算機裝置與第二計算機裝置,該第二計算機裝置的運算能力高於該第一計算機裝置。該第一計算機裝置儲存強化式學習模型;接收輸入資料;且將輸入資料輸入強化式學習模型以產生第一輸出結果。該第二計算機裝置儲存監督式學習模型;自第一計算機裝置接收輸入資料;將輸入資料輸入監督式學習模型以產生第二輸出結果;且傳送第二輸出結果至第一計算機裝置。第一計算機裝置還根據第一輸出結果與第二輸出結果產生回饋資料,並根據回饋資料訓練強化式學習模型。技術分類 / 子分類
發明
獲證
110100312
發明第I775265號
申請日期
2021.01.05專利權期限
2041.01.04研發成果公告日期
2023.11.10