簡易用語説明【方策勾配法】
方策をあるパラメタで表される関数とし、そのパラメタを学習することで、直接方策を学習していくアプローチ。(引用元:blog.syundo.org)
方策勾配法の情報
最も一般的に使用される英文表記
|
Policy gradient method |
---|---|
音・読み
|
ポリシー グラディエント メソッド |
最も一般的に使用される和文表記
|
方策勾配法 |
別表記①
|
該当なし |
別表記②
|
該当なし |
別表記③
|
該当なし |
G検定シラバス
|
あり |
備考欄
|
ー |