簡易用語説明【方策勾配法】
方策をあるパラメタで表される関数とし、そのパラメタを学習することで、直接方策を学習していくアプローチ。(引用元:blog.syundo.org)
方策勾配法の情報
|
最も一般的に使用される英文表記
|
Policy gradient method |
|---|---|
|
音・読み
|
ポリシー グラディエント メソッド |
|
最も一般的に使用される和文表記
|
方策勾配法 |
|
別表記①
|
該当なし |
|
別表記②
|
該当なし |
|
別表記③
|
該当なし |
|
G検定シラバス
|
あり |
|
備考欄
|
ー |