簡易用語説明【SARSA】
マルコフ決定プロセスポリシーを学習するためのアルゴリズムであり、機械学習の強化学習領域で使用される。 RummeryとNiranjanによって、「Modified Connectionist Q-Learning」という名前のテクニカルノートで提案された。(引用元:wikipedia)
SARSAの情報
最も一般的に使用される英文表記
|
SARSA |
---|---|
音・読み
|
サルサ |
最も一般的に使用される和文表記
|
該当なし |
別表記①
|
state–action–reward–state–action |
別表記②
|
該当なし |
別表記③
|
該当なし |
G検定シラバス
|
なし |
E資格シラバス
|
なし |
備考欄
|
ー |