簡易用語説明【SARSA】
マルコフ決定プロセスポリシーを学習するためのアルゴリズムであり、機械学習の強化学習領域で使用される。 RummeryとNiranjanによって、「Modified Connectionist Q-Learning」という名前のテクニカルノートで提案された。(引用元:wikipedia)
SARSAの情報
|
最も一般的に使用される英文表記
|
SARSA |
|---|---|
|
音・読み
|
サルサ |
|
最も一般的に使用される和文表記
|
該当なし |
|
別表記①
|
state–action–reward–state–action |
|
別表記②
|
該当なし |
|
別表記③
|
該当なし |
|
G検定シラバス
|
なし |
|
E資格シラバス
|
なし |
|
備考欄
|
ー |