ε-greedy方策【AI用語・和文】

簡易用語説明【ε-greedy方策】

強化学習において最適なアクションを効率よく学習するための手法で、学習初期は学習結果(Q値)に基づいたアクションを行わずに、できるだけランダムにアクションを行い、アクションに対する結果を広く確認します。 そして学習が進むに従い学習結果に基づいたアクションを行う方法のことです。
(引用元:制御工学の基礎あれこれ)

ε-greedy方策の情報

最も一般的に使用される英文表記
epsilon greedy algorithm
音・読み
イプシロングリーディホウサク
最も一般的に使用される和文表記
ε-greedy方策
別表記①
Epsilon-Greedy方策
別表記②
別表記③
G検定シラバス
あり
備考欄
NO IMAGE
最新情報をチェックしよう!
NO IMAGE

AI研修実績25000名

AI999は、累計25000名以上にAIプログラムを提供するStudy-AIが講座受講生の為のサービスの一環として提供しています。2017年から日本ディープラーニング協会のE資格認定プログラム[00011]の運営、2019年にはAI実装検定を主催するなどAI人材育成の草分け的存在としてあなたのキャリアに寄り添います。