- 2021年10月19日
Q-learning【AI用語・英文】
簡易用語説明【Q-learning】 強化学習の一種。 ある状態sの時に、行動aを選択する価値Q(s,a)を学習する方法。(引用元:wikipedia ) Q-learning […]
簡易用語説明【Q-learning】 強化学習の一種。 ある状態sの時に、行動aを選択する価値Q(s,a)を学習する方法。(引用元:wikipedia ) Q-learning […]
簡易用語説明【Q value】 強化学習における状態行動価値。強化学習において、「ある状態 s においてある行動 a を取った時の価値」がわかれば、その価値の一番高い行動を選択 […]
簡易用語説明【dueling network】 DQNの発展系。DQNでは行動価値を行動価値関数Qで推定するが、Dueling Networkでは、行動価値関数Qを状態価値関数 […]
簡易用語説明【dropout】 過学習を抑制する方法の一つ。Dropoutは特定のレイヤーの出力を学習時にランダムで0に落とすことで、一部のデータが欠損していても正しく認識がで […]
簡易用語説明【DQN】 ディープラーニングと強化学習(Q学習)を組み合わせたアルゴリズムにより動作し、ゲームのルールを教えていなくても、どのように操作すれば高得点を取れるのかを […]
簡易用語説明【Double DQN】 Double Q-learning をDQNに適用したもの。(引用元:https://qiita.com/cfiken/items/58c […]
簡易用語説明【domain randomaization】 データのある要素をランダマイズして、微妙に異なる条件で学習させる。汎化性能を向上させることができる。(引用元:htt […]
簡易用語説明【Docker】 仮想環境を構築するためのツールです。 WindowsやMac、Linuxなどのホストマシンの上に「コンテナ」と呼ばれる仮想環境を構築し、そのコンテ […]
簡易用語説明【diversity】 推薦システムにおける 評価基準の一つ。推薦システムにおける Diversity は、「推薦結果として返すアイテムセット同士の類似度が低い」と […]
簡易用語説明【dilation convolution】 畳み込みニューラルネットワークの手法で、フィルターとの積をとる相手の間隔を開ける畳み込みのこと。(引用元:https: […]