59 - ニヒケー元コテ ◆AbDmhTCTZY 2021/09/11(土) 09:32:30.85 ID:kd8r2jOL0
オペラント条件づけと言うのは、報酬や罰といった「結果」を与えることで「自発的」な行動を取るように「学習」させるというものでふ
難しい言い方をすれば、刺激を与えることで対象物が行動を起こすことで何らかの結果が生じ、一連の経験(刺激→行動→結果)を通じて今後の行動に何らかの変化が起こる随伴性(簡単に言えば結果に基づく行動頻度)を評価した言葉ものとなりまふ
オペラントと言うのは英語のoperateに由来しており、ここで言う「学習」は勉強というよりかは経験に近いというわけでふ
AIを学習させる際にも用いられる考え方となりまふ
オペラント条件づけに関して有名な実験があるのでそれも紹介しまふ
それが心理学者スキナーによる実験でふ
スキナーはお腹を空かせたマウスをケージの中に入れました
そのケージは細工が施されており、スイッチが1つ付いていました
スイッチはブザーが鳴っているときだけ押すと餌が出てくる仕組みとなっていまふ
マウスは始めはたまたま音が鳴っている(刺激)ときにボタンを押したら(行動)餌が出てきた(結果)という一つの経験をしまふ
この経験が繰り返して起こることでマウスは「音が鳴っている時にボタンを押せば餌が出てくる」という事を経験から学習し、随伴性が向上するのでふ
結果によって行動の頻度が変化した際、その行動の事をオペラント行動と言い、行動頻度が向上した場合は強化と言いまふ
スキナーの実験はマウスのオペラント行動の強化を示したわけでふ
ちなみにでふが、AIの強化学習の強化もこの強化と同じ意味合いとなりまふ