こころの健康、コミュニケーション、おいしいお店や、映画のことも 

強化学習(Reinforcement Learning)  人間とロボット

強化学習とは、


あることをして良いことが起こると、そのことを好んでするようになるという方法です。

スポーツ競技で優勝してすごくうれしいと、頑張って練習するようになります。みんなから祝福されるとうれしさが倍増するので、もっともっと頑張るようになります。

嬉しくなるのは(快感、報酬)、中脳のドーパミン神経からドーパミンが出て、側坐核のドーパミンが増えるからです。

そのドパミンは、予測よりも結果がいい(報酬予測誤差)と沢山出るようになり、結果が悪いと出が悪くなります。

この方法は、チェスや将棋のコンピューターのトレーニングにも使われています。

ある行動を行い、それに対する「報酬」からどの行動が良い結果をもたらすのかを判断して、より良い行動を選ぶようなアルゴリズムになっています。


スポンサーサイト
コメント
コメントの投稿
管理者にだけ表示を許可する
プロフィール

ドクターサナギ

Author:ドクターサナギ
「あさなぎクリニック」心療内科・精神科・メンタルクリニックの医師です。反田克彦(そりた・かつひこ)と申します。クリニックは山梨県甲府市の蓬沢町にあります。国道20号(甲府バイパス)の近くで、石和や八代(笛吹市)や甲州市からも、大月や都留、南アルプス市や韮崎、北杜市からのアクセスも良好です。臨床心理士によるカウンセリング、うつ病の復職支援施設・リワークポルト、あさなぎカフェも併設されています。

本を読んだり、音楽を聴いたり、昔の映画を見るのが好きです。どうぞよろしく。

あさなぎクリニック・心療内科の公式ホームページはこちら”

無料メール相談を始めました↑。 ホームページにフォームがあります(現在休止中です)。お気軽にどうぞ。

 「人見知りが治るノート」の紹介

人見知りが治るノート表紙

人見知りを自分でなおすための実践的なノウハウが書かれています。認知行動療法の考え方を使いますが、難しくはありません。自分ひとりで練習できます。ありそうでなかった新しいジャンルの本です。
応援していただければ、とてもうれしいです。よろしくお願い致します。

>>詳細・購入はこちら
(Amazonの商品ページへ)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
最新記事
カレンダー
09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
アクセスランキング
[ジャンルランキング]
心と身体
71位
アクセスランキングを見る>>

[サブジャンルランキング]
メンタルヘルス
5位
アクセスランキングを見る>>
アクセスランキング
[ジャンルランキング]
心と身体
71位
アクセスランキングを見る>>

[サブジャンルランキング]
メンタルヘルス
5位
アクセスランキングを見る>>
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
クリニックの公式HP
あさなぎクリニック・心療内科の公式ホームページはこちら