人工ニューラルネットワークはバックプロパゲーションにより教師あり学習を行うそ...

avatar
ID非公開さん
2020/09/04 03:53

人工ニューラルネットワークはバックプロパゲーションにより教師あり学習を行うそうですが

人間は全体的にバックプロパゲーションを使っていない可能性が高いと聞きました すると、例えば快楽を元にした強化学習をしよう!といったときに具体的にどのようなシナプスの最適化を行なっていると考えられるでしょうか? 定説がないのなら、仮説でもよいし回答者様の予想や想像でもよいのでよろしくお願いします 自分で考えても、逆方向に信号を送らないでシナプスを最適化する方法が全然思い浮かばないのです よろしくお願いします

他の答え


avatar
kou********さん
2020/09/05 04:48

よく知らないものがなんですが 興味を惹かれたので読ませていただきました AIでは、書かれているように、与えられた大量のデータを学習することによって推論機構を最適化するが、人間ではそうではない、ということのようですね 人間が頭で最適解を考える、という場合、その人の知識、経験を動員してああしたらこうなる、ということをいろいろ考えて、まあ、このへんか、と決断する、のだと思います そういう時に、シナプスの最適化、とかいったことは起きるのでしょうか 起きるとしたら、何度も鉄火場を乗り越え、その結果、いろいろ、ごちゃごちゃ考えんでも、今回はこれで行ける、と即断できる、ように頭が整理されているときが、脳内が最適化されている、ということかなーと思います スポーツ、囲碁将棋、ポーカー、などの勝負事でも、初めはいろいろ考えて次の手を決めると思いますが、場数を踏むと、瞬時に次の一手、行動が考えるまもなく出てくる、と思いますが。それが、脳内が最適化されている、ということではないかと思いました すいません、わかりきったことを書いてしまいました


avatar
古今亭志ん生さん
2020/09/04 04:16

あまり理解していないガチ素人ですが。 サンプル数が少ないからじゃないかね? もしくは、現象が複雑すぎる、変化が早いとか。 「お金を儲けたい!」みたいな学習をしたいとすれば、機械的に学習させようとすると、選択肢がありすぎて、方向性を失ってしまう。 「彼女に好かれたい!」みたいな話だと、サンプル数が少なく、信頼性を保てない。 前やったことが、次も正しいとは限らないのが、自然という話かと。 生き残ってきたのは、個の優劣ではなく、運という説もあるので。(苦笑 なので、最適化しているのではなく、与えられた、もしくは行動した結果によって判断や強化(弱化)が起こるというシンプルな現象なのかと。 筋肉と同じで、トレーニングする筋肉は強く太くなり、刺激を与えない筋肉は弱くなるって、単純な仕組みなのかと。 最適化を行えてないから、間違った習慣とかもしてるんかとは思う。 まぁ、ガチ素人のお目汚しですが。

答え
avatar
ID非公開
2020/09/04 19:10

なるほど、ありがとうございます 最適化されないで習慣化されてるだけ!みたいのは自分もなんとなく思ったんですが、よくわからなくて それで回答いただいて何となく質問がさらにまとまったのですが

avatar
ID非公開
2020/09/04 19:11

①人間は理性や意識によって習慣をより生存に適したものに最適化しようとしている。これが強化学習といえるのかもしれないですが、回答者様のおっしゃるように現象が複雑すぎたり、サンプルが少なかったりして本当に最適化できるかどうかは不明です。それは別として一生懸命しようと努力はしてるはず。これをシナプスとニューロンの動作まで還元すると、どのように動いてるのか?という疑問

avatar
ID非公開
2020/09/04 19:11

②とりあえず行動を習慣化することについて。例えばアルファ碁とかなら現在の局面を入力。それに対応したプロの手のデータを出力として教師あり学習を行う。これにバックプロパゲーションを使う。つまりある入力に対してある出力を無条件に習慣化するためにバックプロパゲーションが必要なのかとつまり入力に対する出力を習慣として最適化する、みたいなことです。プロの手は無条件に正解という前提があっての学習なので、教師あり学習というのでしょう。で、人間は入力に対する出力全ての行動をランダムにしてるわけじゃないっぽいので習慣の最適化というのはしてると思うのです。これをバックプロパゲーションを使わずにどうやって行なっているのか? とりあえずは①は置いといて

avatar
ID非公開
2020/09/04 19:11

②が回答者様の、おっしゃるような使った筋肉が強化されるような盲目的な習慣化だけで説明できるのかな?と 人間にはバックプロパゲーションがないので、①がないと②も出来ない つまり①を解明しないといけない、ということでしょうかね?

avatar
ID非公開
2020/09/04 19:13

うーんと、すいません^^;わからなすぎて書いてて自分でも何を聞いてるのかまたわからなくなってきました