私は個人的な興味関心から、人間の脳の神経ネットワークのように柔軟に学習出来る人工知能を作れるだろうかと思い、これについて実験を繰り返しています。
詳細は秘密ですが、人間の脳神経細胞の学習の仕組みに関する要素を幾つか取り入れており、既存の主流の方法とは異なって微分をせず、誤差逆伝播法を用いず、オプティマイザーを使用しません。
研究開発にあたりチャット生成AIサーヴィスであるChatGPT with GPT-4oと対話をして以下のスクリーンショット画像のように助言を得る事もあります。
開発に成功するかどうかは分かりませんが、少なくともこの取り組みは知能の仕組みを理解する上では非常に役立ちます。
上記スクリーンショット画像でAIエージェントに学習させようとしているのは難しい遅延報酬課題。
AIエージェントが錘付きばね振り子を左右に移動させる事によって振り子を振り上げて倒立させるのが目的。
ばね振り子なので振動する。
物理シミュレーションは正確性よりも安定性の為に、explicitなEuler法。
コメント