制御理論研究委員会 終了企画 講演会「学習理論と制御」

制御工学は横断的な側面を持っており、ロボティクス、最適化やソフトコンピューティングなど様々な研究領域と密接な関係を持っています。この講演会では、制御工学にも関連の深い学習理論に携わる著名な先生方をお招きし、最先端の研究成果についてわかりやすく解説していただきます。幅広い分野の方々の御参加をお待ちしております。

主 催: 計測自動制御学会中部支部

日 時: 2006年12月26日(火) 13:15〜17:30

会 場: 名古屋大学工学部 IB館2F IB大講義室
 (http://www.nagoya-u.ac.jp/out/campusmap.html#higashiyama)

時 間: 13:15-14:30
講 師: 岩田一貴 先生 (広島市立大学)
題 目: 強化学習における大偏差理論の応用
概 要: エージェントが,ある与えられたタスクに関して最適な政策(行動選択の方法)を学習するような強化学習の枠組みを考える.エージェントとは,具体的なタスクにおいて,知能ロボットや制御器などに相当し,枠組みとはエージェントと環境の相互作用をモデル化したものである.その枠組みが従う確率過程としては,Temporal Difference学習などの代表的な強化学習アルゴリズムが適用し易いなどの理由から,マルコフ決定過程がよく知られている.
発表では,初めにマルコフ決定過程が一時的に定常エルゴードと見なせる場合の大偏差理論をわかりやすく説明し,その結果,強化学習においてどのように収益が最大化されるのかを明らかにする.また,マルコフ決定過程が定常エルゴードとならない場合にはどうなるのかを考察する.

時 間: 14:45-16:00
講 師: 池田和司 先生 (京都大学)
題 目: サポートベクトルマシンの学習曲線
概 要: サポートベクトルマシン (SVM) はカーネル法とマージン最大化に基づく学習モデルであり,高い汎化能力を持つことで知られ,パターン認識やシステム同定など,その応用はますます広がっている.
本講演では SVM について概説し,そのパラメータ設定が汎化能力に与える影響について最近の研究成果を紹介する.なおここでは,従来の統計的学習理論で用いられる汎化誤差の上限ではなく,より現実的な振る舞いを示す平均汎化誤差を汎化能力の評価基準として用いる.

時 間: 16:15-17:30
講 師: 田中利幸 先生 (京都大学)
題 目: ランダム行列の漸近固有値分布とレプリカ法
概 要: 行列の値をとる確率変数をランダム行列という.ランダム行列の固有値はやはり確率変数であり,固有値の経験分布は確率測度の値をとる確率変数である.ところが,行列のサイズを無限大とする極限において固有値の経験分布がある極限分布に漸近するようなランダム行列のアンサンブルがいくつか知られている.
本講演では,ランダム行列の漸近固有値分布に関する古典的な結果の紹介と,結果の導出に適用可能な発見的な解析手法のひとつであるレプリカ法とについて概説する.

参加費: 無料 (どなたでも御参加いただけます)

問合せ先: 名古屋大学大学院工学研究科 機械理工学専攻
 藤本健治 Tel/Fax: 052-789-3854


戻る