研究室概要
2011年度に新設された研究室です。
博士課程院生募集
グーグル:東大で「青田買い」(2015年04月02日/毎日新聞)
米IT大手グーグルの役員ら約40人が東京大学の本郷キャンパスを訪ね、人工知能(AI)を研究する大学院生らのリクルートを始めたのは数年前のことだ。学生たちに提示した条件は年収約15万ドル(約1800万円)で、日本のサラリーマンの平均年収の4倍以上。
この人工知能という中にビジョンや機械学習は含まれます。早稲田のトップの学生は東大のトップ学生にも負けません。ただ博士課程に行く人は少なく、多くの優秀な学生は低い給料で日本の企業に就職していきます。15万ドルというと高そうですが、優秀であれば数年ですぐに20万ドルを超えるでしょう。 早稲田のトップの学生は、真剣に博士課程進学を考えるべきです。
外部からの博士課程入学者も募集中です。早稲田大学大学院基幹理工学研究科情報理工学専攻では博士課程の院生は授業料が実質かからず、さらに優秀者は在学中に助手になれる制度もあります。興味のある方は石川までご連絡ください。バックグラウンドとしては、修士までにビジョンの研究をしてきた方はもちろん、数学、物理、電気電子出身の方も募集します。
リーディング大学院プログラム
また、現在学部生の方は、修士課程に入る代わりに5年一貫制の博士課程教育リーディングプログラム 実体情報学博士プログラムに入ることを勧めます。最大で月額20万円の奨励金や「海外英語研修」「海外インターンシップ(6ヶ月間)」に必要な経費の全額、プログラム3~5年の学生に対しては研究内容に応じて研究費も支給される他に、早い時期から国内外を含めた企業および研究機関との接触の機会が得られ、企業・研究機関とのより深い交流に基づく就職の機会が増大し、多様なキャリアパスが選択可能となります。
プロジェクト研究募集
情報理工学科3年生のプロジェクト研究は、ある程度の先端知識を3年次において備えておくことができるだけでなく、今後の高い専門性の道筋をつけることができる科目です。特にコンピュータービジョンのような情報理工学の応用分野については、3年次までに得られる情報が少ないので、当研究室では3年生のプロジェクト研究による参加を歓迎しています。興味があれば一度石川に相談して下さい。
研究内容
研究の中心はコンピュータービジョンとパターン解析 (Computer Vision and Pattern Analysis) です。以下は主に当研究室に来ることを考えている学生の皆さん向けの紹介です。
コンピュータービジョン
最近ではロボットが進歩しているのになぜ、家で掃除をしたり皿を洗ったりしてくれるロボットがないのでしょうか。それはロボットに十分な視覚がないからです。右の図は白黒画像を各点の明るさのグラフとしたものです。何だか判りますか?
人間にとって視覚は最も自然な知覚であり、画像に映っている情景を理解することにあまりに慣れてしまっていますから、これを機械で実現するのがいかに難しいかということが、なかなか想像しにくいものです。
画像は普通、長方形上の各点に色が指定されているものですが、これを色として表示せず、データとして見ると、視覚という、画像を画像として見る能力を使わずに理解しなければならないので、人間にとっても認識は難しくなります。機械に画像を認識させるということは、このようなデータを相手に、有用な情報を引き出すアルゴリズムを開発するということです。
人間のような視覚を機械に持たせることがコンピュータービジョンの目標ですが、その目標にはまだまだ遠く、いくつものブレイクスルーが必要です。我々研究者はそれを目指して、「難しいが、楽しい」研究をしています。それに加わってブレイクスルーを起こしてやろうという方をお待ちしています。
パターン解析
様々なパターンを画像中に見つけるために、より一般にパターンとは何かという根本的な問題から、確率モデルを考え、またグラフを使った最適化等の手法を使います。難しいことを考えること、理論・数学寄りのことが好きな方にもおもしろい研究が可能です。
2014年度から、科学技術振興機構(JST)の戦略的創造研究推進事業CREST「現代の数理科学と連携するモデリング手法の構築」領域に採択され、認識の数理モデルと高階・多層確率場による高次元実データ解析という研究プロジェクトで、「認識」現象の数理モデルの構築と、その高次元実データのより高度な解析を通じた実証をめざして研究しています。
応用
人間並とはいかなくても、画像を解析・認識することの応用は盛んに研究され、実際に活用されています。例えば:
- 重要な応用として医用画像処理があります。最近、CT, MRI等の解像度が上がり、得られるデータ量が増えており、それを適切に解析し診断等に十分活用することが、人手だけではだんだん難しくなっています。そこで人間を支援するためにビジョン技術が必要です。
- 一般の画像を認識するという点では機械は人間に遠く及びませんが、細かいことを解析するのは得意です。例えば非常にごちゃごちゃした画像の中から特定の形を探すとか、その数を数えるとか、画像から正確な空間的関係を読み取る等です。
- 写真中に顔を見つけて明るくするとか、肌をきれいに見せる等の、デジカメに内蔵される機能の多くがビジョン技術です。 また、今やコンピューターといってもいい薄型テレビなどのデジタル家電にも、例えば超解像などのビジョン技術が生かされています。
これらの応用に向けた研究を、学生の希望に応じて立ち上げていく予定です。