研究テーマ
深層学習に代表される機械学習技術が再注目されるようになって約10年が経ちました。近年では生成モデルや大規模言語モデル(LLMs)が大きな話題となり、急速に一般生活に普及してきています。
モチベーションをもって研究に取り組めるよう、教員との相談によって研究テーマを決めます。得られた成果は積極的に対外発表を行います。
- ・機械学習基礎 (主に機械学習技術にかかわる基礎要素の開発)
- ・Diffusion, Flowなどの生成AIそのもの、生成AIを活用した新しい技術の開発
- ・過学習抑制、半教師あり学習(少ないデータからの学習) など
- ・データの本質を表す低次元表現の獲得
- ・モデルの「説明性」を高めるための研究 「なぜ機械はそう判断したのか?」に対する答え
- ・農業分野への応用
- ・植物病自動診断システム (Deep Learningの応用研究ー農林水産省、24府県などとの受託研究、)
- ~自動診断、診断根拠の提示、実用システムの構築 <きゅうり、トマト、なす、いちご>
- ~上記に関連した各種研究 (少ないデータでの学習、過学習抑制、segmentationを含む適切な前処理開発 etc)
- ~広域の農場における病害作物の検出
- ~虫害の判定
- ・自然言語処理(NLP: Natural Language Processing)グループ
- ・機械学習を用いたテキスト処理の本質にかかわる基礎研究 ~どの部分がテキスト処理にとって重要なのか「解釈性」を高める、どのような低次元表現がいいのか etc.
- ・大規模言語モデル(LLMs)に対する基礎研究
- ・大規模言語モデル(LLMs)を活用した新しい価値の創造
- ・Character-level embedding (文字単位での処理)を用いた新しい言語処理モデルの構築
- ・画像と言語処理双方を活用した新しい価値の創造(視覚障碍者支援)
- ・セキュリティ応用(malware検出、web application firewallの作成など)
- ・医療分野への応用
- ・画像診断支援、早期発見、病勢定量 (皮膚がん<東京女子医科大学>、胃がん<東海大学医学部>)
- ・3次元脳MRI画像の類似画像検索(CBIR) (Johns Hopkins Universityとの共同研究)
- ~望ましい低次元表現の獲得、超解像、skull stripping等の前処理、標準化 etc.
近年、GPTやDiffusionなどに代表される生成AIという言葉が多く聞かれていると思います。これはいわゆる人工知能(AI)技術の一部として、私達の生活にも急激に広がってきています。
これまで人工知能の進化は昔予想されていたよりもずっと進化が遅かったのですが、2012年に新しい機械の学習アルゴリズムが再発見されたことで状況が一変しました。将棋や碁でコンピュータがプロを負かすだけではなく、認識の分野ではもはや人と同等、あるいは人がかなわない状況まで進歩を遂げています。あらゆる観測されるデータが、ある未知の確率に従って標本化された結果という考えに基づき、その未知の確率を求めるGANやFlow, Diffusionなどに代表される「生成モデル」の考えに基づく機械学習モデルは、もはや人では区別がつかないような高精細の画像や動画を作り出しています。文章生成、質問応答についてはChatGPT, GPT-4など説明が不要なほど普及しています。
いやとみ研ではMachine Learning(機械学習:深層学習を含む一般的にコンピュータを賢くするための手法)の基礎研究と応用研究の両方に取り組んでいます。応用例の1つに、植物の葉の写真をとるだけで何の病気にかかっているかを診断するというものがあります。現在キュウリのウイルス病については、全ての典型的なウイルス病気に対して実環境下で8割強の精度で識別を実現(2016年)しており、これは世界初の成果です。現在も農研機構(国の研究機関)などと共に実用的な診断手法の開発を行っています。
また、医療分野の研究では、極めて悪性度の高い皮膚がんである悪性黒色腫の自動診断支援に取り組んできました。悪性黒色腫は、メラノーマとも呼ばれ、「ほくろに似たガン」として知っている人もいるかと思います。自覚症状がなく、進行が速いことから、残念ながら気がつかないうちに取り返しのつかなくなるケースが多いのが現状です。そのため早期発見が重要なのですが、熟練の皮膚科医が専用の機器を用いて診断しても診断精度は8割程度と言われています。 「どうせやるなら、インターネット上にシステムを載せて誰でも利用できる『本当に役に立つ』システムを作ろう」という目標をたて、高精度のシステムを構築し12年間にわたり、世界中の皮膚科医に自動診断支援システムを提供してきました(慶應義塾大学医学部、東京女子医科大学)。また、米国Johns Hopkins Universityと共同で、3次元脳MRI画像を対象とした新しい類似症例検索システム構築や、胃がんの診断に関する研究(東海大学医学部)なども行っています。脳MRIの類似症例検索は多岐にわたる先端的な分野を内包しており、直近で開発したMR画像から脳領域のみを抽出する技術では、世界最高水準の性能をこれまでより1/10程度の学習画像数と実行時間で実現しています。
近年世界的に活発な研究が行われている自然言語処理(NLP)の研究も行っています。日本語や中国語、アラビア語など、非アルファベット言語に対して文字列を画像として扱う独自の視点の研究で、数々の成果を出してきました。モデルの頑健性(未知のデータに対する本質的な精度)と説明可能性の両立は機械学習技術で大変大事な要素でありNLP分野においても例外ではありません。私達は様々な基礎研究ならびに、企業と連携してどのような広告が購買に結びつくのかの予測などの応用研究など、幅広く研究しています。またmalware検知などのセキュリティ分野への応用も行っています。
最新のDiffusion modelsやGPTなどの大規模言語モデル(LLMs)そのもの、またそれらを活用した応用研究も行っています。
詳細は研究紹介のスライドをご覧ください。(2022年末までのものですが)