- HOME
- 【画像処理マスターへの道】 研究トレンド最前線 ~ブレイク直前の技術を先取り!~
装置メーカー 画像処理ソフト
【画像処理マスターへの道】
研究トレンド最前線 ~ブレイク直前の技術を先取り!~
画像処理に関するさまざまな情報をお届けする連載です。
前回の記事では画像処理ライブラリの中から照度差ステレオをクローズアップしてお届けしました。今回は画像処理研究の最前線の動向をご紹介します。
※先日開催されたSSII2025(第31回画像センシングシンポジウム、開催日:2025年5月28日~30日)に参加してきたエンジニア2名へのインタビュー形式です。
学会との関係、最近の活動
学会に参加するようになった経緯
実用化された研究から学ぶため、毎年開催されるSSIIやViEW、DIA、PVIなどの学術講演会に継続的に参加しています。
ViEWとDIAの運営はIAIP(精密工学会 画像応用技術専門委員会)で、SSIIの運営は画像センシング技術研究会ですがIAIPとメンバーが重なるところも多いので、IAIPに関連する学術講演会への参加が多くなっています。
また、学会の運営側と知り合いだったことからお手伝いをするようになり、今では運営委員としてのお仕事もお手伝いするようになっています。
直近では、隔月で開催されている研究会の講師依頼の選定会議への参加や、学術講演会の運営チームとしてViEW2024のオンライン配信担当のプログラムの幹事補佐などの活動をしています。
それぞれの学会の特徴
SSIIはセンシングへの関心が強い傾向があります。特にチュートリアルセッションに力を入れていて、最近のトピックに感度が高い印象があります。
ViEWは実利用への関心が強い傾向があります。特に特別講演に力を入れていて、異業種からの講演者が招待されることも多く、カテゴリ横断の新たな刺激を得られやすい印象があります。
運営としても参加者にとって有意義なものとなるようにチュートリアルセッションや特別講演などの工夫を凝らされています。
学会の現地開催への回帰
コロナ禍中はオンラインでの開催となっていましたが、その後はハイブリッド開催、現在は現地開催に戻りつつあります。
オンライン開催が費用面でそこまで優位でもなかったこともありますが、特に、パネル発表での対面ならではのインタラクティブな発表者との会話のメリットが現地開催の魅力です。
現地開催のもう一つの魅力は、懇親会かもしれません。リラックスできる環境で話しやすく、同じ学会に参加している仲間意識も働いて、深い議論をしやすい貴重な場です。
「あのブースで発表されていた内容について質問しそびれたことがありまして」、などと話しかけるのがオススメです。
論文と共同研究
研究のきっかけは現場の課題なので、企業の方の特に現場の方からの課題の相談というのは、学会の先生方からも歓迎するところです。研究費の面でも共同研究というのは歓迎されるようです。
「ドメイン固有な現場課題を解決できる」という企業側の利益と、「その背景から普遍的な手法や理論の発展などを見出して論文に繋げられる」という、研究者側の利益が両立されて、画像処理技術とその実利用が両輪で発展していくのが理想です。
近年の当社の論文では、フラットパネル検査でのAI活用について、ViEW2019に “ディスプレイ画質検査におけるAI応用” などがあります。「ルールベースで検出はできるが、分類までは難しい欠陥を分類したい」という現場の課題を、AI(深層学習)を活用することで解決している現在の方法の実証実験初期のものです。
こうして検証された技術が製品に活かされています。
研究トレンドの変遷、最新の動向
トレンドの変遷
学会参加を始めた頃は、研究者が画像から何らかの特徴を数値化した特徴量(ハンドクラフトの特徴量、SIFTやSURF、HoG特徴量など)を手作業で作り込んでいました。少ない計算リソースの中でできることを探るため、問題設定をいかに単純化するかという技量が必要な時代でもありました。
さらに発展したJoint HoG特徴量などが登場すると、得られた特徴量は膨大でハンドクラフトでの処理が追いつかなくなったため、SVMやAdaBoostなどの古典的な機械学習の手法が用いられるようになりました。
現在のAI(深層学習)の基本となるCNN(畳み込みニューラルネットワーク)が脚光を浴びたのは2012-2013年頃ですが、当初は研究者たちからも「そこまでひっくり返る?」と懐疑的に見られていました。2014年頃もまだ「キャッチアップはしたが仕事に使うレベルではない」という状況でした。
その後に、まずは「使ってみた」という内容の論文が盛り上がり、次は「中身を解き明かす」という内容にシフトしていき、そして今では「道具としてCNNを使う」というところまで普及してきています。ハンドクラフト特徴量の代用としてのCNNの特徴ベクトルの活用や、解析的に解ける計算の近似解へのCNNの活用などの使われ方です。
CNN以降に登場した技術の論文の内容を見てみると、Vision Transformer(ViT、2021年頃に登場)はまだ「使ってみた」が多く、LLM(大規模言語モデル)はまだ「使ってみた」の中でもうまくいっていないものも多いです。
CNNが現在のように普及するまでには、登場から約10年は掛かっています。ViTやLLMが「どう仕事に使うか」までにはまだあと数年は掛かりそうです。
最前線の研究動向
SSII2025の中から、CNNは「どう仕事に使うか」という論文をいくつか紹介します。
一つ目は「法線方向で色が変わる照明を作り、その後処理の偏微分方程式を解く部分にDNNを使う」という論文(IS1-15)です。偏微分方程式を解析的に解くのではなくてDNNで近似解を得るというのが、まさに道具らしい使い方です。
二つ目は「アノマリー検出の特徴量取得に使用される学習済みCNNを最適化する」という論文(IS3-32)です。アノマリー検出はハンドクラフト特徴量をCNNの特徴ベクトルで代替しているという見方もできます。仕事で使う上では、一般的なImageNetデータセットを学習したものよりも特定の対象物に最適化したいというモチベーションがあります。
三つ目は「Active Shape Modelが微分可能なことに着目して誤差逆伝播で高精度化する」という論文(IS3-13)です。CNNの「微分可能であれば誤差逆伝播で学習できる」という理論的な背景を応用しています。
LLMを使用した論文では、自動運転トレーニング用の動画を作るソースコードをGPT-4oを活用して作るという論文(IS2-28)もありました。そのまま使うにはまだまだ発展途上な面もありますが、プログラミング支援という活用方法がこれからの研究を大きく加速させる未来はもうやってきているのかもしれません。
また、シミュレータの近似にpix2pixを活用している論文(IS2-15)もあり、GAN(Generative Adversaral Networks)も道具として使われるようになってきている印象です。
複数の視点画像を3D化する三次元再構成技術であるNeRF(Neural Radiance Fields)や3DGS(3D Gaussian Splatting)なども多く見られ、3D CADやアニメーションなどの業界だけでなくてFA業界にも受け入れられつつあるようです。
決してルールベースの論文がもう無くなったわけではなく、「ルールベースの二値化で検出できるようにするために撮像を工夫する」という論文(IS2-33)もありました。
圧縮センシング関連ではレンズレスカメラやシングルピクセルカメラなどの論文もあり、画像処理というシステム全体で考えるとSSIIの特徴であるセンシングの部分にもまだまだ可能性が眠っていることを感じさせられます。