HOME
【工場DX】予知保全に最適なAIを見極めるアルゴリズム選択の勘所

生産現場予知保全・品質改善

【工場DX】予知保全に最適なAIを見極める
アルゴリズム選択の勘所

予知保全で使用するデータとは
時系列データの特徴
機械学習とディープラーニング
予知保全のアルゴリズム選択

予知保全に最適なAIとは？第1弾 “アルゴリズム選択の勘所”

現在、様々な分野で活用が進んでいるAI。製造業の現場では、設備の状態監視の強化として予知保全を実現するためにAIの活用が検討されています。AIには、従来の機械学習と深層学習（ディープラーニング）があります。「画像データでは、ディープラーニングの活用例が多くみられるが、センサーデータやログデータのような時系列データでもディープラーニングが最良な選択肢なのか？」という疑問をよく耳にします。予知保全への利用は従来の機械学習とディープラーニングのどちらを選択するのがよいのでしょうか。

本特集では、そんな疑問に対してデータの視点、アルゴリズムの視点、使い勝手の視点など、実際のデータ検証も踏まえ、3回に分けてお答えします。第1弾は、「アルゴリズム選択の勘所」です。

第1弾：「アルゴリズム選択の勘所」
第2弾：「データ検証によるコスト比較」
第3弾：「AIの実導入における課題とソリューション」

予知保全で使用するデータとは

実業務でのAI活用を検討するには、扱うデータを理解し特徴を捉えることがとても重要です。昨今活用が進んでいるAI技術であるディープラーニングは、画像の物体認識の例が取り上げられることが多いですが、予知保全の領域ではどのようなデータを扱うことが多いでしょうか？

予知保全においては、主に設備や装置に取り付けたセンサーから取得した「時系列データ」を扱います。

例えば、振動センサーであればXYZ軸の値の3種類、温度センサーであれば、温度値の1種類のデータで状態を表します。また、予知保全のゴールは、設備の状態が「正常かどうか」を捉えることです。つまり、判断したいものが「正常」と「異常」の２種類の非常に少ないデータと言えます。

予知保全のデータ

一方、画像の物体認識においては、画像データをピクセル単位に分割し、色情報をRGB値のマトリクス情報に変換した大量のデータを扱う必要があります。また、画像に映っているものが何かを判断するため、判断したいものが多岐に渡り、膨大な数となります。

物体認識のデータ

つまり、予知保全で扱う時系列データは物体認識と比較すると、読み取るデータの種類と判断したいことの種類が非常に少ないデータと言えます。

時系列データの特徴

時系列データには、一定時間で規則性があるという特徴があります。そのため、見るべきポイントを人がある程度決めやすいデータになります。この規則性に注目すると、周期や周波数、振幅、値の平均やばらつき方等、旧来の数学や統計的手法で特徴を数値化することができます。

時系列データの特徴抽出方法

一方で、画像の物体認識の例ではどうでしょうか？画像データの特徴を捉えるには、画像の線や角度、色の特徴を抽出して数値化し、各画像に似た箇所がないかを比較します。例えば、動物を認識したい場合は、「耳」や「目」の形状を特徴として抽出し、数値化します。しかし、少量のデータでは例外を捉えにくく(ex.狼の画像を犬と認識してしまう)、特徴を捉えるには大量のデータが必要になります。また、画像データでは、画像ごとに角度のや画像の欠けなどの違いがあるため、より規則性が乏しくなります。

画像データの特徴抽出方法

機械学習とディープラーニング

時系列データを活用してAIを実装するには、大きく分けて従来の機械学習とディープラーニングの２種類のアルゴリズムがあります。２つの最も大きな違いは「特徴を捉えること（特徴抽出）」を人が行うかどうかです。従来の機械学習では、特徴抽出は人が行い、その結果をもとに機械がデータの学習を行います。このため、特徴抽出を人が行いやすく、取得できるデータ量が少ないデータが向いています。ディープラーニングでは、機械自身が特徴そのものを学習します。そのため、人が特徴抽出を行うことが難しく、大量データを取得できるようなデータに向いています。

【従来の機械学習】

従来の機械学習

【ディープラーニング】

ディープラーニング

そのほかに、従来の機械学習とディープラーニングには、主に以下の表のような違いがあります。

比較表

では、この違いをAIを導入する際のコストバランスの視点で比較してみましょう。

従来の機械学習は、特徴抽出を人が行うため、その設計と調整にコストがかかる傾向があります。一方、ディープラーニングは、機械が学習する範囲がより広いため、学習モデルの開発や精度改善のコストが大きくなります。また、大量データを扱う必要があることから、高い計算処理能力を求められます。

これらをトータルで見ると、ディープラーニングの方がよりコストがかかる傾向にあります。

【従来の機械学習とディープラーニングのコストバランス比較】

従来の機械学習とディープラーニングのコストバランス比較

予知保全のアルゴリズム選択

従来の機械学習とディープラーニングのどちらのアルゴリズムを選択すべきかは、扱うデータの特徴や解決したい業務課題の内容、誰がデータを取得してAIを使うかによっても異なってきますので、アルゴリズムの適性を見極めることが重要です。

予知保全においては、データの特徴を人が捉えられることが多く、取得できるデータ量も少ないケースが多くあります。そのため、コストバランスの視点では、従来の機械学習の手法でも十分に業務課題の解決が可能なケースが多いと考えられます。

【1. 現場業務とデータの理解】

予知保全の領域でAIを適用したい現場の業務において、どのような特徴のデータを取得できるか、どの程度のデータ量を取得できるかを理解し、明確にすることが重要です。予知保全の領域のデータは他の領域と比較すると、規則性を捉えやすい特徴があり、データ量は少ない傾向にあります。

【2. アルゴリズムの適性】

従来の機械学習とディープラーニングのいずれのアルゴリズムにおいても、両者の特徴や違い、コストバランスを理解した上で、アルゴリズムを選択することが重要です。また、併せて現場の業務や取得したデータについて理解している必要があります。一般的に、従来の機械学習よりもディープラーニングの方が、トータルのコストがかかる傾向にあります。

【3. 対象ユーザー】

業務のどのような関係者がデータを取得し、AIを導入、利用するかという視点も大切です。これらの作業には工数を要しますので、工数を適切に見積もる必要があります。また、実際の運用においては、データ分析担当者だけでなく、現場の業務担当者も扱うことを求められることが多いため、ユーザーが理解しやすく、業務で扱いやすいものであることが必要です。

第２弾では、実際に時系列データで従来の機械学習とディープラーニングのアルゴリズムを使っての検証を行います。ご期待ください。

【工場DX】予知保全に最適なAIを見極める アルゴリズム選択の勘所