POINT 1ビッグデータ不要の
スパースモデリング技術
AIと聞くとディープラーニング、ビッグデータというキーワードを思い浮かべる人は多いでしょう。しかし「検討したものの、ビッグデータを集められない」とAIの利用を断念したという課題も耳にします。
HACARUSのAI・スパースモデリングなら、少量データでも高精度の成果を得られます。
ビッグデータがないからとあきらめる必要はありません。
AIと聞くとディープラーニング、ビッグデータというキーワードを思い浮かべる人は多いでしょう。しかし「検討したものの、ビッグデータを集められない」とAIの利用を断念したという課題も耳にします。
HACARUSのAI・スパースモデリングなら、少量データでも高精度の成果を得られます。
ビッグデータがないからとあきらめる必要はありません。
ビジネスであれ、医療であれ「なぜそうなったか」を説明できることはとても大切です。しかし、ディープラーニングを活用したAIでは「結果が出るが、なぜそうなったか」を説明できません。
HACARUSのスパースモデリングなら、その根拠もフィードバック。「知」が見える化されることで、次の展開への応用も期待できます。
ビッグデータを扱うAIは、膨大なデータ処理のための高性能システムが必要で、電力消費も多く、気軽にできるものではありません。
HACARUSのAIは、少ないデータの取り扱いで済むため低負荷。そのため、お客さまの既存環境で実行できることも少なくありません。クラウドベースとオンプレミスともに提供実績があります。
「スパースモデリング」は、約25年の歴史を持つ技術です。始まりは諸説ありますが、スタンフォード大学のRobert Tibshirani教授がLASSOを提唱したことによって、データサイエンスなどの分野で広く認知されるようになりました。
この間、アカデミアでは研究が進みましたが、ビジネスでの実践・応用例はまだまだ少ないと言わざるを得ません。
HACARUSでは、研究機関との共同開発はもちろん、ビジネスパートナーとのアプリケーション開発などにも力を入れ、実績を積み重ねてきています。
Year | Publication |
---|---|
1995 | Sparse Coding of Natural Images Produces Localized, Oriented, Bandpass Receptive FieldsB.Olshausen and D.Field |
1996 | Regression Shrinkage and Selection via the LassoR. Tibshirani |
2006 | Compressed SensingD.L. Donoho |
2018 | Multi-Layer Convolutional Sparse Modeling: Pursuit and Dictionary LearningJ.Sulam. et al. |
ここで、スパースモデリングの優位性を示した事例を一つ紹介します。AIによる太陽電池の不具合検査での性能比較です。ディープラーニングと比較した時の結果が、表に示されています。
学習量、学習時間、精度など、その多くでスパースモデリングが好成績を出しました。このようにディープラーニングの導入が必ずしも十分な成果を出せない時に、スパースモデリングがうまくはまることもあります。
学習量が少なくて済むことから、IoTなどのエッジ端末など、クラウド非接続のスタンドアロン機器での活用も期待できます。
SVM | CNN | スパースモデリング | |
---|---|---|---|
学習データ量 | 800枚 | 800枚 | 60枚 |
学習時間 | 30分 | 5時間 | 19秒 |
推論時間 | 8分 | 20秒 | 10秒 |
精度 | 85% | 86% | 90% |
大区分 | 中区分 | ディープラーニング | スパースモデリング |
---|---|---|---|
学習データ | 必要データ | 学習のための教師データが大量に必要 | 学習のための教師データが少量あれば良い |
学習時間 | 大量データに全量解析をさせるため長時間必要 | 少量データに対して、事前の重み付けをして解析させるため短時間で済む | |
推論時間 | 普通(学習と推論でクラウド利用の場合は通信によるタイムラグが発生) | 短い(エッジ環境での動作も可能で高速) | |
動作環境 | 動作環境 | クラウド・GPUが必要 | (クラウド・GPUはもちろん)CPUやチップでもOK |
ハード投資 | 高額な初期投資やランニングコストが必要になる場合がある | ハードへの投資が極めて少なくて済む | |
通信コスト | クラウド運用の場合には通信コストが必要 | エッジ環境での利用では通信コストがかからない | |
情報セキュリティ | クラウド利用の場合にはネットワークに各種情報を上げる必要がある | エッジ・デバイス上で学習と推論まで完結させることができるため、ネットワークへ情報を上げる必要がない | |
説明可能性 | 結果に対する 説明可能性 |
乏しい(ブラック・ボックス問題) | AIの振る舞いに対する因果関係を説明しやすい |
構築 | 事前準備 | 出来合いのモデルがある場合には少ない準備で学習を始めることができる | 検証対象に対する知見をモデルに反映させる事前の作り込みが必要 |
下の図は、観測データ(x)から、推測したトレンド(緑線)を示します。
80%程度データが欠損していてもおおむねトレンドが推定できていることがわかります。
下の図は、オリジナルの画像(a)を、50%欠損させ(b)、その50%欠損させた画像が修復させた例(c)。
オリジナルとまではいかないものの、それが何を示すのか判断できる程度には修復できています。
下の図は、オリジナルの画像(a)を、50%解像度を劣化させ(b)、その50%劣化させた画像を元に、高解像処理をした画像の例(c)。
オリジナル画像までとはいかないものの、特徴を捉えるのに有効な画像になっています。
2019年4月、ブラックホールの姿が補足されたニュースが全世界に発信されました。史上初の快挙を覚えていらっしゃる方も多いでしょう。しかし、あの美しい漆黒の円形画像は、実は(といいますか当然ながら)光学的に撮影された像ではありません。
不鮮明ながらも撮影された像と観測データからAIが導き出した像であり、そのAI技術には、HACARUSも採用するスパースモデリングが使われています。
ITエンジニアのためのスパースモデリング入門(HACARUSのメンバーが分担執筆)
第1回 | 機械学習プロジェクトにおける課題と、スパースモデリングに期待が高まる背景 https://codezine.jp/article/detail/10957 |
---|---|
第2回 | スパースモデリングはなぜ生まれたか? 代表的なアルゴリズム「LASSO」の登場 https://codezine.jp/article/detail/11148 |
第3回 | スパースモデリングのモデルを評価する~LASSO推定値の評価方法 https://codezine.jp/article/detail/11593 |
第4回 | スパースモデリングの画像処理への応用~画像の再構成とノイズ除去 https://codezine.jp/article/detail/11823 |
第5回 | スパースモデリングの画像処理への発展的な応用~欠損補間、異常検知、超解像 https://codezine.jp/article/detail/12433 |
第6回 | 最先端のスパースモデリング~HMLassoとPliable Lasso~ https://codezine.jp/article/detail/12662 |