2021年9月10日金曜日

AI・MLに分散アナリティクスが最適な理由とは

 

(画像:everything possible/Shutterstock.com

 

「アナリティクス」、または「解析」とは、データに潜む関係性を発見し、解釈し、より有意な情報を引き出すことを意味する一般用語です。アナリティクスのアルゴリズムには、データの削減や、センサ測定値の平均化のような単純なものから、高度な人工知能(AI)や機械学習(ML)システムのような複雑なものまで幅広くあります。今日、柔軟性とコスト効率が最も優れていることから、アナリティクスは一般的にクラウドで行われています。しかし、将来的には、レイテンシ、ネットワーク帯域、セキュリティ、信頼性の向上に向けて、アナリティクスがクラウドだけでなく、エッジコンピューティングやエンドポイントデバイスにまで分散されてゆくことが予測されます。ここでは、従来のクラウドの枠を超えてアナリティクスを分散させるアーキテクチャとそのトレードオフについて解説します。

 

分散アナリティクスの利点とは?

単純なアナリティクスでは、データの削減、関連付け、平均化が行われ、その結果得られる出力データストリームは入力データよりもはるかに小さくなります。大きなビルの水道供給システムを例に考えてみましょう。ポンプを最適化し、水の使用量を監視するには、システムのさまざまなポイントでの圧力や流量を把握することが重要です。そのためには、配水管の周りに多くの圧力センサと流量センサを配置しなければなりません。ソフトウェアは定期的にセンサを確認して、ポンプの設定を調整し、ビル管理者に使用量のレポートを作成します。しかし、センサからの生の測定値は、例えば、トイレの水洗時に生じる一時的な水圧の低下のように、誤解を招くデータである可能性があります。そこでアナリティクス・アルゴリズムが、センサの長期間にわたる測定値を平均化し、複数のセンサからの測定値を統合し、関連付けることによって、配水管の状態についてより正確で有用な情報が把握できます。これらの測定値をすべてクラウドに送ってアナリティクスを行うこともできますが、むしろセンサ自身が平均化を行い、ローカルのエッジコンピュータが関連付けやレポーティングを行ったほうが、はるかに効率的なアーキテクチャになります。これが分散アナリティクスと呼ばれるもので、これにより、多くの解析システムの効率性、精度、コスト効率を向上させることができます。

人工知能(AI)や機械学習(ML)の技術が使用されている場合、アナリティクスはもっと複雑になります。AI/MLは通常、次の2つのフェーズで行われます。

  • 大量のデータを抽出してAI/MLシステムのモデルを作成するモデル構築フェーズ
  • システム内のデータにそのモデルを適用し、リアルタイムで結果を生成する推論フェーズ

 

今日のシステムでは、AI/MLモデルはほとんど大型のサーバーファームかクラウドで構築され、その多くがオフラインプロセスで行われます。そして、AI/MLモデルが構築されると、圧縮されて別のシステムに送られ、そのシステムでライブデータを使ってモデルの推論フェーズを実行し、結果を出力します。推論フェーズはクラウド上で実行できますが、最近ではレイテンシ、ネットワーク帯域、信頼性、セキュリティを向上させるためにエッジに移行してきています。各フェーズ使用するコンピューティングリソースのレベルを決定する際には、トレードオフについて十分検討する必要があります

 

AI/MLの推論フェーズ

AI/MLの推論フェーズは、複数のピアレベルのプロセッサ間や異なる処理階層に分散させることが比較的簡単です。モデルが事前に計算されていれば、AI/MLアルゴリズムが処理するデータは複数のプロセッサに分割し、並行処理できます。作業負荷を複数のピアレベルのプロセッサに分散させることにより、作業負荷が増えてもコンピューティングリソースをさらに投入できるため、容量、パフォーマンス、スケールにおいて利点があります。また、1つのプロセッサが障害を起こしても、別のプロセッサが作業を完了させることができるので、システムの信頼性も向上します。推論も複数の階層レベルに分散させることができ、アルゴリズムの各部分をプロセッサの異なるレベルで実行することも可能です。これにより、AI/MLアルゴリズムは論理的に分割され、階層の各レベルはアルゴリズムの最も効率的なサブセットを実行することが可能になります。例えば、ビデオアナリティックスAI/MLシステムでは、ビデオカメラに搭載されたインテリジェンスが適応コントラスト増強処理を行い、そのデータをエッジコンピュータに渡して特徴抽出を行います。さらにそれを近くのデータセンターに送ってオブジェクト認識を行い、最終的に、クラウドが脅威の検出やヒートマップの生成などの高次元な機能を実行するのです。これは極めて効率的なパーティショニングであると言えます。

 

AI/MLアルゴリズムの学習フェーズ

それに対して、AI/MLアルゴリズムの学習フェーズは、分散が難しくなります。問題はコンテキストの大きさです。モデルを作成するために、AI/MLシステムは大量の学習データを取得し、それをさまざまな学習フェーズアルゴリズムで解析して、推論フェーズで比較的簡単に実行できるモデルを生成します。あるコンピュートノードで学習データの一部しか利用できない場合、アルゴリズムはモデルの一般化が困難になります。そのため、ほとんどの場合、学習はメモリやストレージに事実上制限のないクラウド上で行われます。ただし、シナリオによっては、学習アルゴリズムを複数のピアレベルのコンピュートノード、またはクラウドからエッジまでの各階層に分散させなければならない場合もあります。特に、エッジで学習を行えば、近くのセンサから多くの学習データを収集し、クラウドを使わずにそれを処理する学習プロセスが可能になるため、レイテンシ、信頼性、セキュリティ、ネットワーク帯域が向上します。このような課題に対応できるよう、高度な分散型学習アルゴリズムが現在開発中です。

 

まとめ

人工知能と機械学習は、今後、ほぼすべての電子システムに欠かせない機能になります。システムの推論・学習機能をコンピューティングリソースの各階層にどのように分散すればいいのかを把握することが、今後の成功の鍵になりそうです。

 

チャールズ・ バイヤーズ氏によるこのブログ記事は、2020年に公開され、 2021年6月にマウザーによって更新されました。


★★★★★★★★★★★★★★★★★★★★
★★★★★★★★★★★★★★★★★★★★


著者

 

チャールズ・C・バイヤーズ

 

チャールズ・C・バイヤーズ: インダストリアル・インターネット・コンソーシアム(現在OpenFogと合併)のアソシエイト・チーフ・テクノロジーオフィサー。エッジ/フォグコンピューティングシステム、共通プラットフォーム、メディア処理システム、およびIoTのアーキテクチャと実装を担当。それ以前は、Cisco社の主席エンジニアおよびプラットフォームアーキテクト、Alcatel-Lucent社のベル研究所フェローを歴任。30年におよぶ通信ネットワーク業界での経験を通し、音声スイッチ、ブロードバンドアクセス、コンバージドネットワーク、VoIP、マルチメディア、ビデオ、モジュラープラットフォーム、エッジ/フォグコンピューティング、IoTなどの分野に大きく貢献。また、インダストリアル・インターネット・コンソーシアムやOpenFogコンソーシアムのCTOを務めるなど、各種標準化団体にてリーダーとして活躍。PICMGの分科委員会であるAdvancedTCAAdvancedMCMicroTCAの創設メンバーでもある。

バイヤーズ氏は、ウィスコンシン大学マディソン校にて、電気・コンピュータ工学で学士号、電気工学で修士号を取得。趣味は、旅行、料理、サイクリング、電子工作など。米国特許取得件数は80以上におよぶ。

 

 

0 件のコメント:

コメントを投稿

デジタル治療でヘルスケアの未来が変わる

  医療ヘルスケアの未来   「あのう、先生、こうすると痛むんですが」。「その症状に関するアプリは、もうダウンロードしてみましたか」。医師と患者との間で こ んな会話が、不整脈、うつ病、パーキンソン病など、多くの病気について交わされるようになるのは、もうそんなに遠い先...