2020年11月11日水曜日

AIエンジニア必見!3つの新しいトレンド

 

2019年後半、アメリカのIT専門調査会社・IDC (International Data Corporation )は「人工知能(AI)システムに対する世界の支出額は2023年までに979憶ドルに成長する」という予想をしました。これは2019年の375憶ドルの約2.5倍にあたります。

新型コロナウィルスがもたらした2020年の混乱にもかかわらず、AIは全く「感染」していないようです。

AI関連業務の方は、新しいトレンドやスキルの多様化が起こるか目を光らせておけば、時代に乗っていくことができます。

今回ぜひ注力いただきたい3つの分野を挙げていきます。どれも専門家がこれから急成長するであろうと見込んでいる領域です。

 

AIoT組み込みシステム

最近まで、大切なデータはデータセンターの中で処理をすることばかり考え、データを取得した現場ですぐに処理することは考えてもみませんでした。しかし現在では高性能スーパーコンピューターが、これまで障害となっていたサイズ、費用、電源の問題をクリアしたのです。 

20205月に発売されたNVIDIAJetson Xavier NX開発キットの値段は400ドルを下回り、わずか10ワットの電源で動作します。最大21 TOPS(毎秒21兆回の演算)、最先端のニューラルネットワークを並列で動作させる有効電力、さらに複数の高解像度センサからのデータ処理など、つまりAIのフルシステムに必要なものをすべて実現させました。他社製品もこれに近づきつつあります。

 こうした技術進歩により、クラウド接続のAIML用のマルチモーダルアプリの開発が大幅に合理化されました(1)。例えば、発熱している入場者や入場禁止リストに載っている人を検知する、潜在的リスクを排除できる最先端ライブビデオ搭載感熱画像処理システムを構築するとします。この場合、例え5Gがあったとしても、高解像度のライブビデオと熱センサーデータをクラウドにアップロードし、遠隔サーバーで処理、これが終わってから顔認識とリスク査定のスコアを待つのでは実用的ではありません。その作業と結果が戻ってくるまでには恐らく数十分を要するでしょう。この問題を解決するには、現地でライブデータを処理し、システムが速やかにその脅威レベルを査定するしかないのです。

 

1:大きな進歩を遂げているクラウド接続のAIアプリ(写真:Phonlamai Photo/Shutterstock.com

この理論体系は、今では標準のカメラ、感熱画像装置、及び完全開発キットとして販売されているオクタコア構成のNVIDIAでも可能になりました。オブジェクト検出、音声合成、分類、推薦エンジン、言語翻訳、感情分析など、一般的なAIアプリの構成要素が学習済みモデルに適用されています。これらの機能を持つアプリ開発では、初めにその機能のモデルを使ってから具体的なユースケース用に調整すれば非常にスピーディーに進めることができます。NVIDIA GPU CloudNGC)ライブラリは、このようなモデルを何百種類も提供しているため、一般的なAIタスクを素早くスタートでき、Jetson Xavierや同社の他製品用には既に最適化されています。さらに、一度プロジェクトを稼働し始めれば、いくつかのレイヤーを更新するだけでモデルの再学習が可能なため、時間の節約になります。

 これら強力な機能を備えたスーパーコンピューターは、上述したようなスマートカメラのプロジェクトには理想的です。それだけでなく、医療装置、自動光学検査、商業用ロボットなど、ありとあらゆる高性能AIシステムの構築に活用するでしょう。

 

自然言語生成/従来型AI

自然言語生成分野も大きな進化を遂げています。特にMicrosoftのチューリング自然言語生成(T-NLG)は、AI開発者がこれまで叶わなかったいくつかの扉を開いてくれました。しかしこれには豊富なリソースが必要でした。

32GBRAMがあったとしても、グラフィックス処理装置(GPU)が1つでは13億以上のパラメーターを含むモデルに適合することはできません。そこでMicrosoftチームは、ハードウェアとソフトウェアに突破口を見出しこの問題を解決しました。Microsoftは、GPU間に超高速通信を使ってNVIDIAのハードウェア設定を活用し、4つのGPUに対してテンソルをスライスするモデルを適用しました。これでモデルの並列度は16から4に減ったため、ノード当たりのバッチサイズは400%に増え、学習速度は3倍になりました。結果として、DeepSpeedライブラリは、以前の設定では1024 GPU必要だったのに対し、わずか256 GPU512 GPUのバッチサイズで学習することができました。さらに特筆すべきは、この技術を使用するために古い記事を理解する必要がないということです。

20202月にリリースされたT-NLGのベータ版により、検索クエリに対し文章で回答し、リアルタイムで会話型言語を生成できるようになりました。つまり目的の言語できちんと話し、完全な文章で答えるチャットボットです。

T-NLGは、170憶のパラメーターを含む最大級のモデルであり、コンテンツを書いたり長文を抜粋したりするライターを支援するためのアプリケーションを作ることもできます。または、これまで私たちが使っていたアシスタントよりも格段にスマートなデジタルアシスタントを使ってカスタマーエクスペリエンスを向上させることもできます。自然言語生成ツールに詳しくなることで、AI開発者は今後数年間で市場価値が大きく上がる新しいスキルを培うことができると私たちは確信しています。

すでにPythonを使用している人は特に、T-NLGを使い始めた方が、想像以上に簡単です。

 GitHubを使い、DeepSpeedライブラリのリポジトリ(PyTorchと互換性のあるもの)について詳しく調べ、スタートしてみてください。

このAPIライブラリがあれば、深層学習モデルのサイズが10倍になり、速度は5倍になるため、分散された学習が簡単、能率的、そして効果的になります。100憶を超えるパラメーターを活用して、かつてない速度でモデルを学習させることができるというわけです。

 

ニューラルネットワークと進化的計算

データベースは通常AIシステムやアプリケーションのネックとなります。処理能力やメモリを増やせば解決するという問題ではありません。そこで注目すべきトレンドの一つは、ニューラルネットワークをデータベースのシステム設計に適用することです。

マサチューセッツ工科大学(MIT)Googleの実験データ管理設計は、メインのコンポーネントに関してニューラルネットワークにスワップインし、メモリ要件を低減しながらもキャッシュ最適化したB-Tree上でのパフォーマンスを最大で70%向上させました。

学習済みのインデックスは、データベースのルックアップキーの構成をすぐに認識し、それをレコードの位置の予想に使用します。ニューラルネットは今後のシステム設計に多大な影響を与えるため、詳しく調べる価値はあると思います。

最後にモノの人工知能(AIoT)、自然言語生成(NLG)、またはニューラル計算の中から一つ、またはすべてをトピックとして選び、AI革命を盛り上げる大きな波になると思われるものに乗る準備をしましょう。

 

★★★★★★★★★★★★★★★★★★★★
★★★★★★★★★★★★★★★★★★★★

 

 著者

 Stephen Cassar

フォーチュン誌が選ぶ100社のアドバイザーとして、特にワークフロー管理、eコマース、人工知能、機械学習に関連する製品戦略とアーキテクチャ部門に招待されることが多く、最新プロセスを客観的に観察し、長期的な高い実績と短時間でROIを達成できるよう戦略の細かい変更点を提案している。

CTO/最高システム設計者として、SaaSプラットフォームをきちんと構築するための要件に関する深い知識を持つ。複数の従来型システムを組み合わせることもしばしばあり、拡張可能なクラウドベースのアーキテクチャを使うことで安全かつ統合された複雑なデータセットを確立している。

 

 


 

 

 

0 件のコメント:

コメントを投稿

デジタル治療でヘルスケアの未来が変わる

  医療ヘルスケアの未来   「あのう、先生、こうすると痛むんですが」。「その症状に関するアプリは、もうダウンロードしてみましたか」。医師と患者との間で こ んな会話が、不整脈、うつ病、パーキンソン病など、多くの病気について交わされるようになるのは、もうそんなに遠い先...