視覚センサは、データアクイジションのためのエッジデバイスとしてますます重要になってきています。もともと写真用途のシンプルなイメージセンサとして使用され、開発された現在のイメージセンサは、今日ではAIおよびマシンラーニングシステムに取り込む高品質の入力を提供するために使用されています。そして、これらのシステムは、新しい革新的なプロセッサアーキテクチャを活用する高度な意思決定主体となっています。
エッジデータの収集
エッジデータの収集装置は、本質的には主にアナログですが、イメージセンサは、次の点で独特です。
- それらの出力は、連続的な動的光入力上で時分割される
- 変換された光学インプットのインテグリティを維持しながら画像出力を提供する処理能力が必要
- 提供される画像出力は、意味のある処理を可能にする最適な品質である
これらの要求とそれに伴う結果は、ビジョンシステムによって行われる決定の正確性、すなわち自動化されたシステム全体の安全性、信頼性、および収益性を定義する結果に、大きな影響を与える可能性があります。
マシンラーニング(機械学習)型ビジョンシステム
マシンラーニングの出現は、多様なアプリケーションを支援するために、性能レベルを強化しながら、イメージセンサのイノベーションを促進させました。視覚的入力は高信頼データであり、表示されるのは、システムに入力されたものです。今日、AIアルゴリズムは、これらの入力を検出、認識、分類し、正確な意思決定出力を生成することができます。これらの出力への信頼性は、これらの出力への信頼性は、アルゴリズムの精度と同様に入力の品質、およびこれらのアルゴリズムの処理に使用されるニューラルネットワークに基づいています。
マシンラーニングとディープラーニング(深層学習)に基づくビジョンシステムは、主にCNN(Convolutional Neural Network、畳み込みニューラルネットワーク)アルゴリズムを使用して、強力な自動認識エキスパートシステムを作成します。これらのシステムにおけるCNNレイヤーの深さを増すと推論精度が向上しますが、レイヤーが増えると、トレーニングフェーズでこれらのネットワークが学習するのに要する時間(結果として生じる可能性のあるオーバーフィッティングと消費電力についても忘れないでください)とシステムのレイテンシーに悪影響を与える可能性があります。ここでも、高品質の画像出力により、ビジョンシステムは最小限のCNNレイヤーのセットを実行しながら、高精度の推論を生成します。これにより、迅速に展開可能なインテリジェントシステムを低コストで小さなフォームファクタで実現でき、高性能と低消費電力について大きなメリットが得られます。
典型的な畳み込みニューラルネットワーク(CNN)

CNNのような深層学習アルゴリズムは非常に多くのリソースをしょうひします。現在、CPU、GPU、FPGA、専用アクセラレータ、および最近のマイクロコントローラの形式でさまざまな処理エンジンが利用可能です。CNNベースのビジョンシステムを設計するには、最適化された図書館ライブラリの強力な支援も必要です。これは、独自仕様のツール(MVTecのHALCON&MERLIC、MATLABのDeep Learning Toolbox、CognexのViDiなど)から、標準ツール(OpenCVなど)、およびソフトウェアとハードウェアの統合機能まで多岐にわたります。これらの選択は、製品の市場投入までの期間に直接関係します。リソースを大量に消費するプロセッサは、一般に、より大きなフォームファクタ、ヒートシンクのような消費電力に対応するアドオン、または対流によって電力を散逸するための大きな空のボリュームスペースを必要とします。高品質な出力を提供するイメージセンサにより、高価なプロセッサ、高価なサードパーティのライブラリ、および/または新しいライブラリの作成、およびハードウェアとソフトウェアのリソースを最適に結び付けるために必要な高価なツールの必要性を取り除くことができます。つまり、これらのセンサはTCO(Total Cost of Ownership、総所有コスト)を大幅に最小化し、多種多様なアプリケーションや市場での採用を促進します。
マシンラーニングシステムへのイメージセンサ入力
CNNレイヤに供給されるイメージセンサ出力には、以下のような多くの要求があります。
- シーンをキャプチャして保持し、モーションアーティファクトを最小限に抑えることができるグローバルシャッタ
- すべてのピクセルで保持されたシーンが、そのピクセルの光パスの外側にある光入力によって破損しないようにするための、高いグローバルシャッタ効率
- 厳しい照明条件下でも良好な画質をサポートする十分なピクセルサイズ
- 高いインテグリティの入力を確保するため、画像出力のトータルノイズを低減
- 対流熱伝達がノルマであるカメラシステムの一般的な課題に対応するための、低い動作中および待機中の電力

これらの特性は、ピクセルアーキテクチャと関連する電気経路の設計に依存します。AR0234CSのようなCMOSイメージセンサのアーキテクチャと設計は、これらのニーズに対応しており、CNNベースのビジョンシステムに最適です。
高速システムを可能にする高速インタフェース
ピクセルは、高品質の画像を生成するために優れた品質で完璧に設計されているかもしれませんが、全体的なビジョンシステムは、帯域幅の制限により、依然として不十分な性能に悩まされる可能性があります。現在、センサにはSerDesインタフェースが搭載されていますが、これらのインタフェースのトラフィックデータの速度によって、システム全体の品質が評価されます。
フレームレートが高ければ、これらのインタフェースは画像データを高速で転送する必要があります。また、センサはフレーム出力ごとに低消費電力(fps/mW)である必要があります。これらの機能により、システムのタイミングと電力バジェットを、最も望ましい場所(処理エンジン)に転送できるため、最先端のニューラルネットワークと複雑なアルゴリズムを組み込むことができます。これにより、このようなプロセッサは、アプリケーションにとって重要となり得る画像データのニュアンスを抽出し、システムソリューションを競合他社に対して大幅に差別化できます。
2.3Mp CMOSイメージセンサ「AR0234CS」

2.3Mp CMOSイメージセンサ「AR0234CS」は、高データレートMIPIインタフェースを搭載しているため、AIベースのビジョンシステムに最適です。高フレームレート、およびフルフレームレートとフル解像度での低消費電力という特長があるため、ビジョンシステム開発者は、タイミングと電力のバジェットの大部分をプロセッサに割り当てることができます。
AR0234CSについての詳細はこちらをご覧ください。また、以下の情報と資料をご参照ください。
設計に役立つ情報と資料
オン・セミコンダクターのブログを読者登録し、ソーシャルメディアで当社をフォローして、
最新のテクノロジ、ソリューション、企業ニュースを入手してください!
Twitter | Facebook | LinkedIn | Instagram | YouTube