AIに最適な量子化値を割り当てる低ビット量子化技術「LCQ」とは！？

こんにちは！AI研究所の石川です。
本日のtopicsは、AIの学習時に量子化値を最適に割り当てる低ビット量子化技術「LCQ」をご紹介します。

国立研究開発法人新エネルギー・産業技術総合開発機構（以下「NEDO」）と沖電気工業株式会社（OKI）は、「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発」において、AIの学習時に量子化値を最適に割り当てる低ビット量子化技術「LCQ（Learnable Companding Quantization）」を開発しました。
本技術は、ディープニューラルネットワークの高精度モデルで、ビット数を32ビットから2ビットへと16分の1に圧縮しても画像認識精度の劣化を世界トップクラスの1.7%に抑えることに成功し、エッジ領域での演算負荷低減を実現します。

今後、本技術を活用することで、エッジ領域での高精細な画像認識、さらには工場のインフラ管理や機器の異常検知など、演算リソースの限られたデバイスでのAI実装を目指します。

この記事の概要目次

1.「LCQ」開発背景
2.「LCQ」概要
3.LCQ技術の成果について

「LCQ」開発背景

ディープニューラルネットワーク（DNN）とは、多層ニューラルネットワークのことで、人間の脳の神経細胞（ニューロン）のつながりを模した数学モデルであるニューラルネットワークの層を、複数枚重ねて多層にしたものです。画像や音声などの認識において優れた性能を発揮する人工知能（AI）として注目されています。
一方で、高い精度を得るためには大量の演算リソースや電力が必要なため、メモリーや電力に制限のあるエッジデバイスへの組み込みには課題がありました。そこで、演算負荷を下げるために、多くの乗算と加算により構成されるDNN演算を低ビットに量子化し、製造後に設計者が再構成可能な集積回路であるFPGA （Field-Programmable Gate Array）など専用のハードウェア上で実行する技術の研究開発が行われてきました。しかし、これまでの先行技術では、量子化する前の値に対する量子化後の値（量子化値）をあらかじめ固定値として割り当てるため、2ビットなどの超低ビットへ圧縮すると固定値との誤差により認識精度が劣化し、実用化への障壁となっていました。
こうした背景のもと、NEDOとOKIは、「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発」（以下、NEDO事業）において、DNNの学習時に、推論時の認識精度を維持するのに最適な低ビット量子化値を割り当てることができる低ビット量子化技術「LCQ」を開発しました。

「LCQ」概要

DNNの性能をはかる指標（ベンチマーク）とされる画像認識で高精度モデルを32ビットから2ビットへと16分の1に圧縮した場合、先行技術では認識精度に約3%の劣化が生じるのに対し、LCQを適用することでこれを1.7%と非常に小さく抑えることに成功し、世界トップクラスの認識精度を達成しました。
LCQではDNNの誤差勾配に基づいて圧縮関数と伸張関数を学習し、これを反映した量子化処理を行うことで、非線形な量子化関数が構築され、最適な量子化値を割り当てることが可能となります。低ビット量子化時の課題となっていた認識精度の劣化を抑制できるだけでなく、2ビットなど超低ビット量子化で高い効果を発揮することが確認でき、演算リソースが限られるエッジデバイスへのAI搭載が可能となります。（図１）

なおこの結果は、2021年6月19日～6月25日にオンライン開催予定の、コンピュータービジョン業界トップカンファレスの国際学会であるCVPR（IEEE/CVF Computer Vision and Pattern Recognition）に採択され、OKIが発表する予定です。

LCQ技術の成果について

NEDOとOKIは音声符号化分野でよく扱われる非線形量子化技術Compandingを応用したLCQにより、DNNの学習での量子化値を柔軟に割り当てることに成功しました。Compandingとは、Compressing（圧縮）とExpanding（伸張）を組み合わせた造語で、非線形量子化技術を表します。
LCQではDNNの最適化させたい推論の誤差関数の傾きである誤差勾配に基づいて、線形量子化演算の前後に通す”圧縮関数と伸張関数”を学習し、これを反映した量子化処理を行うことで（図2）、非線形な量子化関数が構築され、最適な量子化値を割り当てることが可能となります。（図3）
低ビット量子化時の課題となっていた認識精度の劣化を抑制できるだけでなく、2ビットなど超低ビット量子化で高い効果を発揮することが確認でき、演算リソースが限られるエッジデバイスへのAI搭載が可能となります。

図2　LCQの概念図

OKIは、本成果と本NEDO事業でOKIが開発したDNN演算数の削減が可能なAI軽量化技術PCASという、ディープラーニングモデルの演算数を削減して軽量化する技術を組み合わせ、演算負荷低減と演算数削減の両方の効果を得る技術の開発に取り組み、エッジ領域での高精細な画像認識、さらには工場のインフラ管理や機器の異常検知など、演算リソースの限られたデバイスでのAI実装を目指します。

国立研究開発法人新エネルギー・産業技術総合開発機構”NEDO”とOKIが開発した、低ビット量子化技術「LCQ」に注目です！