顔認証入門 #2 特徴量・テンプレート・照合スコア

f:id:takahashi51:20190323211007p:plain:w280

 前回、顔認証とは何かについて説明をしました。今回は顔認証の話をするときの用語について解説したいと思います。生体認証で用いられる用語はJIS X 8101-1で定められていますが、実態に即していないものも多々あります。そこで本シリーズでは、筆者がよく利用する言葉で説明することとします。

 それでは、顔認証の基本的なところから始めましょう。今回は、『特徴量』『テンプレート』『照合スコア』について説明していきます。

特徴量とテンプレート

f:id:takahashi51:20190325104816p:plain:w280
AIの発展とともに顔認証の性能は飛躍的に向上しました

 顔認証では、まずカメラで顔写真を撮影して、それを顔認証システムに事前に登録しておきますね。そして、認証したいときに再度カメラで顔写真を撮影して、登録しておいた顔と同一人物かどうかを判定します。

 顔認証システムでは、顔画像をそのまま登録するのではなく、特徴量(feature)と呼ばれる数値データに変換しています。この特徴量は、同一人物かどうかを精度よく判定できるように設計されています。顔認証システムを作っているメーカーは、より優れた特徴量を計算する方法について研究開発している訳です*1

 実際のところ、特徴量が1種類とは限りません。複数の特徴量を計算して、それらを組み合わせることもあります。また、年齢や性別情報を利用する場合もあるでしょう。そういった情報を一つにまとめたものをテンプレート(template)と呼びます。

 (参考)イメージしやすいように例を挙げます。640×480画素の顔画像データは、合計307,200画素の色情報を数値として持っています。JPEGなら100KBくらいのデータ量です。顔認証システムは、顔画像を1,000個程度の数値データからなる特徴量に変換することで、数KB程度のテンプレートを作成しています。かなりコンパクトになりますね。

照合スコア

f:id:takahashi51:20190325104207p:plain:w280
より速く、より精度よく判定する技術が求められます

 顔認証システムは、2つの特徴量(テンプレート)が与えられたとき、同一人物か否かを判定するための数値として照合スコア(matching score)を計算します*2。照合スコアは大きければ大きいほど同一人物であることを意味する数値です*3。顔認証システムは、あらかじめ決めておいた閾値を超えるか否かで、同一人物か否かを判定します。

 よくある勘違いなのですが、照合スコアは同一人物である確率を意味しません。実際のところ、照合スコアを0~1の数値で表現することが多いです。ですが、照合スコアが0.8だったとしても、同一人物である確率が80%という訳ではありません。この辺の解釈の仕方については、別の回で解説します。

まとめ

 本記事のまとめは以下の通りです。今回もおつかれさまでした。

・顔認証では、顔画像を特徴量と呼ばれる数値データに変換する
・複数の特徴量や他の補足情報などをまとめたものをテンプレートと呼ぶ
・顔認証は照合スコアが閾値より高いか低いかで同一人物か否かを判定する

*1:深層学習がよく利用されます

*2:JISでは、照合得点と定められています

*3:相違度(dissimilarity)を使う場合もありますが、その場合は大きければ大きいほど別人であることを意味する数値です