前章のCenterNetの出力、中心位置のヒートマップと、テキストの連続を示すラインの図は、次の図のようになります。
中心位置のヒートマップのピークの位置を検出し、その位置のBOX縦横サイズ、中心位置の詳細なオフセットXYを取得することで、 文字のBOXを得ることができます。
これで、各文字の位置と特徴量ベクトルが分かりましたが、文章にするためには文字のつながりを辿って、BOX同士のつながりを探す必要があります。
テキストの連続を示すラインの図で示したように、CenterNetの出力には、文字の連続方向の推定のラインが出力されます。
このマップから、縦と横の線分を検出し、文字BOXの連続方向を推定します。
もくじへ戻る