08.文章方向の決定(2回目)

Created: 2022/03/06
Last Update: 2022/03/06

CenterNetの出力について

前章のCenterNetの出力、中心位置のヒートマップと、テキストの連続を示すラインの図は、次の図のようになります。

入力画像
中心位置のヒートマップ
テキストの連続を示すライン

中心位置のヒートマップのピークの位置を検出し、その位置のBOX縦横サイズ、中心位置の詳細なオフセットXYを取得することで、 文字のBOXを得ることができます。

文字認識の様子

これで、各文字の位置と特徴量ベクトルが分かりましたが、文章にするためには文字のつながりを辿って、BOX同士のつながりを探す必要があります。

テキストの連続を示すラインからの文章方向の推定

テキストの連続を示すラインの図で示したように、CenterNetの出力には、文字の連続方向の推定のラインが出力されます。

このマップから、縦と横の線分を検出し、文字BOXの連続方向を推定します。

もくじへ戻る