前章のCenterNetの出力、中心位置のヒートマップと、テキストの連続を示すラインの図は、次のようになります。
中心位置のヒートマップのピークの位置を検出し、その位置のBOX縦横サイズ、中心位置の詳細なオフセットXYを取得することで、 文字のBOXを得ることができます。
テキストの連続を示すラインの図で示したように、CenterNetの出力には、文字の連続方向の推定のラインが出力されます。 このラインは、横書きの場合はフォントのレンダリングのbaseline、縦書きの場合は文字の左端に引かれます。
このマップから、縦と横の線分を検出し、文字BOXの連続方向を推定します。
もくじへ戻る