09.文章方向の決定(2回目)

Created: 2022/03/06
Last Update: 2022/07/14

CenterNetの出力について

前章のCenterNetの出力、中心位置のヒートマップと、テキストの連続を示すラインの図は、次のようになります。

横書きの場合

入力画像
中心位置のヒートマップ
テキストの連続を示すライン

縦書きの場合

入力画像
中心位置のヒートマップ
テキストの連続を示すライン

文字の位置とサイズの処理

中心位置のヒートマップのピークの位置を検出し、その位置のBOX縦横サイズ、中心位置の詳細なオフセットXYを取得することで、 文字のBOXを得ることができます。

文字認識の様子

テキストの連続を示すラインからの文章方向の推定

テキストの連続を示すラインの図で示したように、CenterNetの出力には、文字の連続方向の推定のラインが出力されます。 このラインは、横書きの場合はフォントのレンダリングのbaseline、縦書きの場合は文字の左端に引かれます。

このマップから、縦と横の線分を検出し、文字BOXの連続方向を推定します。

もくじへ戻る