画像から、文字の位置を特定します。
モデルはいろいろありますが、EfficientDet https://arxiv.org/abs/1911.09070 を使用しました。
コードは、公式実装 https://github.com/google/automl/tree/master/efficientdet を参考に、一部変更して実装しました。
現在検討中