Replies: 1 comment
-
在使用 OCR 识别时,为了确保 rec(识别)模型能够正确识别 白底黑字/彩字 和 彩底白字 两种情况,数据集的比例需要合理分配。 样本比例建议:
原因分析:
优化训练效果的建议:
如果训练数据集中某一类数据严重不足,可以通过 数据合成(Synthetic Data) 方式生成,确保训练数据的多样性和均衡性。 如果你有更具体的场景或需求,可以进一步调整数据比例或进行额外测试,以找到最优比例! 🚀 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
rec模型,白底黑字或彩字,和彩底白字,样本各占多少才能两种情况都能识别?
Beta Was this translation helpful? Give feedback.
All reactions