清华紫光OCR(TH-OCR)是专业的图像汉字识别软件,该软件可以帮助你直接“挖掘”图像信息。 软件支持从TIF、BMP和PCX的图像文件格式中读取字符内容,支持简单/繁体字版、英语和笔式中英。 虽然未必全部都能读取,但特别是文字接近外框时非常容易出错。 欢迎下载!
使用教程
打开文件-选择要识别的文件。 可以是tif、bmp或jpg格式。
命令-识别,自动识别。
识别完成后,软件左侧的树中会显示图像文件名。 用鼠标单击哪个加号,就会变成识别后的文本文件。
点击后,软件右上角有被识别的文本,下方有被识别的图像文件。
此时,如果用键盘移动光标,就可以看到图像和对应的文本,可以直接更改文本。
二值图像是只有黑白两色的图像,可以用windows附带的绘图软件制作。
首先用画打开图像、图像-属性,将颜色改为黑白,然后保存到磁盘,即可得到二值图像。
基本信息
清华紫光ocr(th-ocr )是一款具有完全知识产权的图像汉字识别软件,由清华大学于1985年开始开发,中日韩文和英文混合文件的识别水平已经超过了国外同行的效果。 很容易使用。 用鼠标圈出“挖出来的”文字,点击“识别”,文字就会很容易出现。 可以直接复制,也可以保存为文本文档。 还是很方便。