python Tesseract安装方法

python Tesseract安装方法

EXE可执行文件地址:http://download.csdn.net/download/whatday/7740469;
下载tesseract-ocr-setup-3.02.02.exe安装包,安装成功后会在相应磁盘下有Tesseract-OCR文件夹

设置path环境变量

还有新建TESSDATA_PREFIX环境变量

D:\Program Files (x86)\Tesseract-OCR加进去就可以了

tesseract –list-langs  #查看Tesseract-OCR支持语言

如果要识别简体中文 就要下载字库
简体中文字库文件下载地址为:http://download.csdn.net/detail/wanghui2008123/7621567下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。

运行下

tesseract C://Users/Administrator/Desktop/1.jpg C://Users/Administrator/Desktop/output –l chi_sim

然后会生成output.txt文件 打开就可以看到转化的文字

原创文章如转载,请注明本文链接: http://newmiracle.cn/?p=2429

发表评论

电子邮件地址不会被公开。 必填项已用*标注