# IdentifyingCode_ORC **Repository Path**: zhouyuanmin/IdentifyingCode_ORC ## Basic Information - **Project Name**: IdentifyingCode_ORC - **Description**: 该项目是使用ORC识别验证码,能够识别常规的数字与字母的组合 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-05-31 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # IdentifyingCode_ORC ### 介绍 该项目是使用ORC识别验证码,能够识别常规的数字与字母的组合 ### 运用的知识点有: 1、urllib 2、re 3、pytesseract 4、PIL ### 遇到的问题: 问题1:找不到tesseract.exe程序 解决办法1:修改源码pytesseract.py文件中第35行tesseract_cmd='tesseract', 修改为tesseract_cmd=r'C:\Program Files (x86)\Tesseract-OCR\tesseract' 即:你orc程序安装的位置 解决办法2:配置环境变量path 问题2:识别度不高,容易把8识别成B 解决办法1:根据具体场景,直接指定识别为B或者8 解决办法2:花钱,购买第三方验证码识别接口 #### [tesseract下载地址](http://digi.bib.uni-mannheim.de/tesseract/)