天成功把易语言调用验证码通杀的DLL在Python中成功调用了
特此共享出来,下面是识别截图:
识别方法1:
私信小编01即可获取大量Python学习资源
# 来源:http://www.sanye.cx/?id=12022
# 优点:载入快、识别速度高、识别精度较高
# 缺点:仅在32位Python环境中成功运行
# 获取上级目录
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 获取验证码文件夹
img_list = os.listdir(path + r"\captcha")
# 载入识别库
dll = cdll.LoadLibrary(path + r"\ocr1\ocr.dll")
# 初始化识别库
dll.init()
# 遍历图片并识别
for i in img_list:
# 读入图片
with open(path + r"\captcha\{0}".format(i), "rb") as file:
# 读入图片
image = file.read()
# 利用dll中的ocr函数进行识别
Str = dll.ocr(image, len(image))
# 返回的是指针,所以此处将指针转换为字符串,然后再编码即可得到字符串类型
text = string_at(Str).decode("utf-8")
print(f"识别返回:{text},类型:{type(text)},ID地址:{id(text)}")
识别方法2:
# 来源:[url=https://www.52pojie.cn/thread-1072587-1-1.html]https://www.52pojie.cn/thread-1072587-1-1.html[/url]
# 优点:识别速度高、识别精度高
# 缺点:仅在32位Python环境中成功运行、载入时间较长
# 获取上级目录
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 载入识别库
dll = cdll.LoadLibrary(path + r"\ocr2\OCRS.dll")
# 载入字库与建立字库索引
with open(path + r"\ocr2\通杀英文数字库.cnn", "rb") as file:
# 载入字库
word_bank = file.read()
# 建立字库索引
work_index = dll.INIT(path, word_bank, len(word_bank), -1, 1)
# 读入待识别图片列表
img_list = os.listdir(path + "\captcha")
# 循环识别图片并输出
for i in img_list:
# 打开指定图片
with open(path + "\captcha\{0}".format(i), "rb") as file_img:
# 读入图片
image = file_img.read()
Str = create_string_buffer(100) # 创建文本缓冲区
dll.OCR(work_index, image, len(image), Str) # 利用DLL中的识别函数进行识别
text = Str.raw.decode("utf-8") # 对识别的返回值进行编码
print(f"识别返回:{text},类型:{type(text)},ID地址:{id(text)}")
1.自己弄了一个类,下载下来直接使用,调用方法:
dll = Ver_code_1(DLL文件所在的文件夹目录)
#或者
dll = Ver_code_2(DLL文件所在的文件夹目录)
#识别图片:
dll.ocr(图片)
2.修正了识别库2空白字符未消除,无法正确判断长度的问题(可以利用固定长度判断是否符合,进行初步筛选,避免提交后网页返回验证码错误)
import os
from ctypes import *
class Ver_code_1:
# 启动时需要传入ocr.dll
def __init__(self, path):
# 载入识别库
self.dll = cdll.LoadLibrary(path + r"\ocr.dll")
# 初始化识别库
self.dll.init()
def ocr(self, image):
Str = self.dll.ocr(image, len(image))
# 返回的是指针,所以此处将指针转换为字符串,然后再编码即可得到字符串类型
return string_at(Str).decode("utf-8")
class Ver_code_2:
def __init__(self, path):
# 载入识别库
self.dll = cdll.LoadLibrary(path + r"\OCRS.dll")
# 载入字库与建立字库索引
with open(path + r"\通杀英文数字库.cnn", "rb") as file:
# 载入字库
self.word_bank = file.read()
# 建立字库索引
self.word_index = self.dll.INIT(path, self.word_bank, len(self.word_bank), -1, 1)
def ocr(self, image):
Str = create_string_buffer(100) # 创建文本缓冲区
self.dll.OCR(self.word_index, image, len(image), Str) # 利用DLL中的识别函数进行识别
return Str.raw.decode("utf-8").rstrip('\x00') # 对识别的返回值进行编码后返回,这里的\x00是删除缓冲区的空白符
注意!测试环境为:
Python 3.9.2 (tags/v3.9.2:1a79785, Feb 19 2021, 13:30:23) [MSC v.1928 32 bit (Intel)] on win32
经测试,无法在64位环境下调用,如有大佬能实现,烦请告知一下
关于DLL改64位的思路:
我找到了论坛中的IDA pro,成功将DLL进行了反编译,如图:
其实最关键的就是以上的init以及ocr两个函数,但是后续如何将IDA pro项目转换为64位,然后进行编译,目前没有找到合适的方法,如果有大佬麻烦告知一下。
能有人对易语言这门全中文编程语言还有些偏见,认为编程语言都是用的英文,中文编程太low了等等。但是其实说白了,编程不就是把人类能看懂的语言转换成计算机能识别的二进制串吗,只要能实现功能就可以了,现在流行的大部分编程语言的编译器还不都是靠汇编和c完成的(*^▽^*)
扯远了,我们来看看这个框架。比较官方的介绍:E2EE互联网应用服务器开发套件是一套高效、稳定可靠的网站开发框架,可免费使用。具体看看官网
官网
先看看它都能干什么——也就是有哪些成熟的案例?翻了翻官网,好像各种类型的网站开发案例都有,还是比较强大的。
案例
再看看它怎么使用——也就是说明文档够不够详细?应该说还是比较详尽的,不仅有文字、图片、源码,而且还有视频教程,简直是保姆级的了!
文档
教程
再来看看官方的示例:官方提供了一共有48个应用示例,基本上涵盖了大部分应用场景。
浏览了一遍案例,我发现这个案例第100“文件列表页”直接就可以使用,比如在同一个WiFi下,打开这个案例程序后,手机和电脑互相传递文件了,挺方便。
有易语言基础的可以试试,真的是超级简单且功能不弱。
次看新浪微博新闻,发现大家后面评论观点蛮多,就想把所有观点导出来进行归纳调研。而且自己当时刚好在自学E语言,所以就借着这个方向自由发挥了下。
当时研究了下发现要获取微博评论蛮简单的就是api的调用和json的解析。可是当时在写软件时发现微博开放平台用户身份鉴权OAuth2.0每次授权还要从网址里复制code太麻烦,为了简化使用,不想每次复制来复制去的,后来试了好几种方法,发现可以利用地址分割法蛮好用的。
.版本 2
.支持库 HtmlView
.子程序 __启动窗口_创建完毕
.局部变量 命令, 文本型, , "1"
取命令行 (命令)
全选 = 真
组合框1.加入项目 (“正在载入中。。。。。。”, 1)
组合框1.现行选中项 = 0
现行项目 = 0
编号 = 1
_按钮1_被单击 ()
.子程序 _超文本浏览框1_载入完毕
.局部变量 临时浏览器, 超文本浏览框
.局部变量 codeX, 文本型, , "0"
临时浏览器 = 取事件组件 ()
编辑框1.内容 = 临时浏览器.地址
.如果真 (寻找文本 (编辑框1.内容, “code=”, , 假) ≠ -1)
codeX = 分割文本 (编辑框1.内容, “code=”, )
code = codeX [2]
' 调试输出 (code)
载入 (微博主窗口, , 真)
_启动窗口.可视 = 假
_启动窗口.销毁 ()
微博主窗口.可视 = 真
.如果真结束
*请认真填写需求信息,我们会在24小时内与您取得联系。