import zipfile
import itertools
from concurrent.futures import ThreadPoolExecutor
def extract(file, password):
if not flag: return
file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
def result(f):
exception = f.exception()
if not exception:
# 如果获取不到异常说明破解成功
print('密码为:', f.pwd)
global flag
flag = False
if __name__ == '__main__':
# 创建一个标志用于判断密码是否破解成功
flag = True
# 创建一个线程池
pool = ThreadPoolExecutor(100)
nums = [str(i) for i in range(10)]
chrs = [chr(i) for i in range(65, 91)]
# 生成数字+字母的6位数密码
password_lst = itertools.permutations(nums + chrs, 6)
# 创建文件句柄
zfile = zipfile.ZipFile("加密文件.zip", 'r')
for pwd in password_lst:
if not flag: break
f = pool.submit(extract, zfile, pwd)
f.pwd = pwd
f.pool = pool
f.add_done_callback(result)
然而,事情并没有那简单……代码跑一会儿,内存爆了!. J. Z3 f! e- \2 s & ]6 o8 u" S4 h# K, V 于是,为了找寻问题所在,我就去查看了一下源码,发现ThreadPoolExecutor默认使用的是**队列。而程序中尝试密码的速度跟不上生产密码的速度,就会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95: ( U$ l4 j1 Z F1 d
# a4 v6 {- s4 X6 Z: Y
找到病根儿,剩下的就是对症下药了。继承并重写了ThreadPoolExecutor类中的_work_queue属性,将**队列改成有界队列,这样就不会出现内存爆满的问题,看代码:- R" B9 I4 l- X9 R
用自定义的BoundedThreadPoolExecutor类替代前面代码中的ThreadPoolExecutor。再次执行……程序输入如下图内容: [4 o# |7 @! I& A4 h8 O: F7 T1 y O, M & @- l6 K3 \9 O/ x/ e, G Bingo!破解成功!(原来密码如此简单……) 3 @. v B% o# }3 R/ r/ x' N s 话说回来,毕竟这个压缩包我是隐约知道它的位数和范围(字母和数字),所以破解出来需要的时间是可以忍受的。如果有天你在网上找了一个无人认领的加密压缩包,想要一窥究竟但又并不知道它有多少位密码,那我只能祝你好运啦~