百度文库免费下载付费文档(批量免费的下载百度文库里的WORDPDFPPTTXT等格式的收费文档)

支持批量免费的下载百度文库里的WORD,PDF,PPT,TXT等格式的收费文档。 利用python语言编写带GUI界面的爬虫! Support batch free download of Baidu library charges WORD, PDF, PPT, TXT and ot...

支持批量免费的下载百度文库里的WORD,PDF,PPT,TXT等格式的收费文档。 利用python语言编写带GUI界面的爬虫! Support batch free download of Baidu library charges WORD, PDF, PPT, TXT and other format documents.

程序运行注意

运行该程序,必须保证电脑里面有Firefox浏览器。同时在运行该程序时,尽量不要打开和操作火狐浏览器(Firefox)。

实现的意义

支持对百度文库能浏览的学习,资料,文章(pdf,word,txt,ppt)便利(免登陆,消费劵)和稳定的(支持复杂图表word文档)的下载到本地,并应对大量的文章支持多进程高效的批量下载。

声明:本程序原理仅是模拟浏览器截图到本地,开放的初衷是方便使用者下载文档资料到本地离线学习使用,无盈利目的,更请勿利用此程序下载的文档牟取盈利。同时百度文库上文档也都是百度账号的用户自愿上传,不存在侵权行为。

实现的主要功能

将多张图片合成pdf文件。文件下载到本地的路径可自由设置。对下载PDF文件,可设置其分辨率的大小即文件大小。word,pdf文件,下载为超高清的pdf文件;txt文件,还原下载为txt文件。ppt文件,下载为高清图集。对多个文件实现多进程的批量下载,可设置多进程同时下载的进程数(默认为4),极大加快大量文件下载速率和和简化了操作。加入sqlite3数据库,对下载的历史记录进行保存,删除,方便回顾。

与他文库下载器和爬虫程序的对比

优点:

相比Github上目前其他爬文库程序,它们简单只对txt,word等文档只有文字内容的解析,遇到带有格式或者表格的文档无法还原,几乎没有做什么处理。而此程序完美的还原word,pdf,ppt,txt,文档。目前网络上类似文库爬取文档下载的软件口碑最好是冰点文库,相比冰点文库,实现了和它一样的技术同时也先实现多进程的批量下载,完善高效的下载功能。相比冰点文库的广告,此程序原创,无广告,绿色,安全。

缺点:

冰点文库已经有很长迭代式开发周期,功能更完善,运行更稳定,几乎支持所有的主流文库,相比之下此程序支持网站目前只有百度文库。冰点文库使用C语言进行开发,程序运行效率好于此程序。批量免费的下载百度文库里的WORD,PDF,PPT,TXT等格式的收费文档

批量免费的下载百度文库里的WORD,PDF,PPT,TXT等格式的收费文档

软件地址:

https://github.com/MrYxJ/BaiduWenkuDownload/tree/master/%E6%A0%BC%E6%A0%BC%E7%99%BE%E5%BA%A6%E6%96%87%E5%BA%93%E4%B8%8B%E8%BD%BD%E5%99%A82.0/%E8%BD%AF%E4%BB%B6

源码地址:

https://github.com/MrYxJ/BaiduWenkuDownload/tree/master/%E6%A0%BC%E6%A0%BC%E7%99%BE%E5%BA%A6%E6%96%87%E5%BA%93%E4%B8%8B%E8%BD%BD%E5%99%A82.0/%E6%BA%90%E4%BB%A3%E7%A0%81%E7%AD%89

  • 发表于 2022-10-30 13:21:36
  • 阅读 ( 156 )
  • 分类:科技

0 条评论

请先 登录 后评论
运动练
运动练

578 篇文章

你可能感兴趣的文章

相关问题