照猫画虎写了个知轩藏书的一键转换脚本,4月8日更新提高百倍效率
- zhdphao有木有抓mp3的,拿来就可以用的那种?抓几个网络小说mp3的网站。
- windirt这个没有,不过你可以把网站先列出来看看
- robinzhu78这个不错,之前习惯下txt再转发kindle,每次都没封面慢慢也习惯了
- nkorange回复1#windirt
下来看看 iOS fly ~ - 海带超人求下载包,谢谢 iOS fly ~
- stevenflp马克 iOS fly ~
- zhdphao
- 77880099
- kenchn马克 iOS fly ~
- 零点十分Mark一下
- windirt在macOS + Chrome 下,我打开任何页面都听不到声音。。。。
- mmburning感谢楼主的分享,思路很好
- Yangpioneer厉害的
- jamal学习下
- zdb1115谢谢分享
- happyd8699有没有按照仙草数排序的爬虫?
- 潘少拉楼主厉害
- hzll楼主厉害 iOS fly ~
- 谁家丢的西瓜皮标记一下 iOS fly ~
- zerofire以前抓过漫画,一张一张抓下来。
- ryoluo普通人能用的么?
- 警察蜀黍学习了
- 老童感觉普通人用不了。。。想用。。。
- 老童
- 老童饿,切割是需要很久,搞定了,谢谢楼主。
- windirt因为每一行作为一个对象遍历查询是否正文还是章节,然后要多给一个回车,超大的文本会慢一些
- windirt3.30日更新:
修正了epub里书名和作者栏位出现 “书名:” 和“作者:”的问题,做了一些判断移除掉了
已知问题:极少数的书会在下载封面的时候导致程序退出,原因是封面图片外链了 - myfaint007厉害了小尾巴~
- windirt----------------2020年4月8日更新-----------
转换思路,大幅优化了TXT转换MARKDOWN的处理逻辑,例如原来处理编号11805的修真聊天群转换需要差不多5分钟,现在只要2秒
另外附带了epub.css,做了部分美化,不过pandoc转换出来的epub使用的css项目较少,可控性不是太高
精简了转换出来的文件名,改为 书名_作者.epub - wsyx87930还好知轩站长不来地板,不然被你们气出心脏病来
- lovemu马克图书
- windirt哎,我这个不是爬虫,就是把繁琐的工作简单化,获取小说id一样要打开网站,站长肯定不会骂的
- vivakira爬完了上传个百度盘吧,朋友们就不用再多爬了
- ujin
- aahaa马克一记
- wxdwxd强,马可已经
- Reloaded多谢兄弟,不急的
- windirt正在做个数据库,按仙草排列的,全站书有5549本已经爬完
不过这个仙草意义不大,样本数太少,我觉得还是去起点,纵横等大站看那边的排名,再来知轩藏书搜书,用id下载转换 - windirt生成了一个sqlite3的数据库,采集了所有书的仙草值,排序一下,按id下载吧
library.db.zip(259.84 KB) - sunnycougar厉害了,本小白mark了
- liueno楼主以及各位大卡,可以加入安排评分比下载吗?
- 档的生日感谢感谢~
- windirt现在的程度我觉得已经够用了,脚本单文件单线程下载,对服务器没有太大压力。
评分自己打开数据库查询.... 真的,知轩自己的仙草分没什么参考价值,你们看过数据库就知道了。还是建议其他大站看分数以后回来搜书下载转换吧.... - shadowmage这个过程不知道是否影响广告收入,有实力的话,建议把点广告也加进去,毕竟没收入支撑,网站也搞不下去,最后大家都没的玩
- windirt脚本点的广告... 怕是没有效果的..
- 77880099再来马克
- wo_epub附件下载不了,说文件过大?