照猫画虎写了个知轩藏书的一键转换脚本,4月8日更新提高百倍效率

  • z
    zhdphao
    有木有抓mp3的,拿来就可以用的那种?抓几个网络小说mp3的网站。
  • w
    windirt
    这个没有,不过你可以把网站先列出来看看
  • r
    robinzhu78
    这个不错,之前习惯下txt再转发kindle,每次都没封面慢慢也习惯了
  • n
    nkorange
    回复1#windirt
    下来看看 iOS fly ~
  • 海带超人
    求下载包,谢谢 iOS fly ~
  • s
    stevenflp
    马克 iOS fly ~
  • z
    zhdphao
    举个栗子:https://www.5tps.com/
  • 7
    77880099
  • k
    kenchn
    马克 iOS fly ~
  • 零点十分
    Mark一下
  • w
    windirt
    在macOS + Chrome 下,我打开任何页面都听不到声音。。。。
  • m
    mmburning
    感谢楼主的分享,思路很好
  • Y
    Yangpioneer
    厉害的
  • j
    jamal
    学习下
  • z
    zdb1115
    谢谢分享
  • h
    happyd8699
    有没有按照仙草数排序的爬虫?
  • 潘少拉
    楼主厉害
  • h
    hzll
    楼主厉害 iOS fly ~
  • 谁家丢的西瓜皮
    标记一下 iOS fly ~
  • z
    zerofire
    以前抓过漫画,一张一张抓下来。
  • r
    ryoluo
    普通人能用的么?
  • 警察蜀黍
    学习了
  • 老童
    感觉普通人用不了。。。想用。。。
  • 老童
    回复1#windirt


    完全不懂,依托百度,一路摸索着,脚本跑起来了,现在貌似卡在切割章节了。请问这一步是需要很久吗,还是哪里出错。WechatIMG57.png
  • 老童
    饿,切割是需要很久,搞定了,谢谢楼主。
  • w
    windirt
    因为每一行作为一个对象遍历查询是否正文还是章节,然后要多给一个回车,超大的文本会慢一些
  • w
    windirt
    3.30日更新:
    修正了epub里书名和作者栏位出现 “书名:” 和“作者:”的问题,做了一些判断移除掉了

    已知问题:极少数的书会在下载封面的时候导致程序退出,原因是封面图片外链了
  • m
    myfaint007
    厉害了小尾巴~
  • w
    windirt
    ----------------2020年4月8日更新-----------
    转换思路,大幅优化了TXT转换MARKDOWN的处理逻辑,例如原来处理编号11805的修真聊天群转换需要差不多5分钟,现在只要2秒
    另外附带了epub.css,做了部分美化,不过pandoc转换出来的epub使用的css项目较少,可控性不是太高
    精简了转换出来的文件名,改为 书名_作者.epub
  • w
    wsyx87930
    还好知轩站长不来地板,不然被你们气出心脏病来
  • l
    lovemu
    马克图书
  • w
    windirt
    哎,我这个不是爬虫,就是把繁琐的工作简单化,获取小说id一样要打开网站,站长肯定不会骂的
  • v
    vivakira
    爬完了上传个百度盘吧,朋友们就不用再多爬了
  • u
    ujin
    回复32#Reloaded


    图片有1g多,我打包找个地方传
  • a
    aahaa
    马克一记
  • w
    wxdwxd
    强,马可已经
  • R
    Reloaded
    多谢兄弟,不急的
  • w
    windirt
    正在做个数据库,按仙草排列的,全站书有5549本已经爬完

    不过这个仙草意义不大,样本数太少,我觉得还是去起点,纵横等大站看那边的排名,再来知轩藏书搜书,用id下载转换


  • w
    windirt
    生成了一个sqlite3的数据库,采集了所有书的仙草值,排序一下,按id下载吧




    library.db.zip(259.84 KB)
  • s
    sunnycougar
    厉害了,本小白mark了
  • l
    liueno
    楼主以及各位大卡,可以加入安排评分比下载吗?
  • 档的生日
    感谢感谢~
  • w
    windirt
    现在的程度我觉得已经够用了,脚本单文件单线程下载,对服务器没有太大压力。
    评分自己打开数据库查询.... 真的,知轩自己的仙草分没什么参考价值,你们看过数据库就知道了。还是建议其他大站看分数以后回来搜书下载转换吧....
  • s
    shadowmage
    这个过程不知道是否影响广告收入,有实力的话,建议把点广告也加进去,毕竟没收入支撑,网站也搞不下去,最后大家都没的玩
  • w
    windirt
    脚本点的广告... 怕是没有效果的..
  • 7
    77880099
    再来马克
  • w
    wo_epub
    附件下载不了,说文件过大?