自动抓取小说工具(epub,mobi)

  • B
    Bellinggg
    链接:https://pan.baidu.com/s/1hPmdI-7vLW3EFOWtqfLV1w提取码: p48r 复制这段内容后打开百度网盘手机App,操作更方便哦

    从github上面的一个项目,改动之后,打包成exe,现在实现以下这些功能:
    1.目前支持的网站:
    笔趣阁https://www.qu.la
    笔趣阁http://www.biquge.com.tw
    顶点小说http://www.booktxt.net
    笔趣阁http://www.biqubook.com

    2.自动生成epub和mobi格式

    用法:
    以《唐朝工科生》为例,地址为https://www.booktxt.net/1_1296/
    抓取命令为:novel.exe -urlshttps://www.booktxt.net/1_1296/
    完成后自动在epub目录下生成相应epub和mobi文件

  • l
    liliang026
    哇,好人一生平安
  • t
    taihang
    很不错,请教下原始项目是哪个?
  • l
    linyin1750
    这两天正在搞这个,用了一个八爪鱼抓取,抓取到一半提示错误,还有个什么后羿抓取,用不来啊。
    试试楼主这个。
    楼主可以新增一个“追书帮”这个网站,www.zhuishubang.com上面内容基本无错,中间夹杂的广告也很少。

    要从dos运行才行,直接双击或从管理员运行要闪退。

    以下是刚刚抓取的小说。


    下面是在EDGE浏览器打开界面。

  • B
    Bellinggg
    回复4#linyin1750


    能用就行

    双击出错是因为没有指定抓取书源,有空我会把“追书帮”也加进去的

    你可以尝试建立批处理,就可以双击了
  • l
    linyin1750
    回复5#Bellinggg


    搞不来啊,只能拿来主义,顺便再给点意见了。
  • t
    tantalus.lee
    多谢,这个真好 iOS fly ~
  • l
    lykayang
    https://github.com/dfordsoft/getnovel
    这个是HIPDA网友的作品
  • B
    Bellinggg
    回复8#lykayang


    不是每个人都是那么精通计算机,我就是想要把门槛降到最低,让每个人都能读到最新的书。
    其实我也是为自己做的,因为自己的kindle没破解,抓下来的小说能很快的自动排版完成生成mobi
  • c
    cthlj
    回复8#lykayang


    mark,备用!楼主也强!
  • c
    cas110110
    标记下,真厉害,学习学习 iOS fly ~
  • m
    metaldudu
    楼主注明github来源最好,确实好工具
  • c
    cas110110
    回复9#Bellinggg
    有什么完本的小说,顺便分享给我吧,嘿嘿我也是够懒的 iOS fly ~
  • B
    Bellinggg
    回复13#cas110110


    哈哈,我把工具分享出来就是不想做这个事
  • z
    zouronghu
    会了,重拾起近二十多年前的DOS知识了
  • p
    poor567
    回复8#lykayang

    这个不大好用,有些章节爬不下来
  • f
    fallor
    阅读也是开源的吧,抓书可以用阅读的模块
  • s
    sirotaku
    github 源是哪个呀,mac只有自力更生了
  • s
    sakjsak
    mark 下载小说
  • v
    valava
    马克一下,这个有用
  • p
    poor567
    确实好用,速度很快,爬了道门法则和诡秘之主,特来汇报!!!
  • w
    williamwoo
    从dos启动也未成功,不知道为什么
  • w
    williamwoo
    回复5#Bellinggg

    终于弄明白了,谢谢!
  • 吹雪
    看起来 NB
  • m
    missdeerme
    同样的敲命令行的,怎么那个就要“精通计算机”了?
  • m
    missdeerme
    遇到爬不下来的,就去https://github.com/dfordsoft/getnovel/issues提bug,这样才有机会改进。
  • t
    taihang
    楼主虽然做了加工,但是也不是图形界面,还需要命令行,并没有到位,另外是github的项目就应该注明链接,这才是喝水不忘挖井人。感谢楼上和8楼提供github原址
  • t
    taihang
    原来层主是这个getnovel的作者啊,失敬失敬
  • t
    taihang
    幼狮书盟这个地址从www.yssm.org
    变成了
    www.yssm.tv配置能不能更新一下,实测下不了
    $ getnovelhttps://www.yssm.tv/uctxt/452/452675/
    getnovel SHA1: build at
    not downloadedhttps://www.yssm.tv/uctxt/452/452675/
  • 四氢湖南
    收藏,等下看看代碼
  • j
    jrc2007
    好东西
  • c
    clockwise121
    楼主造福大家 感谢
  • a
    allen999
    感谢,厉害了
  • f
    fmmf3537
    除了第一个网址,其他三个好像都挂了。。。。
  • c
    cahaya
    支持的网站要是能从“阅读”里面导入就好了,上次有个1100网站的文件,导入“阅读”后看书基本无忧。这个能抓取成文件很适合没有越狱的kindle,但是作者自己添加网站太不方便,最好能让用户自己去添加
  • s
    skh001
    没有排版的epub还不如txt
  • z
    zzt1
    取消分享了?
  • 8
    8341
    回复39#superairport


    楼上的在哪里找到下载的?
  • g
    guaiguai
    好像不能用了吧。
  • b
    brainyard
    回复1#Bellinggg

    好好工具,收藏了
  • a
    adogs
    lz工具已经被河蟹了,很重新发不?
  • 王小败
    马克一下
  • x
    xuwen0627
    马克小说
  • z
    zhouxi6868
    马克标记一下 iOS fly ~
  • 云笑九州
    才发现,明天试试
  • p
    pad2046
    很厉害
  • s
    snoopy2556
    mark,我自己写了一个,估计爬的太狠了,一会就被中断了,学习下
  • 数不清
    好工具收藏了 iOS fly ~