calibre的recipe中get_title和link函数谁能帮忙解惑一下?

  • l
    lifanxi
    这个get_title和link都是这个recipe内部用的啊,跟calibre框架和API都无关。

    它先把URL对应的内容拿到当成一个soup来处理,然后找到class=lc_con1的div,作为需要的结果。然后遍历这些div,找到这些div中所有在新窗口打开(taget=_blank)的站内超链(忽略以http开头的,也就是外站的链接),这些超链的文字,也就是get_title中写的,作为标题,再截取第19个字节开始的内容(就是忽略掉“《随园食单》”这6个字)作为真正的标题。 链接就对应这些超链的链接。
  • t
    txdyd
    回复2#lifanxi
    难怪我没有找到出处,明白了。
    那么像link除了link.contents[0].strip(),link['href'],其他还有什么属性,哪里可以查到哪?
  • l
    lifanxi
    index_to_soup返回的是一个BeautifulSoup的对象,所以可以查BeautifulSoup的文档:http://www.crummy.com/software/BeautifulSoup/bs4/doc/
  • t
    txdyd
    这个网页我看了很多遍,没有说到 link这个对象啊
  • t
    txdyd
    哦,这一说我就明白了,也就是那个“link”用其他的字母组合代替也是可以的,我还以为是网络链接的那个link,类似于div,title,body之类的。
    非常感谢你的耐心解答。