Python爬虫 乱码求助

  • f
    fengjianzhi
    学爬虫
    源码
    # -*- coding:UTF-8 -*-
    import requests

    if __name__ == '__main__':
    target = 'http://www.biqukan.com/1_1094/5403177.html'
    req = requests.get(url=target)
    print(req.text)


    结果内容中有
    μúò»Õ Ëû½D°×D¡′¿_ò»Äîóàoã_DTÕæD¡Ëμ_±ê褸ó这样的乱码
    请问应该怎么改。
    谢谢hper
  • y
    yxmr
    要encode还是decode吧,这两个啥时候用哪个我也搞不明白
  • f
    fengjianzhi
    req.text是字符串类型,错误提示中说str没有decode,用encode后得到的是/x810这样的bytes。
  • f
    fengjianzhi
    请问如何变成汉字。
  • 林爱丰
    编码问题,就那几种可能,指定requests的编码,更改response的编码,自己网上搜一下解决方法试试呗。而且你这个应该是中文的乱码,不是url编码问题,网上关于这个的讨论很多了。
  • f
    fqxufo
    原网页是gbk的,python默认utf-8,所以显示乱码了
    可以这样解决
    1. req.encoding = req.apparent_encoding
    复制代码
  • s
    stefwoo
    2.7的编码坑特别多。 iOS fly ~