python爬虫编码问题

测试
python爬虫爬到的中午都是这种形式,用HTMLParser().unescape可以转为中文,但是也把原字符串的=>实体也转为html标签了,怎么解决这个问题
查看回复