网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
02月08日
漏签
0
天
python吧
关注:
470,910
贴子:
1,957,233
看贴
图片
吧主推荐
视频
游戏
18
回复贴,共
1
页
<<返回python吧
>0< 加载中...
爬取番茄小说出现乱码
只看楼主
收藏
回复
叫什么呢好难啊
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
各位大佬,我爬取番茄小说的文章时,部分内容编码不是unicode,有办法解析吗
第一张图是爬取的编码,第二章是正常的文字
Arctic
榜眼
13
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
明显是字体反爬
元宇丰业(福建)数字科技
一次激活,长久使用,安全稳定无广告,无捆绑,专业软件,在线客服稳定售后有保障!
2025-02-08 20:03
广告
立即查看
日行一善吧
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
字体反爬了解一下
科學信仰
贡士
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
那就把unicode直接解析成汉字再输出
unicode_codes = [0x4E2D, 0x56FD, 0x6C49, 0x5B57]
for code in unicode_codes:
print(chr(code), end=' ')
叫什么呢好难啊
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
它不是unicode的编码,打不出来汉字
吃软饭的猫
贡士
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
RE:嗨嗨害
鵺鵺鵺
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
网页上的一般是用UTF8吧
贴吧用户_QyMe9eW
童生
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
下次记得把代码也发出来
蘿蔔特酸
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
人家用的是专有字体,大部分字形编码都移了位,你爬下来用普通的字体当然显示不出来
nicely
🍊
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
52pojie有人发过,你去搜一下就行了
肚腩啦啦啦啦
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
能教一下怎么爬吗
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示