网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
10月14日
漏签
0
天
python2吧
关注:
81
贴子:
200
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<返回python2吧
>0< 加载中...
如何使用Python来生成sitemap
只看楼主
收藏
回复
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:
送TA礼物
IP属地:湖南
1楼
2017-06-13 22:23
回复
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请安装以下依赖:
sudo apt-get install libxml2-dev libxslt1-dev
应用达人
应用吧活动,
去领取
活动截止:2100-01-01
去徽章馆》
IP属地:湖南
2楼
2017-06-13 22:29
回复
收起回复
优视科技(中国)有限公司
一站式AI创作,专业资料任你选!
2024-10-14 09:59
广告
立即查看
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Python代码
下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:
应用达人
应用吧活动,
去领取
活动截止:2100-01-01
去徽章馆》
IP属地:湖南
3楼
2017-06-13 22:30
回复
收起回复
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
效果
生成的效果应该是这种格式:
sitemap格式:
应用达人
应用吧活动,
去领取
活动截止:2100-01-01
去徽章馆》
IP属地:湖南
4楼
2017-06-13 22:31
回复
收起回复
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
lastmod时间格式的问题
格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取
应用达人
应用吧活动,
去领取
活动截止:2100-01-01
去徽章馆》
IP属地:湖南
5楼
2017-06-13 22:31
回复
收起回复
xjjaitxr11
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
优化
一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。
应用达人
应用吧活动,
去领取
活动截止:2100-01-01
去徽章馆》
IP属地:湖南
6楼
2017-06-13 22:32
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
东部战区联合利剑2024B演习
2295510
2
林诗栋1比3不敌张本智和
2253416
3
S14淘汰赛对阵抽签结果出炉
1945748
4
郑钦文不敌萨巴伦卡获亚军
1920483
5
LPL全员晋级S14八强
1604876
6
SpaceX首次星舰成功
1470925
7
朝鲜向前线部队下达准备射击指示
1328016
8
WBG 2-1 DK
1264908
9
冯骥接受央视面对面节目专访
1051776
10
S14瑞士轮四大辅助巅疯对决
822066
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示