python2吧 关注:81贴子:200
  • 5回复贴,共1

如何使用Python来生成sitemap

只看楼主收藏回复

在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:


IP属地:湖南1楼2017-06-13 22:23回复
    请安装以下依赖:
    sudo apt-get install libxml2-dev libxslt1-dev


    应用达人
    应用吧活动,去领取
    活动截止:2100-01-01
    去徽章馆》
    IP属地:湖南2楼2017-06-13 22:29
    回复
      Python代码
      下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:


      应用达人
      应用吧活动,去领取
      活动截止:2100-01-01
      去徽章馆》
      IP属地:湖南3楼2017-06-13 22:30
      回复
        效果
        生成的效果应该是这种格式:
        sitemap格式:


        应用达人
        应用吧活动,去领取
        活动截止:2100-01-01
        去徽章馆》
        IP属地:湖南4楼2017-06-13 22:31
        回复
          lastmod时间格式的问题
          格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取


          应用达人
          应用吧活动,去领取
          活动截止:2100-01-01
          去徽章馆》
          IP属地:湖南5楼2017-06-13 22:31
          回复
            优化
            一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。


            应用达人
            应用吧活动,去领取
            活动截止:2100-01-01
            去徽章馆》
            IP属地:湖南6楼2017-06-13 22:32
            回复