使用阿里云CDN部署博客404 Page优化

发布时间: 更新时间: 总字数:180 阅读时间:1m 作者: IP上海 分享 网址
专栏文章
  1. Hugo 使用介绍
  2. 网站 SEO 教程
  3. 使用Jekyll在Github上搭建博客 -- 环境安装
  4. 基于Github Action自动发布git代码到CDN
  5. 采用 Algolia 作为 Hugo 搜索方案
  6. 使用Jekyll在Github上搭建博客 -- 如何将博客上传至github
  7. 如何在网页中插入关键词
  8. Hugo/静态网站搜索方案
  9. 使用阿里云CDN部署博客404 Page优化(当前)
  10. 图片格式转化和压缩
  11. 使用Jekyll在Github上搭建博客 -- 分页实现
  12. 使用Jekyll在Github上搭建博客 -- 子菜单的实现
  13. Jekyll 页面 liquid 语法介绍
  14. 采用Docker和解决Github Pages禁止百度爬虫的问题
  15. jekyll Web服务器列目录漏洞
  16. Jekyll发布文章时字符乱码解决办法 -- invalid byte sequence in GBK
  17. Staticgen
  18. Staticgen
  19. 静态页面发布服务器
  20. Surge 使用介绍
  21. Gitbook 使用

在使用阿里云CDN部署博客后,因页面重构导致URL地址变动,进而搜索引擎经常跳转到 404 Page,损失大量流量,本文提供一种获取跳转到404的原始页面。

原理

若访问的页面不存在,会在 CDN 的日志中出现 MISS 关键字,并且返回 http code 为 302。

脚本

  • 从阿里云cdn下载日志
  • 执行如下脚本获取错误的url地址
#!/bin/bash

gzip *.gz -d
cat www.xiexianbin.*0000 | grep -v "wp-includes" |  grep " 302 " | grep MISS | awk -F " " '{print $8}' | sed 's/"$//' | sort -r | uniq -c | sed 's/https/http/' | sed 's/www.xiexianbin.cn/localhost:1313/'
专栏文章
  1. Hugo 使用介绍
  2. 网站 SEO 教程
  3. 使用Jekyll在Github上搭建博客 -- 环境安装
  4. 基于Github Action自动发布git代码到CDN
  5. 采用 Algolia 作为 Hugo 搜索方案
  6. 使用Jekyll在Github上搭建博客 -- 如何将博客上传至github
  7. 如何在网页中插入关键词
  8. Hugo/静态网站搜索方案
  9. 使用阿里云CDN部署博客404 Page优化(当前)
  10. 图片格式转化和压缩
  11. 使用Jekyll在Github上搭建博客 -- 分页实现
  12. 使用Jekyll在Github上搭建博客 -- 子菜单的实现
  13. Jekyll 页面 liquid 语法介绍
  14. 采用Docker和解决Github Pages禁止百度爬虫的问题
  15. jekyll Web服务器列目录漏洞
  16. Jekyll发布文章时字符乱码解决办法 -- invalid byte sequence in GBK
  17. Staticgen
  18. Staticgen
  19. 静态页面发布服务器
  20. Surge 使用介绍
  21. Gitbook 使用
最新评论
Home Archives Categories Tags Statistics
本文总阅读量 次 本站总访问量 次 本站总访客数