SEO收录异常诊断:负载均衡架构导致的SEO问题及解决方案( 二 )


就是百度根本没有抓取到真实的页面URL , 实际上抓取的是API域名+request_uri , 
即假设数据库服务器API给前端渲染的数据路径是api.**.com , 走内网IP,
抓取到的页面URL为:https://api.**.com/post/1.html
真实应该是外网IP的URL:https://www.**.com/post/1.html
既然核心问题已把握30% , 下一步自然是数据证明 , 主要从几个点 。
1、翻开发日志记录
2、4月前后的服务器日志整理对比
从1中发觉 , 4.13号负载均衡的数据服务器api取消代理 , 这样造成的后果是前端直接抓取了host主机值为api域名下的数据在前端渲染 , 因为是直接使用内网IP没经过代理 , 同时api二级域名为host主机值 。
从2中发觉 , 4月前后日志的host主机值出现了改变 , 由www.**.com变成了api.**.com 。
最终 , 问题就出现在host主机为api的站点 , 没有使用代理 , 也就是说只要api站点通过代理变成www的二级站点渲染即可 。如果没有使用代理 , 百度GET返回的页面是内网IP , 抓取到的也就是https://api.**.com/post/1.html 这个URL 。
解决方案:
1、负载均衡的数据服务器api接口使用代理
2、Head区增加标签
3、前端渲染的HTML使用绝对路径
4、开发个API接口推送数据
本文完 。鉴于本人仅是SEO , 运维能力有限 , 单机服务器配置下站可以 , 负载均衡只是略微听过 , 如有运维方面错误之处请见谅 。
来源:卢松松博客 作者:深圳传说 文中举例完成主域名网址为www.name.com

SEO收录异常诊断:负载均衡架构导致的SEO问题及解决方案

文章插图
申请创业报道 , 分享创业好点子 。 , 共同探讨创业新机遇!