竞争对手词库
第三方工具,如 5118
PPC 或者其他流量渠道的关键词
抓取的工具也有很多,比如:
火车头
Python – scrapy
开发支持
不过需要注意的是,抓取工具一定要支持往下一层抓取(也叫深度抓取),而不能仅限于源页面的抓取 。
第二步 关键词扩展
抓取一批数据之后不要急着过滤和使用,要先扩展一批 。
这里可以借用搜索引擎的能力和工具进行扩展,有以下几个方式:
搜索引擎的搜索框提示词
搜索引擎的相关搜索词
文章插图
PPC 的扩词工具,如百度推广助手的关键词工具,Google Keyword Planner Tool.
扩展一大堆关键词之后还有非常重要的一步关键词seo培训,就是关键词分析,整理关键词组合 。
首先,通过分词和整理,可以拿到关键词的词根,以及对应的搜索量 。
文章插图
其次,手工把每个词根对应的关键词组合整理出来,并加上搜索量和出现次数
最后,就是考虑这些关键词怎么应用 。如果关键词组合的搜索量特别大,而且主题明确且独特,是建议单独开设一个频道,比如 「城市」+ 天气 。而对一些比较零散,无明确规则的关键词,则是需要添加到 SEO 频道关键词seo培训,比如 “杭州八景” 。
借用一张别人SEO博文中的一张图:
文章插图
第三步 关键词过滤
SEO 入库前还需要进行过滤 。以下关键词过滤的具体规则(应该是中文最全的规则了):
单复数过滤,比如 led light 和 led lights
前后顺序调整过滤,比如 led light 和 light led
空格处理,其中包含首尾空格去除、多个合并为一个
文章插图
特殊字符处理 。除了字母和数字外的其他符号,都是特殊字符
大小写处理 。一般是全部转换为小写
年份替换,比如 2016 替换为 2018
去停止词后去重 。一定要注意,先去停止词之后再去重,比如 “南京天气” 和 “南京的天气”,这样就可以过滤掉
黑名单过滤 。这里可以过滤掉包含黑名单里的关键词,而黑名单可人工维护,比如最近的一些敏感词
违禁词过滤,比如政治类敏感词、侵权品牌类关键词
结果数和相关性档位过滤 。根据搜索结果进行过滤,比如相关性档位为 3 的产品少于 20 个,页面就不会创建(或自动添加 noindex)
纯数字, 字母过滤 。对中文站来讲,纯字母的关键词比较偏向垃圾词,对英文站则不然
语种过滤 。中文站需要排除掉其他语向的关键词
长度过滤 。可以过滤掉过长或过短的关键词
单词数过滤,可以过滤掉一个单词,或者超过3个单词的关键词
注:上述很多规则来自阿里内部的关键词过滤工具中的功能 。
第四步 补充字段 & 入库
文章插图
入库时除了关键词以外,还需要补充相关的字段(对应每个数据库字段)
一般有以下数据:
关键词
行业分类,比如属于 3C 行业
关键词类型,比如是 price 类
添加时间
修改时间
添加人
搜索量
百度 / Google 结果数
- 如何学seoSEO学习的步骤是什么?
- 如何做网站seo优化,提升流量的6大关键?
- seo的效果怎么看,做seo推广可以保证效果吗?
- 如何seo网站推广SEO推广网站的多种方式?
- 淘宝seo优化教程,淘宝seo优化教程包括哪些方面?
- 详情页制作教程,详情页制作教程思路推荐?
- 淘宝网店培训,淘宝网店培训有哪些专业?
- seo搜索引擎优化方案?
- seo主要做什么,seo主要做这4方面的优化?
- seo的职业发展介绍,浅析SEO前景和职业发展方向?