网站建设,网站优化,竞价托管,网站托管,全网营销,品牌推广,就找千佰特
当前位置:SEO网站优化>SEO技术博客 > SEO技术 > 正文

SEO优化公司:SEO词库搭建技巧分享

01-02 SEO技术

 
 SEO优化公司:SEO词库搭建技巧分享
 
一、规范词条数据
 
我们最好可以整理出规范的数据。如:对「三国、群英传」,这种就属于不规范的数据的一切后续处理,都是无效用功,应该尽量提前解决掉这个麻烦。简单粗暴处理的话,直接把所有的特殊符号搞过来,批量处理掉。这时候基本上拿到规范的数据,容错度在接受范围之内。玩这种数据,不要想干干净净,总是会有些地方有点小问题,习惯了就好。
 
二、标记源数据词条精简词条
 
这时候,要做的就是去重处理,什么是去重?如「深圳租房」、「深圳租房子」、「深圳出租房」、「去深圳租房」、「租房深圳」、「深圳租房的网站」、「深圳租房网」等等,可能有几十个类似表述,可以归属到一个词——「深圳租房」。将这些分词并标注词性。 新增 B 列,便于后面的操作;删除虚词,替换等义词,拿到规范的实体词,放到 C 列;精简词条包含字符重新排序,置于 D 列。转 unicode 编码,提取数字,多行独立重排。解决了文字内容相同,顺序不同,实际等义识别的问题。这一步有点慢,10 万行的词条可能不下于 10 分钟。这样就基本上拿到理想的精简词条,而且精简词条对应的源数据词条清晰明了,多少个源数据,就有多少航精简词条对应,非常符合表格的设计原则和可视化观看,画面很美。
 
三、逆选词条
 
逆选词条的目的就是选出精简词条对应的最合适的源数据词条。提取 A 列字节数,新增 E 列。 这时候可以做该列升序排序(降序也可以)。对 E 列上下行做判断,判断结果放到 F 列。当上行与下行不同时,标注 TRUE。TRUE 对应的是最合适的源数据词条,做完这些基本上拿到了最合适的源数据词条。
 
四、完善词库字段
 
既然是要搭建词条表就要有个表的样子。SEO网站优化公司建议添加若干列字段,字段名来自字典分类,电商行业有品牌、品类、人群等,旅游行业有景点、国家、酒店等。通用的更简单,比如疑问类、对比类、排行类等。是的,需要字典表。没有的话,这一步就卡住了。字典不是一下子完善的,实在没有就不搞了。这一步是数据精确完成,不存在什么基本上。字典怎样,你添加的字段就是怎样。
 
上述就是深圳SEO优化中词库表的构建技巧,想要学习的朋友可以对照上面提到的步骤,用 Excel 演练一遍。少搞点数据,100 条意思下就行了,先把流程跑通。
 
 
SEO优化公司http://seo.qbt8.com/
 

版权保护: 本文由 深圳SEO公司 原创,转载请保留链接: http://seo.qbt8.com/blog/seo/338.html

博主千佰特SEO专员
深圳SEO博客-由深圳SEO网站优化外包公司(千佰特)团队所创立的SEO技术博客,主要由企业在职关键词优化排名的人员更新SEO技术文章,深圳SEO优化服务就找千佰特,热线:0755-83174789
  • 文章总数
  • 43039访问次数
  • 建站天数