百度搜索引擎在中文领域市场占有率第一的地位,严格来说是他有了一套非常好的分词技术。当然高深的分词技术我们是无法探知的。但我们可以从一些表面的一些“管”来窥其里面的“豹”。本文就从一些常见的分词发来分析我们写原创文章时,如何保证内容与标题的相关性。
1,数字与中文组合词
大家可以到百度里搜索4399洛克王国,通过上图我们可以发现“4399洛克王国”连起来是变红的;“洛克王国”是变红的;“洛克”也是变红的。我们就可以得到一个结论,那就是百度分词库里,4399是一个词,洛克是一个词,王国是一个词,4399洛克王国是一个词,洛克王国也是一个词。因为4399洛克王国是4399游戏网独有的一个游戏名。所以才造出了这个词,也就被百度词库给索引到了。由此可以得出结论,我们再写有数字和中文组合的产品相关的文章的时候,我们需要给文章的内容里出现这个产品名的全名,也需要出现这个产品名分词后单个词。我们总是在说关键词的密度,其实这个密度不是那一个全称的密度,还可以把分词的密度也计算到一个页面里。这样的组合方式可以常用在写软件版本,网站版本里。比如什么什么1.0版本等。