您现在的位置:首页 >> 新闻 >> 网络营销
分享到:

搜索为什么要分词?

时间:2019-1-14 来源:njcxt 点击:
A.字符串匹配的分词方法

首先来看正向最大匹配法,就是把一个词从左至右来分词。举个例子,“不知

道你在说什么”这句话采用正向最大匹配法是如何进行分词的呢?结果是“不知追,

你,在,说什么”。

其次是反向最大匹配法。沿用例子,“不知道你在说什么”用反向最大匹配法

如何进行分词?答案是“不,知道,你在,说,什么”。这次就分得比较细了。反

向最大匹配法就是从右至左来分词。

最后是最短路径分词法。怎么理解呢?就是将一段话切出最少的词数。还是



不知道你在说什么

举例,用最短路径分词法来分,就是把这

句话分成最少

的词。答案是“不知道,你在,说什么”,只有3个词

法和反向最大匹配法组合起来就可以叫作双向最大匹配活。例如,正向最大匹配

当然

上面3种方法可以相互结合,组成一些分词方法

B.词义分词法

词义分词法其实就是一种机器语音判断分词方法。很简单,进行句法、语义分

析,利用句法信息和语义信息来处理歧义现象并进行分词。这种分词方法现在还不

成熟,处于测试阶段。

C.统计的分词方法

统计的分词方法很简单,就是根据词组的统计结果来分词。如果发现两个相

邻的字出现的频率最高,那么这个词就很重要,就可以作为用户提供字符串中的

分隔符。例如,“我的”、“你的”、“许多的”、“这里”、“这一”、“那里”等词出现

得比较多,就可以从这些词的位置来分词。

这些分出来的词,把它们都作为你站点的主题页,导入链接权重上来了,竞争

力就大了,因为这些页面把它内链起来。用锚链接,指向主页的目标关键词。这就

是分词的好处。它能够提升目标关键词的排名的竞争力,同时给站点带来一定流量。

旦导入链接权重上来了,竞争力就大了,因为这些页面把它内链起来。

中文分词问题是绝大多数中文信息处理的基本问题。中文分词系统在搜索引

擎、推荐系统(尤其是相关主题推荐和基于内容的过滤推荐)、大量文本自动分类

等部分是一个关键部件。

Copyright (c) 2009-2010 200698.COM . All rights reserved 网站备案号:苏ICP备12074358号-1
南京百度优化|南京网站建设|南京百度推广|-南京成旭通信息技术有限公司