网上找了一堆分词实例都是需要安装php扩展的,感觉比较麻烦所以选了一个简单的可以直接用的
第一步先下载需要的文件:
1.http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
2.http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2
3.http://www.xunsearch.com/scws/down/rules.tgz
下载这3个文件后把 rules 和 dictdb 解压放到 一个目录下
调用方法如下:
public function get_tags($title,$num){
require ROOT_PATH.'/Pscws/pscws4.class.php';
$pscws = new \PSCWS4('utf8');
$pscws->set_dict(CONF_PATH . 'etc/dict.utf8.xdb');
$pscws->set_rule(CONF_PATH . 'etc/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops($num);
$pscws->close();
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
return $tags;
return implode(',', $tags);
}
调用:$ress = $this->get_tags($content);
就可以得到分词结果。
如:分词:
简单方便实用。分词不是那么准确,差不多够用了。