PHP中文分词实例

网上找了一堆分词实例都是需要安装php扩展的,感觉比较麻烦所以选了一个简单的可以直接用的

第一步先下载需要的文件:

1.http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2

2.http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2

3.http://www.xunsearch.com/scws/down/rules.tgz

下载这3个文件后把 rules 和 dictdb 解压放到 一个目录下


然后把2个php类文件放到一个目录下:




调用方法如下:

public  function get_tags($title,$num){
require ROOT_PATH.'/Pscws/pscws4.class.php';
$pscws = new \PSCWS4('utf8');
$pscws->set_dict(CONF_PATH . 'etc/dict.utf8.xdb');
$pscws->set_rule(CONF_PATH . 'etc/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops($num);
$pscws->close();

$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
return $tags;
return implode(',', $tags);
}

调用:$ress = $this->get_tags($content);

就可以得到分词结果。

如:分词:


得到:

简单方便实用。分词不是那么准确,差不多够用了。