本文环境是建立在solr集群上面的,未搭建环境的小伙伴可以移步至:
1. 下载mmseg4j的jar包
需要两个jar : mmseg4j-core-1.10.0.jar mmseg4j-solr-2.3.0.jar
2. 加载jar包
将jar 放到solr集群中,下面的节点都要放。具体放在 我的目录是:/root/solr-5.4.0/dist
然后配置solr参数 在你创建的collection的配置文件solrconfig.xml中加入
比如我的是~/solr_home/webpage/conf/ 下面的solrconfig.xml:
在创建collection的时候将dist下面的jar包加载进去
配置schema.xml 加入自定义的字段 和分词类型:
3. solrcloud命令创建collection:
./bin/solr create_collection -c students -d server/solr/configsets/sample_techproducts_configs/conf -shards 3 -replicationFactor 3
4. 可以到solr管理界面查看
点这个schema browser 搜索你自定义的字段 my_content 可以查看状态了。
这说明字段都添加成功了。
还可以检查分词的效果,在solr 管理界面左侧边栏选 项,输入测试语句,点击Analyse Values就可以啦:
出现这样的效果说明分词成功~