正文
[solr] - IKAnalyzer 分词加入
小程序:扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序
【扫一扫了解最新限行尾号】
复制小程序
1、下载IK Analyzer中文分词器:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip
2、解压出zip文件,将IKAnalyzer2012FF_u1.jar复制到tomcat中的solr\WEB-INF\lib目录中
3、在tomcat的solr\WEB-INF目录中,新建一个classes文件夹,将解压出的zip文件中的IKAnalyzer.cfg.xml和stopword.dic复制到classes中
4、用记事本打开E:\solrhome\mycore\conf\schema.xml文件,加入这句话到<schema/>节点内:
<fieldType name="text_general" class="solr.TextField">
<analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>
schema.xml是solr core位置,具体参见第一篇文章:http://www.cnblogs.com/HD/p/3977799.html
5、启动或重启tomcat
6、进入solr web: http://localhost:8899/solr
输入:一直以来,我都这样轻轻的走着
结果:
7、使用post.jar测试:
<add>
<doc>
<field name="id">88SS-CSS2</field>
<field name="name">我是Robin</field>
<field name="name1">my name 1</field>
<field name="publisher_id">12</field>
<field name="core0">welcome</field>
<field name="text">一直以来,我都是这样轻轻的走着...</field>
</doc>
<doc>
<field name="id">OMC-9923</field>
<field name="name">My test core, ha ha solr, I am come in.ss</field>
<field name="text">国家主席习xx17日抵达古吉拉特邦艾哈迈达巴德市,开始对印度进行国事访问。 当地时间下午2时50分许,习xx乘坐的专机抵达艾哈迈达巴德的机场。习xx和夫人彭xx受到印度古吉拉特邦邦长克利、首席部长帕特尔、印度驻华大使康特等热情迎接。图为习xx和夫人彭xx在印度总理莫迪陪同下一起荡秋千。</field>
</doc>
</add>
如何使用post.jar测试,参见第一篇文章:http://www.cnblogs.com/HD/p/3977799.html
结果: