1安装部署
1.1单节点安装部署
本文使用SOLR 4.4.0版本作为研究对象,要求JDK 1.6,tomcat 6。
1.1.1下载
下载地址
http://archive.apache.org/dist/lucene/solr/4.4.0/,分别下载linux版本和windows版本,区别只是打包的方式不一样。
1.1.2部署
1.1.2.1Windows环境部署
1.1.2.1.1Jetty
使用自带的jetty中间件部署solr。
1、解压文件
解压文件至j:\盘,solr目录是:J:\solr-4.4.0,文件目录如下。
contrib有一些功能模块是需要的jar包
dist是打包发布好的工程war包
docs是帮助文档
example是示例,里面有打包部署好的solr工程示例和servlet容器jetty。如果你没有tomcat可以直接使用Jetty服务器部署你的solr示例。
2、使用命令行,进入j:\solr\solr-4.4.0\example目录。运行start.jar文件。
# cd j:\solr\solr-4.4.0\example
# j:
# java –jar start.jar
3、登陆地址
http://localhost:8983/solr/
1.1.2.1.2Tomcat
1、解压出solr-4.4.0
2、复制solr-4.4.0\example\webapps中的solr.war文件到tomcat安装目录中的webapps文件夹下
3、运行tomcat。(忽略怎么运行tomcat),tomcat会自动解压solr.war文件。
4、删除solr.war文件。(不然每次启动tomcat都会发布一次)
5、回到tomcat的webapps目录下,记事本打开solr\WEB-INF\web.xml文件。
加入如下代码:在
如上代码,需要在J盘新建一个文件夹:solrhome
6、回到解压的solr-4.4.0目录,打开文件夹:solr-4.4.0\example\solr,复制所有内容到J:\solrhome
7、打开文件夹:solr-4.4.0\example\lib\ext,复制所有jar包到tomcat的webapps\solr\WEB-INF\lib下。
8、运行web:
http://localhost:8080/solr
注意solr 4.4只支持IE8以上浏览器版本。
1.1.2.2Linux环境部署
同windows环境部署方法
1.2集群安装部署
SolrCloud通过ZooKeeper集群来进行协调,使一个索引进行分片,各个分片可以分布在不同的物理节点上,多个物理分片组成一个完成的索引Collection。SolrCloud自动支持Solr Replication,可以同时对分片进行复制,冗余存储。
1.2.1准备工作
下载solr 4.4.0和zookeeper-3.3.6版本, 5台Redhat 6.1操作系统的虚拟机。其中三台安装搭建zookeeper集群,5台机器上都部署solr应用。
1.2.2配置主机
更改各个主机的hosts文件,在文件末尾添加:
192.168.1.201 slave1
192.168.1.202 slave2
192.168.1.203 slave3
192.168.1.204 slave4
192.168.1.205 slave5
重启系统。(如果和其他应用冲突,可以更改成其他的主机名称)
1.2.3配置zookeeper集群
以slave1主机为例:
1、下载zookeeper-3.3.6.tar文件,解压文件至/zookeeper文件目录
[root@slave1]# tar zxvf zookeeper-3.3.6.tar –C /zookeeper/
2、更改zoo.cfg配置文件
[root@slave1]# cd /zookeeper/conf
[root@slave1]# vi zoo.cfg
文件内容是:
tickTime=2000
initLimit=10
syncLimit=5
dataLogDir=/zookeeper/log/
dataDir=/zookeeper/data/
clientPort=2181
server.1=slave1:2888:3888
server.2=slave2:2888:3888
server.3=slave3:2888:3888
如果该目录中没有这个文件,则创建一个新的文件。注意每一个配置项的后面不要有空格,否则会报错。
3、配置myid文件
创建zoo.cfg文件中配置的dataLogDir和dataDir文件夹
[root@slave1]#mkdir /zookeeper/data/
[root@slave1]#mkdir /zookeeper/ log /
在dataDir指向的文件夹中创建myid文件,里面内容为一个数字,用来标识当前主机,conf/zoo.cfg文件中配置的server.X中X为什么数字,则myid文件中就输入这个数字,例如当前主机slave1,在zoo.cfg文件中对应的是server.1,所以myid文件中的值应该是1。
4、启动zookeeper
进入/zookeeper/bin文件夹,执行zkServer.sh文件
[root@slave1]#./zkServer.sh start
查看状态
[root@slave1]#./zkServer.sh status
查看启动日志
[root@slave1] #tail –f zookeeper.out
以slave1为案例配置其他两个节点。三个节点全部启动之后,zookeeper会根据选举算法选出一个leader,系统运行正常。
5、常见错误
#Cannot open channel to 2 at election address slave-02/192.168.0.178:3888 java.net.ConnectException: Connection refused
这是因为集群中的某一个节点没有启动完成,导致已经启动的节点无法连接该节点。这个错误在所有节点都启动成功之后消失。
#Cannot open channel to 1 at election address slave1/192.168.1.201:3888
java.net.NoRouteToHostException: No route to host
这是因为防火墙问题,关闭防火墙或开放相应端口
1.2.4配置solr集群
1、在5台机器上分别按照单节点安装部署方式部署solr(可以直接复制)。
2、创建配置文件目录(配置slave1)
在/solrhome下面建立一个core目录,比如叫collection
mkdir -p /solrhome/collection/conf
3、修改/solrhome/solr.xml(配置所有机器)
文件中的 hostPort 节点的端口号为tomcat的端口号
4、设置slave1节点为leader节点,更改tomcat启动脚本文件/tomcat/bin/catalina.sh文件,添加以下内容:
JAVA_OPTS='-DzkHost=192.168.1.201:2181,192.168.1.202:2181,192.168.1.203:2181 -Dbootstrap_confdir=/solrhome/collection/conf -Dcollection.configName=solrCloudConf'
修改其他节点的tomcat启动脚本文件,添加以下内容:
JAVA_OPTS='-DzkHost=192.168.1.201:2181,192.168.1.202:2181,192.168.1.203:2181'
5、创建collection
在地址栏中输入
2应用配置
2.1配置Core Admin
1、在j:\solrhome目录下,新建一个mycore文件夹。
2、在解压的solr-4.4.0\example\multicore目录中,复制core0文件夹中所有文件到j:\solrhome\mycore中。
3、在j:\solrhome中新建一个文件夹:mydocs
4、复制解压的solr-4.4.0\example\exampledocs下的post.jar到E:\solrhome\mydocs中
5、复制解压的solr-4.4.0\example\multicore\exampledocs下的ipod_other.xml文件到j:\solrhome\mydocs中
6、添加Core
2.2分词
2.3索引管理
2.4检索建议
2.5分组统计
2.6高亮显示
2.7拼写检查
2.8自动聚类
2.9相似匹配
2.10拼音检索