我和SOLR不得不说的故事(我与你不得不说的故事作文)

1安装部署

1.1单节点安装部署

本文使用SOLR 4.4.0版本作为研究对象,要求JDK 1.6,tomcat 6。

1.1.1下载

下载地址
http://archive.apache.org/dist/lucene/solr/4.4.0/,分别下载linux版本和windows版本,区别只是打包的方式不一样。

1.1.2部署

1.1.2.1Windows环境部署

1.1.2.1.1Jetty

使用自带的jetty中间件部署solr。

1、解压文件

解压文件至j:\盘,solr目录是:J:\solr-4.4.0,文件目录如下。

contrib有一些功能模块是需要的jar包

dist是打包发布好的工程war包

docs是帮助文档

example是示例,里面有打包部署好的solr工程示例和servlet容器jetty。如果你没有tomcat可以直接使用Jetty服务器部署你的solr示例。

2、使用命令行,进入j:\solr\solr-4.4.0\example目录。运行start.jar文件。

# cd j:\solr\solr-4.4.0\example

# j:

# java –jar start.jar

3、登陆地址
http://localhost:8983/solr/

1.1.2.1.2Tomcat

1、解压出solr-4.4.0

2、复制solr-4.4.0\example\webapps中的solr.war文件到tomcat安装目录中的webapps文件夹下

3、运行tomcat。(忽略怎么运行tomcat),tomcat会自动解压solr.war文件。

4、删除solr.war文件。(不然每次启动tomcat都会发布一次)

5、回到tomcat的webapps目录下,记事本打开solr\WEB-INF\web.xml文件。

加入如下代码:在节点内的最后。

solr/home

j:\solrhome

java.lang.String

如上代码,需要在J盘新建一个文件夹:solrhome

6、回到解压的solr-4.4.0目录,打开文件夹:solr-4.4.0\example\solr,复制所有内容到J:\solrhome

7、打开文件夹:solr-4.4.0\example\lib\ext,复制所有jar包到tomcat的webapps\solr\WEB-INF\lib下。

8、运行web:
http://localhost:8080/solr

注意solr 4.4只支持IE8以上浏览器版本。

1.1.2.2Linux环境部署

同windows环境部署方法

1.2集群安装部署

SolrCloud通过ZooKeeper集群来进行协调,使一个索引进行分片,各个分片可以分布在不同的物理节点上,多个物理分片组成一个完成的索引Collection。SolrCloud自动支持Solr Replication,可以同时对分片进行复制,冗余存储。

1.2.1准备工作

下载solr 4.4.0和zookeeper-3.3.6版本, 5台Redhat 6.1操作系统的虚拟机。其中三台安装搭建zookeeper集群,5台机器上都部署solr应用。

1.2.2配置主机

更改各个主机的hosts文件,在文件末尾添加:

192.168.1.201 slave1

192.168.1.202 slave2

192.168.1.203 slave3

192.168.1.204 slave4

192.168.1.205 slave5

重启系统。(如果和其他应用冲突,可以更改成其他的主机名称)

1.2.3配置zookeeper集群

以slave1主机为例:

1、下载zookeeper-3.3.6.tar文件,解压文件至/zookeeper文件目录

[root@slave1]# tar zxvf zookeeper-3.3.6.tar –C /zookeeper/

2、更改zoo.cfg配置文件

[root@slave1]# cd /zookeeper/conf

[root@slave1]# vi zoo.cfg

文件内容是:

tickTime=2000

initLimit=10

syncLimit=5

dataLogDir=/zookeeper/log/

dataDir=/zookeeper/data/

clientPort=2181

server.1=slave1:2888:3888

server.2=slave2:2888:3888

server.3=slave3:2888:3888

如果该目录中没有这个文件,则创建一个新的文件。注意每一个配置项的后面不要有空格,否则会报错。

3、配置myid文件

创建zoo.cfg文件中配置的dataLogDir和dataDir文件夹

[root@slave1]#mkdir /zookeeper/data/

[root@slave1]#mkdir /zookeeper/ log /

在dataDir指向的文件夹中创建myid文件,里面内容为一个数字,用来标识当前主机,conf/zoo.cfg文件中配置的server.X中X为什么数字,则myid文件中就输入这个数字,例如当前主机slave1,在zoo.cfg文件中对应的是server.1,所以myid文件中的值应该是1。

4、启动zookeeper

进入/zookeeper/bin文件夹,执行zkServer.sh文件

[root@slave1]#./zkServer.sh start

查看状态

[root@slave1]#./zkServer.sh status

查看启动日志

[root@slave1] #tail –f zookeeper.out

以slave1为案例配置其他两个节点。三个节点全部启动之后,zookeeper会根据选举算法选出一个leader,系统运行正常。

5、常见错误

#Cannot open channel to 2 at election address slave-02/192.168.0.178:3888 java.net.ConnectException: Connection refused

这是因为集群中的某一个节点没有启动完成,导致已经启动的节点无法连接该节点。这个错误在所有节点都启动成功之后消失。

#Cannot open channel to 1 at election address slave1/192.168.1.201:3888

java.net.NoRouteToHostException: No route to host

这是因为防火墙问题,关闭防火墙或开放相应端口

1.2.4配置solr集群

1、在5台机器上分别按照单节点安装部署方式部署solr(可以直接复制)。

2、创建配置文件目录(配置slave1)

在/solrhome下面建立一个core目录,比如叫collection

mkdir -p /solrhome/collection/conf

3、修改/solrhome/solr.xml(配置所有机器)

文件中的 hostPort 节点的端口号为tomcat的端口号

${jetty.port:8080}

4、设置slave1节点为leader节点,更改tomcat启动脚本文件/tomcat/bin/catalina.sh文件,添加以下内容:

JAVA_OPTS='-DzkHost=192.168.1.201:2181,192.168.1.202:2181,192.168.1.203:2181 -Dbootstrap_confdir=/solrhome/collection/conf -Dcollection.configName=solrCloudConf'

修改其他节点的tomcat启动脚本文件,添加以下内容:

JAVA_OPTS='-DzkHost=192.168.1.201:2181,192.168.1.202:2181,192.168.1.203:2181'

5、创建collection

在地址栏中输入

2应用配置

2.1配置Core Admin

1、在j:\solrhome目录下,新建一个mycore文件夹。

2、在解压的solr-4.4.0\example\multicore目录中,复制core0文件夹中所有文件到j:\solrhome\mycore中。

3、在j:\solrhome中新建一个文件夹:mydocs

4、复制解压的solr-4.4.0\example\exampledocs下的post.jar到E:\solrhome\mydocs中

5、复制解压的solr-4.4.0\example\multicore\exampledocs下的ipod_other.xml文件到j:\solrhome\mydocs中

6、添加Core

2.2分词

2.3索引管理

2.4检索建议

2.5分组统计

2.6高亮显示

2.7拼写检查

2.8自动聚类

2.9相似匹配

2.10拼音检索