Apache Solr - 术语
-
简述
在本章中,我们将尝试理解一些在使用 Solr 时经常使用的术语的真正含义。 -
常用术语
以下是在所有类型的 Solr 设置中使用的通用术语列表 --
Instance- 就像一个tomcat instance或一个jetty instance,这个术语是指应用程序服务器,它在 JVM 中运行。Solr 的主目录提供对这些 Solr 实例中的每一个实例的引用,其中可以配置一个或多个内核以在每个实例中运行。
-
Core− 在您的应用程序中运行多个索引时,您可以在每个实例中拥有多个核心,而不是多个实例每个拥有一个核心。
-
Home− 术语 $SOLR_HOME 是指主目录,其中包含有关内核及其索引、配置和依赖项的所有信息。
-
Shard− 在分布式环境中,数据在多个 Solr 实例之间进行分区,其中每个数据块都可以称为一个Shard. 它包含整个索引的一个子集。
-
-
SolrCloud 术语
在前面的章节中,我们讨论了如何以独立模式安装 Apache Solr。请注意,我们还可以在分布式模式(云环境)中安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并复制到一个或多个从服务器。与 Solr Cloud 相关的关键术语如下 --
Node− 在 Solr 云中,每个 Solr 实例都被视为一个node.
-
Cluster− 环境的所有节点组合在一起构成一个cluster.
-
Collection− 一个集群有一个逻辑索引,称为collection.
-
Shard− 分片是集合的一部分,具有索引的一个或多个副本。
-
Replica− 在 Solr Core 中,在节点中运行的分片副本称为replica.
-
Leader− 也是 shard 的一个副本,将 Solr Cloud 的请求分发给剩余的副本。
-
Zookeeper− 这是 Solr Cloud 用于集中配置和协调、管理集群和选举领导者的 Apache 项目。
-
-
配置文件
Apache Solr 中的主要配置文件如下:-
Solr.xml− 它是$SOLR_HOME 目录中包含Solr Cloud 相关信息的文件。为了加载内核,Solr 引用此文件,这有助于识别它们。
-
Solrconfig.xml− 该文件包含与请求处理和响应格式相关的定义和特定于核心的配置,以及索引、配置、管理内存和提交。
-
Schema.xml− 此文件包含整个架构以及字段和字段类型。
-
Core.properties− 此文件包含特定于核心的配置。它被称为core discovery,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,然后将其视为core directory.
-