尽管分析过程用于编制索引和查询,但没有必要对这两个操作使用相同的分析过程。对于编制索引,你通常希望简化或规范化单词。例如,将所有字母设为小写,消除标点符号和重音,将单词映射到其词干,等等。这样做可以提高召回率,因为例如,“ram”、“Ram”和“RAM”都将匹配查询“ram”。为了提高查询时间精度,过滤器可以通过忽略所有大写缩略词来缩小匹配范围,例如,如果你对公羊感兴趣,但对随机存取存储器不感兴趣。
分析过程输出的标记定义了该字段的值或术语,并且在添加新文档时用于构建这些术语的索引,或用于识别包含你正在查询的术语的文档。
这些部分将向你展示如何配置字段分析器,还可以作为配置每个可用的分词器和过滤器类的详细信息的参考。它还作为一个指南,以便你可以在无法满足包含的过滤器或分词器的特殊需求的情况下配置自己的分析类。