文档屏幕

文档屏幕提供了一个简单的表单,允许您直接从浏览器以各种格式执行各种 Solr 索引命令。

image
图 1. 文档屏幕

屏幕允许您

  • 以特定于 Solr 的格式提交 JSON、CSV 或 XML 文档以进行索引

  • 上传文档(以 JSON、CSV 或 XML 格式)以进行索引

  • 通过选择字段和字段值来构建文档

还有其他加载数据的方法,另请参阅以下部分

公共字段

  • 请求处理程序:第一步是定义请求处理程序。默认情况下,将定义 /update。将请求处理程序更改为 /update/extract 以使用 Solr Cell。

  • 文档类型:选择文档类型以定义要加载的文档格式。其余参数可能会根据所选文档类型而改变。

  • 文档:输入与所选 文档类型 相对应的格式正确的 Solr 文档。XML 和 JSON 文档必须以特定于 Solr 的格式进行格式化,将显示一个小的说明性文档。CSV 文件应具有与模式中定义的字段相对应的标题。更多详细信息可以在 使用更新处理程序进行索引 中找到。

  • 提交时间:指定从提交文档到可搜索文档之间的时间(以毫秒为单位)。

  • 覆盖:如果为 true,新文档将替换 id 字段中具有相同值的现有文档。如果为 false,则可以添加多个具有相同 id 的文档。

在生产环境中将 覆盖 设置为 false 的情况非常罕见,默认值为 true

CSV、JSON 和 XML 文档

使用这些文档类型时,其功能类似于通过 curl 或类似方式提交文档。文档结构必须采用适用于文档类型的特定于 Solr 的格式。在选择各种类型时,文档文本框中会说明示例。

这些选项只会添加或覆盖文档;对于其他更新任务,请参阅 Solr 命令 选项。

文档生成器

文档生成器提供了一个类似向导的界面,用于输入文档的字段。

文件上传

文件上传选项允许选择一个已准备好的文件并将其上传。如果对请求处理程序选项使用 /update,则您将仅限于 XML、CSV 和 JSON。

其他文档类型(例如 Word、PDF 等)可以使用 ExtractingRequestHandler(又名 Solr Cell)进行索引。您必须将 RequestHandler 修改为 /update/extract,该 RequestHandler 必须在您的 solrconfig.xml 文件中定义,并包含您所需的默认设置。您还应该添加“提取请求处理程序参数”字段中显示的 &literal.id,以便为所选文件指定一个唯一 ID。可以在 使用 Solr Cell 和 Apache Tika 进行索引 中找到更多信息。

Solr 命令

Solr 命令选项允许您使用 /update 请求处理程序以及 XML 或 JSON 格式的命令来执行特定操作。一些示例是

  • 删除文档

  • 仅更新文档的特定字段

  • 对索引发出提交命令