文档屏幕
文档屏幕提供了一个简单的表单,允许您直接从浏览器以各种格式执行各种 Solr 索引命令。
屏幕允许您
-
以特定于 Solr 的格式提交 JSON、CSV 或 XML 文档以进行索引
-
上传文档(以 JSON、CSV 或 XML 格式)以进行索引
-
通过选择字段和字段值来构建文档
还有其他加载数据的方法,另请参阅以下部分 |
公共字段
-
请求处理程序:第一步是定义请求处理程序。默认情况下,将定义
/update
。将请求处理程序更改为/update/extract
以使用 Solr Cell。 -
文档类型:选择文档类型以定义要加载的文档格式。其余参数可能会根据所选文档类型而改变。
-
文档:输入与所选
文档类型
相对应的格式正确的 Solr 文档。XML 和 JSON 文档必须以特定于 Solr 的格式进行格式化,将显示一个小的说明性文档。CSV 文件应具有与模式中定义的字段相对应的标题。更多详细信息可以在 使用更新处理程序进行索引 中找到。 -
提交时间:指定从提交文档到可搜索文档之间的时间(以毫秒为单位)。
-
覆盖:如果为
true
,新文档将替换id
字段中具有相同值的现有文档。如果为false
,则可以添加多个具有相同 id 的文档。
在生产环境中将 |
CSV、JSON 和 XML 文档
使用这些文档类型时,其功能类似于通过 curl
或类似方式提交文档。文档结构必须采用适用于文档类型的特定于 Solr 的格式。在选择各种类型时,文档文本框中会说明示例。
这些选项只会添加或覆盖文档;对于其他更新任务,请参阅 Solr 命令 选项。
文件上传
文件上传选项允许选择一个已准备好的文件并将其上传。如果对请求处理程序选项使用 /update
,则您将仅限于 XML、CSV 和 JSON。
其他文档类型(例如 Word、PDF 等)可以使用 ExtractingRequestHandler(又名 Solr Cell)进行索引。您必须将 RequestHandler 修改为 /update/extract
,该 RequestHandler 必须在您的 solrconfig.xml
文件中定义,并包含您所需的默认设置。您还应该添加“提取请求处理程序参数”字段中显示的 &literal.id
,以便为所选文件指定一个唯一 ID。可以在 使用 Solr Cell 和 Apache Tika 进行索引 中找到更多信息。