全文搜索支持在文档内容中查找与搜索词匹配的项,而标准搜索只在文档字段中查找匹配项。

如何搜索文档内容

只能从高级搜索对话框中使用全文搜索。要在搜索中包含文档内容:

  1. 单击搜索栏中的双目镜筒图标,以打开高级搜索
  2. 搜索范围中,选择包含内容
  3. 根据需要填写剩余字段。

搜索字母数字和标点字段时,Vault 会将搜索词分隔成不同的段。此过程叫作“词语切分”。

关于搜索结果

当您在文档内容中进行搜索时,Vault 会对文档字段和文档内容分别进行搜索,然后合并最终的结果集。如果搜索结果包含超过 5,000 个文档,Vault 将把结果限制在最相关的前 5,000 个文档,并显示警告。要查看完整的结果集,请在执行下一个全文搜索之前应用额外的筛选器。

搜索结果页面

如果 Vault 在文档内容中找到搜索词匹配项,那么搜索结果页面将显示文档的摘录,以提供匹配词的上下文。

Vault 自动使用受支持的源文件格式对文档的全文编制索引,以支持全文搜索。文档内容通常在上传后的几分钟即可供搜索,但如果 Vault 同时上传多个文档,则可能出现延迟。同时也会对文档和对象附件编制索引。

可搜索的扫描文件

对于用户上传的图像或 PDF 文件的扫描源文件,Vault 可以提取其中的文本并对其编制索引。这种称为光学文字识别 (OCR) 的功能允许您对这些文档使用全文搜索。Vault 只提取输入的英文文本。

文本提取支持的格式

OCR 将自动尝试从具有以下受支持格式的文件中提取文本:

  • PDF(仅当 PDF 不包含文本时)
  • 可移植网络图形 (PNG)
  • 标签图像文件格式(TIF、TIFF)
  • JPEG(JPEG、JPG)
  • 图形交换格式 (GIF) 图像
  • 位图 (BMP)