feat: Added explanation on the parsing method of knowledge graph #1594 (#1916)

### What problem does this PR solve?

feat: Added explanation on the parsing method of knowledge graph #1594

### Type of change


- [x] New Feature (non-breaking change which adds functionality)
This commit is contained in:
balibabu
2024-08-12 18:56:01 +08:00
committed by GitHub
parent 936d8ab7dd
commit eb8feaf20a
9 changed files with 226 additions and 7 deletions

View File

@@ -191,7 +191,7 @@ export default {
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
</p>`,
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT</b>。</p>
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
<p>此方法将简单的方法应用于块文件:</p>
<p>
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
@@ -261,6 +261,13 @@ export default {
</p><p>
如果你要总结的东西需要一篇文章的全部上下文并且所选LLM的上下文长度覆盖了文档长度你可以尝试这种方法。
</p>`,
knowledgeGraph: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>
<p>文件分块后,使用分块提取整个文档的知识图谱和思维导图。此方法将简单的方法应用于分块文件:
连续的文本将被切成大约 512 个 token 数的块。</p>
<p>接下来,将分块传输到 LLM 以提取知识图谱和思维导图的节点和关系。</p>
注意您需要指定的条目类型。</p>`,
useRaptor: '使用召回增强RAPTOR策略',
useRaptorTip: '请参考 https://huggingface.co/papers/2401.18059',
prompt: '提示词',