### What problem does this PR solve? feat: Added explanation on the parsing method of knowledge graph #1594 ### Type of change - [x] New Feature (non-breaking change which adds functionality)
This commit is contained in:
@@ -191,7 +191,7 @@ export default {
|
||||
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
||||
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
||||
</p>`,
|
||||
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT</b>。</p>
|
||||
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
|
||||
<p>此方法将简单的方法应用于块文件:</p>
|
||||
<p>
|
||||
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|
||||
@@ -261,6 +261,13 @@ export default {
|
||||
</p><p>
|
||||
如果你要总结的东西需要一篇文章的全部上下文,并且所选LLM的上下文长度覆盖了文档长度,你可以尝试这种方法。
|
||||
</p>`,
|
||||
knowledgeGraph: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>
|
||||
|
||||
<p>文件分块后,使用分块提取整个文档的知识图谱和思维导图。此方法将简单的方法应用于分块文件:
|
||||
连续的文本将被切成大约 512 个 token 数的块。</p>
|
||||
<p>接下来,将分块传输到 LLM 以提取知识图谱和思维导图的节点和关系。</p>
|
||||
|
||||
注意您需要指定的条目类型。</p>`,
|
||||
useRaptor: '使用召回增强RAPTOR策略',
|
||||
useRaptorTip: '请参考 https://huggingface.co/papers/2401.18059',
|
||||
prompt: '提示词',
|
||||
|
||||
Reference in New Issue
Block a user