准备对AI流式音频发回给前端的机制做较大的修改,先提交1个版本

This commit is contained in:
qcloud
2025-07-19 22:44:28 +08:00
parent 74899acab9
commit 44cb7c0dca
9 changed files with 766 additions and 868 deletions

View File

@@ -152,10 +152,11 @@ def upload_file(tenant_id,mesum_id):
prompt = (
f"作为图片识别和理解助手,您的任务是:"
f"\n1. 精确识别图片中的文字内容"
f"\n2. 理解文字语义"
f"\n3. 从以下候选标题中选择最佳匹配项:"
f"\n [{antiques_selected}]"
f"\n1. 图片基本上就是展品标题、历史人物或者历史事件"
f"\n2. 精确识别图片中的文字内容,理解文字语义,重点分析字体较大的文字"
f"\n3. 识别出的文字包含标题或者接近于标题的文字"
f"\n4. 从以下候选标题中选择最佳匹配项:"
f"\n {antiques_selected}"
f"\n\n### 输出要求:"
f"\n- 以严格JSON格式输出包含3个字段"
f"\n • `antique`: 匹配的标题(多个用英文分号';'分割最多匹配3个无匹配则空字符串"