准备对AI流式音频发回给前端的机制做较大的修改，先提交1个版本

2025-07-19 22:44:28 +08:00
parent 74899acab9
commit 44cb7c0dca
9 changed files with 766 additions and 868 deletions
--- a/api/apps/sdk/dale_extra.py
+++ b/api/apps/sdk/dale_extra.py
@@ -152,10 +152,11 @@ def upload_file(tenant_id,mesum_id):

    prompt = (
        f"作为图片识别和理解助手，您的任务是："
-        f"\n1. 精确识别图片中的文字内容"
-        f"\n2. 理解文字语义"
-        f"\n3. 从以下候选标题中选择最佳匹配项："
-        f"\n   [{antiques_selected}]"
+        f"\n1. 图片基本上就是展品标题、历史人物或者历史事件"
+        f"\n2. 精确识别图片中的文字内容，理解文字语义，重点分析字体较大的文字"
+        f"\n3. 识别出的文字包含标题或者接近于标题的文字"
+        f"\n4. 从以下候选标题中选择最佳匹配项："
+        f"\n   {antiques_selected}"
        f"\n\n### 输出要求："
        f"\n- 以严格JSON格式输出，包含3个字段："
        f"\n  • `antique`: 匹配的标题（多个用英文分号';'分割，最多匹配3个，无匹配则空字符串）"