定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638
《清华大学:2025年DeepSeek+Deep Research应用报告(59页).pdf》由会员分享,可在线阅读,更多相关《清华大学:2025年DeepSeek+Deep Research应用报告(59页).pdf(59页珍藏版)》请在薪酬报告网上搜索。
1、DeepSeek+Deep Research应用DeepSeek+Deep Research应用2025年2月10日 欢迎关注视频号欢迎关注视频号清华沈少阳清华沈少阳 系列直播系列直播详细页首屏置顶博文评论区首条内容首条评论二级高赞置顶回答2月10日微博热搜实时壹 参与式观察一个团队的参与式观察一个团队的 大模型应用与内化大模型应用与内化贰Deep ResearchDeep Research应用概述应用概述叁推理大模型推理大模型使用心得使用心得目 录AI大事记(大事记(简版)简版)通用大模型怎么了?推理大模型通用大模型怎么了?推理大模型这么火!这么火!概述:概述:推理大模型建立在通用大模型基础
2、之上,在推理框架上线之前,通用大模型直接回答。那现在就让他基于思维链,一步一步做好规划、调整、校对并完成输出。所以通用大模型和推理大模型它不是矛盾的存在。简单来看,推理大模型和通用大模型功能不一,如果把AI模型比作工具包,DeepSeek把传统通用大模型比作一把瑞士军刀,功能多但不够锋利;推理大模型则像手术刀,专精切割但用途单一。1.1.需求明确度需求明确度 任务模糊(如闲聊):选通用模型-HER 目标明确(如解数学题):选推理模型-Deadline2.2.容错成本容错成本 允许试错(如写诗):通用模型 必须精确(如医疗诊断):推理模型3.3.资源限制资源限制 算力充足:可叠加使用两者 预算有
3、限:按核心需求单选选择指南选择指南核心对比核心对比通用大模型通用大模型+推理大模型也是推理大模型也是“王炸王炸”组合组合通用模型:处理90%的常规咨询(查订单、退换货)推理模型:解决5%的复杂纠纷(多环节理赔计算)实战案例应用:实战案例应用:电商客服场景电商客服场景顾客顾客:你好,我想查一下我的订单号为123456789的订单状态。通用客服模型通用客服模型:您好!很高兴为您服务。您的订单号123456789目前处于“已发货”状态,发货时间是2025年2月9日。根据物流信息,预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息:物流单号。如果您还有其他问题,欢迎随时咨询。顾客
4、顾客:好的,谢谢!另外,我收到商品后发现有一件商品损坏了,我需要申请退换货。通用客服模型通用客服模型:非常抱歉给您带来不便。关于商品损坏的问题,您可以选择退货或换货。请先告诉我以下信息:1.您要申请退换货的商品名称和数量;2.损坏的具体情况(最好提供照片);3.您希望选择退货还是换货。顾客顾客:是这款智能手表,我需要换货。手表的屏幕碎了,我这就拍照上传。通用客服模型:通用客服模型:好的,麻烦您上传照片,我会为您核实情况并处理换货申请。同时,请您确保商品包装完整,配件齐全,以便我们顺利为您处理换货。(顾客上传照片后)通用客服模型:通用客服模型:感谢您提供照片,商品损坏情况已经确认。我们已为您发起
5、换货申请,预计换货商品将在3-5个工作日内发出。您可以在“我的订单”-“售后服务”中查看换货进度。如果还有其他问题,可以随时联系我们。顾客:顾客:好的,我知道了。还有一个问题,我在购买时购买了商品的延长保修服务,这次换货后,保修期怎么计算?推理客服模型:推理客服模型:您好,关于延长保修服务的问题,我来为您详细解答。根据我们的保修政策,当您购买商品并附加延长保修服务时,保修期是从商品购买日期开始计算的。如果在保修期内发生换货,新的商品保修期将从换货完成日期重新计算,但总保修时长不会超过原购买的延长保修期限。例如,您购买的商品保修期为1年,同时购买了1年的延长保修服务,总保修期为2年。如果在保修期
6、内换货,新的商品保修期将从换货完成日期开始,再计算剩余的保修时长。如果换货发生在保修期的第10个月,那么新的商品将有14个月的保修期(2年总保修期减去已过的10个月)。如果您还有其他疑问,或者需要进一步确认保修细节,可以提供您的订单号,我为您查询具体的保修信息。“没有最好的模型,只有最合适的工具通用模型是社交达人,推理模型是解题高手,用好这对黄金组合,才是AI时代的生存之道。”DeepSeek行业产品端融合:行业产品端融合:谷歌PaLI-3、Anthropic Claude已尝试在通用模型中嵌入推理模块技术突破:技术突破:思维链(Chain-of-Thought)技术让两类模型能力边界逐渐模糊
7、当前建议:当前建议:优先关注垂直领域优化模型(如医疗推理专用模型)直观感受通用大模型和推理大模型的差异直观感受通用大模型和推理大模型的差异实战案例应用:分析实战案例应用:分析辅助辅助Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步大模型2:进一步明确任务大模型1:将观点作为核心结论,细化后成文DeepSeek:呈现拟人化思考过程1、对核心定义的具象化和确定性思考:你说的是啥?颗粒度对齐一下2、需求场景和用途思考,决定大方向正确与否:用来干什么?呈给谁看?3、定写作方向、基本思路,乃至一级提纲确立类思考:从哪个角度切入?此刻我的此刻我的os:结果怎么样再说,看这个思
8、考过程挺靠谱,很有想法!:结果怎么样再说,看这个思考过程挺靠谱,很有想法!直观感受通用大模型和推理大模型的差异:直观感受通用大模型和推理大模型的差异:DeepSeek生成生成实战案例应用:分析实战案例应用:分析辅助辅助DeepSeek输出材料:更像个人,不是停留在语义层面的“拟人”,而是在独立、认真思考等更深层面Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步壹Deep Deep ResearchResearch应用概述应用概述PART ONE(一)(一)DeepSeek DeepSeek 深度思考深度思考R1R1概述及概述及主要用途主要用途 DeepSeek 深
9、度思考R1 是一款基于深度学习技术的推理模型,其核心功能在于通过强化学习提升模型的推理能力。其设计目标是通过强化学习等技术,引入了自我反思能力,使其在推理过程中能够自我验证和反思,从而提高推理的准确性和可靠性。性能数据:性能数据:官方数据显示,DeepSeek R1 在数学、代码、自然语言推理等任务上的表现已可与OpenAI的顶级模型GPT-4相当。例如,DeepSeek系列模型在美国高级中学数学竞赛 AIME 2024 题目上的一次性解题正确率达到39.2%,而GPT-4仅约9.3%。现实案例:现实案例:业内已经出现利用该模型辅助科研的例子。例如,有研究者在实验中让DeepSeek模型逐步求
10、解AIME(美国数学邀请赛)竞赛难题,DeepSeek展现了清晰的链式推理过程,输出的思路连贯且易于理解。思维链设计:思维链设计:DeepSeek 深度思考R1通过原生思维链设计,使模型在推理过程中能够生成详细的推理路径。这种设计不仅提高了推理的准确性,还增强了模型的可解释性。四步理解四步理解DeepSeek R1功能功能推理流程推理流程帮我画出DeepSeek R1 的推理过程流程图,流程图的每个阶段需标注关键技术。以下是推理过程文字描述:DeepSeek R1 的推理过程可以划分为四个主要阶段,每个阶段都运用了特定的 AI 技术来逐步完善推理链条,最终得出高质量答案。这一流程采用蓝色系流程
11、图设计,结构清晰,便于在 PPT 中展示和理解。以下是各阶段及其关键技术说明:1 1输入阶段(用户问题解析)输入阶段(用户问题解析)用户输入自然语言问题,DeepSeek R1 首先对问题进行理解与解析。在这一阶段,模型运用了*自然语言处理(NLP)*技术,将用户的自然语言提问转换为机器可理解的内部表示,提取问题的意图和关键信息。通过对输入的预处理,模型为后续推理做好准备。2 2思维链生成(构建初步推理路径)思维链生成(构建初步推理路径)根据解析后的问题,DeepSeek R1 开始“思考”,生成解决问题的初步步骤链条(即思维链)。这一过程运用了*思维链推理(Chain-of-Thought,
12、CoT)*技术。模型被鼓励像人类一样逐步思考,将复杂问题拆解为一系列连贯的中间推理步骤,并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度,让观众看到模型解决问题的思路。3 3强化学习优化(自我反思与迭代优化)强化学习优化(自我反思与迭代优化)DeepSeek R1 对生成的初步思维链进行自我检查和反思,反复迭代优化推理路径,以提高推理的正确性。在这个阶段,模型引入了强化学习(Reinforcement Learning)思想进行自我优化。具体而言,DeepSeek R1 会对先前步骤的推理结果进行评估,自主发现错误或不合理之处,然后通过调整思维链来纠正偏差。这种自我验
13、证与错误校正的过程可被视为一种自监督优化:模型在没有人工标注指导的情况下,基于试错反馈强化正确的推理路线。通过多轮迭代,DeepSeek R1 不断增强自身的推理能力,确保思维链趋于合理和可靠(相当于给模型加入了“元认知”能力,让它会“思考自己的思考”)。4 4最终答案生成(输出详细推理链和答案)最终答案生成(输出详细推理链和答案)经过推理优化后,DeepSeek R1 输出最终答案,并给出完整的推理过程作为支撑。在这一阶段,模型基于优化后的思维链生成对用户问题的解答,确保答案准确无误。最 终 答 案 不 仅 包 含 直 接 的 回 答,还 附 带 详 细 的 推 理 链 条(例 如 以 标签
14、形式呈现模型的思考过程)供用户参考。这种结果输出方式体现了 DeepSeek R1 注重可解释性的特点:观众可以直观地看到模型是如何从问题一步步推理得到答案的。DeepSeek生成内容GPTs生成思维导图实践:实践:DeepSeek R1擅长做擅长做哪类研究分析?哪类研究分析?利用利用DeepSeek DeepSeek 深度思考深度思考R1R1撰写舆论分析报告撰写舆论分析报告利用利用DeepSeek DeepSeek 深度思考深度思考R1R1做行业做行业研究研究数据驱动的深度分析数据驱动的深度分析问题导向与目标设定问题导向与目标设定在研究起始阶段,明确分析报告的核心目标与研究问题。通过精准的问
15、题设定,如“该事件舆情传播的关键节点是什么?”或“公众情感倾向如何影响事件走向?”来引导后续研究方向。这种问题导向有助于聚焦研究重点,避免在海量信息中迷失方向。利用DeepSeek深度思考R1的联网搜索功能,广泛收集与事件相关的多源数据。通过深度推理能力,对数据进行深度挖掘,分析舆情传播路径、情感倾向和关键节点。这种方法能够揭示舆情事件背后的复杂关系和潜在影响因素。多维度的舆情剖析多维度的舆情剖析从传播、情感、观点等多个维度对舆情事件进行剖析。通过DeepSeek深度思考R1的剖析,理解公众对事件的态度和反应。同时,结合传播路径分析,识别舆情扩散的关键节点和影响因素。专业化呈现与验证专业化呈现
16、与验证风险评估与策略建议风险评估与策略建议基于DeepSeek深度思考R1的结果,对舆情事件可能带来的风险进行评估。DeepSeek深度思考R1识别潜在的负面舆情风险点,并提出针对性的应对策略。这不仅有助于缓解舆情危机,还能为相关主体提供决策支持。在报告撰写中,DeepSeek深度思考R1需采用专业化的语言和结构,确保逻辑严谨、论证充分。同时,通过交叉验证和多源数据对比,验证分析结果的可靠性。这种严谨的呈现方式能够增强报告的可信度和实用性。04040505030301010202实践:实践:DeepSeek R1擅长做擅长做哪类研究分析?哪类研究分析?审核重点:审核重点:1.数据准确度:核对不
17、同来源数据之间的一致性,避免数据矛盾或冲突。对于存在差异的数据,需进行合理解释或进一步验证。2.案例贴合度:案例应与研究主题高度相关,能够直接支持报告的分析和结论。对于舆情事件,案例应与事件的性质、背景、传播特点等相匹配。3.观点合规度:确保报告中的观点符合法律法规和政策要求,不涉及违法违规内容,如虚假信息、诽谤、侵权等。4.研判颗粒度:事件的分析应深入到关键问题的核心,揭示事件的本质和内在规律。避免停留在表面现象,缺乏深度剖析。实测实测DeepSeek R1分析报告:分析报告:9分分实操实操DeepSeek+Mermaid AI组合,组合,三分钟生成思维导图三分钟生成思维导图好的,感谢确认!
18、接下来,我将根据您提供的信息,生成一个适用于PPT展示的流程图,使用蓝色系设计,并标注每个阶段的关键技术。流程图将采用 mermaid.js 语法,您可以直接在 mermaid.live 上生成可视化图表。以下是生成的 mermaid.js 代码:flowchart TD A输入阶段:用户问题解析-B思维链生成:构建初步推理路径 B-C强化学习优化:自我反思与迭代优化 C-D最终答案生成:输出详细推理链和答案 A-|自然语言处理(NLP)|A1解析用户问题 B-|思维链推理(CoT)|B1生成推理链条 C-|强化学习(RL)|C1自我优化与反馈 D-|推理链生成|D1输出答案与推理过程 sty
19、le A fill:#0074D9,stroke:#003366,stroke-width:2px;style B fill:#0074D9,stroke:#003366,stroke-width:2px;style C fill:#0074D9,stroke:#003366,stroke-width:2px;style D fill:#0074D9,stroke:#003366,stroke-width:2px;classDef tech fill:#A9CCE3,stroke:#1A5276,stroke-width:2px;class A1,B1,C1,D1 tech;解释:解释:蓝色系
20、设计:整个流程图采用深蓝色和浅蓝色调,确保视觉上的一致性。阶段:四个主要阶段按顺序排列,依次从输入到输出。关键技术:每个阶段标注了对应的技术(如 NLP、CoT、RL 等),并以不同样式展示。您可以将此代码粘贴到 mermaid.live 进行渲染,查看和导出图表。如果有任何修改或调整需求,请随时告诉我!Mermaid AI Mermaid AI 是一款基于 Mermaid.js 开发的智能绘图工具,能够通过简单的文本提示快速生成各种类型的图表。1.1.文本生成图表文本生成图表:用户可以通过输入自然语言描述来生成图表,例如输入“创建一个包含三个步骤的流程图”,Mermaid AI 就能生成对应
21、的流程图代码。2.2.多种图表类型:多种图表类型:支持流程图、序列图、甘特图、类图、状态图、实体关系图、饼图等多种图表类型。3.3.可视化编辑器:可视化编辑器:除了文本生成图表外,还提供可视化的拖拽编辑器,用户可以在生成图表的基础上进行调整和修改。1.登录Kimi账号,点击进入Kimi+2.选择“PPT助手”应用3.将已经梳理好的文件发送给PPT助手4.PPT助手根据发送的文件自动生成分章节的PPT内容5.检查内容,补充需求6.生成PPT,可在线编辑,亦可下载文件后本地编辑保存。实操实操DeepSeek+Kimi组合,组合,搞定搞定PPT实战案例应用:课件实战案例应用:课件PPTPPT制作制作
22、AI工具:Kimi+DeepSeek/硅基流动,基于课程配套图书,已经获取ppt,但每一章每一节ppt呈散状,内容标题化、抄书化问题突出,无版式设计而言,且无最新案例。第八章 电商运营数据分析第一步:将ppt批量上传至Kimi(PPT助手),要求将ppt合成第二步:将合成后的ppt内容发给DS,如果“服务器繁忙”,稍后上传仍多次无效后,可发给硅基流动、秘塔AI等。要求推理大模型在此基础上将ppt内容梳理得更加具有逻辑性,在相应部分增加最新案例,以便学生取得更好学习效果。但会出现“bug”,增加了案例,但原有内容未得以保存。将推理大模型输出结果喂给Kimi,根据课程内容,设计课程实验,明确实验目
23、的、实验要求、实验内容和实验成果等说明。将Kimi输出材料喂给PPT助手,完成本章内容PPT制作。缺点是内容拆解过于详细,导致PPT页数徒增。有基础材料无基础材料将课程名称和课程大纲发给DS,让其构建课程各章节主要内容,要求输出材料语言通俗易懂,举例贴近大学生的学习与生活,结构清晰,帮助学生轻松理解并快速掌握知识点。DeepSeek+KimiKimi:教学课件制作实测:教学课件制作实测传统通用大模型上线推理传统通用大模型上线推理模块模块通义千问2.5智普清言深度推理秘塔AI-长思考R1kimi 1.5长思考文心大模型4.0(二)(二)Gemini Gemini DeepResearchDeep
24、Research概述及概述及主要用途主要用途 Gemini是Google AI最新推出的多模态大模型,Deep Deep ResearchResearch是是GeminiGemini的高级功能之一,旨在帮助用户进行实时、的高级功能之一,旨在帮助用户进行实时、深入的研究。深入的研究。Deep Research是Gemini网络应用程序中的一项高级功能,允许用户实时深入研究各种主题。这项功能特定于 Gemini 网络应用程序。它能够根据用户的查询,快速从海量数据中提取相关信息,并以简洁易懂的方式呈现给用户。实时信息检索实时信息检索:Deep Research可以帮助用户快速获取所需信息,无需花费大
25、量时间浏览网页和筛选信息。深入主题研究深入主题研究:通过整合来自不同来源的信息,Deep Research可以帮助用户更全面地了解某个主题。辅助决策辅助决策:Deep Research可以为用户提供决策所需的信息和数据支持。生成可在线编辑报告:生成可在线编辑报告:可通过谷歌在线文档查看和编辑Gemini DeepResearch生成的报告全文。Gemini Deep Research功能基本功能基本介绍介绍如何使用如何使用Gemini Deep Research?在开始任何研究之前,清晰地定义研究问题和目标至关重要清晰地定义研究问题和目标至关重要。这也有助于研究人员更有效地利用 Gemini
26、Deep Research。例如,在研究“人工智能对教育的影响”这一课题时,研究人员首先需要明确具体的研究问题:人工智能技术如何应用于教育领域?人工智能对学生的学习方式和教师的教学方法有哪些影响?人工智能在教育领域应用的伦理问题有哪些?明确研究问题后,才能更有针对性地使用 Gemini Deep Research 获取相关信息,避免漫无目的地搜索。如何使用如何使用Gemini Deep Research?下一步是构建有效的搜索策略,以便在构建有效的搜索策略,以便在 Gemini Deep Research 中精准地中精准地找到所需信息找到所需信息。这需要研究人员掌握一些搜索技巧,例如:使用相关
27、的关键词:选择能够准确描述研究主题的关键词,例如在研究“气候变化对农业的影响”时,可以使用“气候变化”、“农业”、“粮食安全”、“干旱”等关键词。使用布尔运算符使用布尔运算符:使用使用 AND、OR、NOT 等布尔运算符来组合关键词等布尔运算符来组合关键词,例如“气候变化 AND 农业 AND 粮食安全”可以缩小搜索范围,更精准地找到相关信息。使用过滤器使用过滤器:Gemini Deep Research 提供了多种过滤器,例如时间范围、提供了多种过滤器,例如时间范围、信息来源、作者等,可以帮助研究人员进一步筛选搜索结果。信息来源、作者等,可以帮助研究人员进一步筛选搜索结果。例如,假设我们要研
28、究“人工智能在医疗领域的应用”,以下是一些有效和无效的搜索策略示例:有效的搜索策略:“人工智能”AND“医疗”AND“诊断”(使用关键词和布尔运算符)“人工智能医疗应用”(使用更具体的关键词)设置时间范围为“近五年”(使用时间过滤器)无效的搜索策略:“人工智能”(关键词过于宽泛)“人工智能 OR 医疗”(搜索结果过于广泛)如何使用如何使用Gemini Deep Research?Gemini Deep Research 的一大优势在于它能够从多个来源和角度获取信息,从多个来源和角度获取信息,包括学术论文、新闻报道、书籍、专利等。包括学术论文、新闻报道、书籍、专利等。研究人员应充分利用这一优势,
29、尝试从不同的维度探索研究问题从不同的维度探索研究问题。例如,在研究“气候变化对农业的影响”这一课题时,可以从以下角度进行探索:跨学科研究跨学科研究:结合气象学、农业科学、经济学等学科的知识,分析气候变化对农作物产量、农业生产成本、农民收入等方面的影响。不同地区的影响不同地区的影响:比较气候变化对不同地区农业的影响,例如干旱地区、沿海地区、高寒地区等,分析其差异性和共性。不同利益相关者的观点不同利益相关者的观点:收集农民、农业企业、政府部门、环保组织等不同利益相关者对气候变化的看法和应对措施,进行综合分析。例如,研究人员可以利用该工具收集过去五年的全球气温数据和农业产量数据,分析气候变化对农业生
30、产的长期影响。通过对比不同时期的气温和产量数据,可以发现气候变暖对某些地区的农业生产产生了负面影响,例如导致干旱加剧、病虫害增多等。Gemini Deep Research的实践应用的实践应用在使用 Gemini Deep Research 时,需要注意数据隐私、知识产权等伦理问题。确需要注意数据隐私、知识产权等伦理问题。确保获取和使用信息的方式符合相关规定和道德准则。保获取和使用信息的方式符合相关规定和道德准则。例如,在使用该平台获取个人信息时,需要遵守相关法律法规,保护个人隐私。在引用他人研究成果时,需要注明出处,避免剽窃。研究是一个不断迭代的过程。通过 Gemini Deep Resea
31、rch 获取的信息可以帮助研究人员不断完善研究问题、调整研究方向、深入挖掘新的线索。迭代式研究过程可以概括为以下几个步骤:1.提出初始研究问题:根据初步的了解和假设,提出初始的研究问题。2.收集信息:使用 Gemini Deep Research 等工具收集与研究问题相关的文献、数据和其他信息。3.分析信息:对收集到的信息进行分析和整理,并从中提取关键信息和 insights。4.完善研究问题:根据信息分析的结果,重新审视和完善初始研究问题,使其更加聚焦和具体。5.调整研究方向:根据新的发现和 insights,调整研究方向,探索新的研究路径。6.深入挖掘:对感兴趣的方面进行更深入地挖掘,例如
32、查阅更多文献、进行实证研究等。(三)三)Deep Deep ResearchResearch概述及概述及主要用途主要用途 ChatGPT的“深度研究”(Deep Research)是一种新推出的代理型功能,旨在帮助用户完成复杂得多步骤信息检索与研究任务。简单来说,用户只需提供一个提示或问题,ChatGPT就会自主在互联网上搜索、分析并综合数百条信息来源,最后生成一份类似研究分析师撰写的综合报告。OpenAI声称,这项功能在数十分钟内就能完成人工需要数小时甚至数天才能完成的研究工作。OpenAI首席产品官凯文韦尔(Kevin Weil)指出,Deep Research可以在约5到30分钟内完成一
33、些人工可能需要30分钟到30天的复杂研究任务 Deep Research的主要用途是大幅加速和简化各领域的知识密集型研究。它针对金融、科学、公共政策、工程等领域需要全面、精确、可靠信息的从业者,以及需要进行深入调查的商业分析场景而设计。同时,Deep Research也适用于普通用户的高难度信息查询,例如个性化的消费决策(购车、家电、家具等需要仔细调研的购买建议)GPT全系产品增加全系产品增加Deep Research功能功能Deep Research六项适用场景六项适用场景 数数据调研与可视化:据调研与可视化:查询过去10年中GDP排名前十的发达国家和发展中国家的iOS与安卓普及率,并将结果
34、绘制成表格。这样的任务涉及大量数据收集和整理,非常适合Deep Research自动完成。模糊信息检索:模糊信息检索:根据几个片段的剧情描述来寻找电视剧集中对应的剧集名称。普通聊天模型往往难以凭记忆给出准确答案,而Deep Research可以通过网络检索找到确切的剧集并提供细节。专业知识问答:专业知识问答:例如询问“NFL橄榄球踢球手的平均退役年龄是多少?”,普通GPT模型可能因知识局限给出含糊的范围猜测,而Deep Research会深入多源头资料,给出精确的统计并解释不同球员退役年龄的分布。消费产品调研:消费产品调研:根据用户提供的偏好和使用场景(如滑雪板的需求),Deep Resear
35、ch可以搜集各大评测和产品规格,在几分钟内整理出详细的购买建议清单,并解释每个推荐方案的依据。专业领域研究:专业领域研究:在医学研究、UX设计等需要查阅大量专业资料的领域,Deep Research同样能通过搜索论文、报告等资源,快速汇总相关知识点和洞见。综上,综上,Deep ResearchDeep Research的用途覆盖学术研究、市场分析、商业情报、技术调研以及复杂问答等多个场景。其目标用户的用途覆盖学术研究、市场分析、商业情报、技术调研以及复杂问答等多个场景。其目标用户既包括需要高效获取可靠资料的专业人士,也包括有深入信息需求的普通个人用户。既包括需要高效获取可靠资料的专业人士,也包
36、括有深入信息需求的普通个人用户。能够胜任从商业报告到日常疑难问题的一系列任务。能够胜任从商业报告到日常疑难问题的一系列任务。自主的步骤执行强化学习训练0303在具体运行时,当用户选择当用户选择“深度深度研究研究”模式并提交查询后,模式并提交查询后,GPT会会启动一个后台启动一个后台agent进行工作。这进行工作。这个个agent会自动执行一系列步骤:会自动执行一系列步骤:例如它可能先搜索相关关键词,打开若干网页读取内容,再根据需要细分问题、继续搜索下一步,乃至调用工具进行数据处理。整个过程整个过程中,中,ChatGPT会在侧边栏向用户会在侧边栏向用户展示其当前采取的步骤和已获取的展示其当前采取
37、的步骤和已获取的来源摘要,提高过程透明度来源摘要,提高过程透明度。这一。这一设计类似于设计类似于AI“做笔记做笔记”,让用户了解研究的进展和思路。专业定制的模型0101OpenAI使用端到端的强化学习(RL)对Deep Research模型进行训练,让它在各种领域的复杂浏览让它在各种领域的复杂浏览和推理任务中学会规划策略和推理任务中学会规划策略。通过。通过大量训练,模型掌握了如何计划并大量训练,模型掌握了如何计划并执行多步搜索路径,在需要时还能执行多步搜索路径,在需要时还能回溯调整,类似人类研究者那样根回溯调整,类似人类研究者那样根据检索结果动态修正方向据检索结果动态修正方向。这使其。这使其具
38、备了长链推理和问题分解的能力,具备了长链推理和问题分解的能力,能够逐步靠近答案。能够逐步靠近答案。0202Deep Research由由OpenAI即将推即将推出的出的o3模型的一个变体提供支持。模型的一个变体提供支持。该模型针对网页浏览和数据分析进行了优化,拥有强大的推理和多模态理解能力。模型可以读取和理解网页上的大量文本、图像和PDF内容,并将不同来源的信息相关联。据OpenAI介绍,D R能够递归地能够递归地进行网络搜索:从初始查询出发,进行网络搜索:从初始查询出发,不断执行新的搜索、点击结果、阅不断执行新的搜索、点击结果、阅读资料,然后将收集的信息加以综读资料,然后将收集的信息加以综合
39、合。这种递归搜索与推理使得它可。这种递归搜索与推理使得它可以在海量信息中挖掘出相关内容并以在海量信息中挖掘出相关内容并形成整体结论。形成整体结论。工具与多模态能力0404除了浏览网页文字,Deep Research还能处理多种格式的资还能处理多种格式的资料。料。它可以阅读用户上传的文档或表格,将这些私有数据与在线信息相结合进行分析。此外,DR具备具备一定的工具使用能力,例如调用内一定的工具使用能力,例如调用内置的置的Python工具来绘制图表并反工具来绘制图表并反复改进数据可视化复改进数据可视化。据报道,未来它还能将生成的图表或从网页提取的图片直接嵌入报告中,以丰富分析结果。这种多模态处理和工
40、具整合,使DR超越了纯语言模型的范畴,更像一个真正的数字研究助理。Deep Research背后的技术实现体现了一个自主智能体(agent)的工作流程。与传统聊天机器人仅根据训练语料作答不同,Deep Research能够主动与外部环境交互,主要通过联网浏览和工具使用来完成任务。其工作机制可以分为以下几个关键点:Deep Research的技术实现的技术实现路径路径Deep ResearchDeep Research完成任务后,会在对话界面完成任务后,会在对话界面生成一份结构化的研究报告作为最终输出生成一份结构化的研究报告作为最终输出。Deep Research利用了强大的预训练大模型+强化学
41、习调教,再结合联网检索和工具调用,实现了高度自动化的研究流程。它相当于将搜索引擎、数据分析和报告撰写能力融为一体:既能像人一样上网既能像人一样上网“找资料找资料”,又能对信息进行归纳整理,又能对信息进行归纳整理,最终拿出有理有据的结果。这种技术实现让最终拿出有理有据的结果。这种技术实现让ChatGPTChatGPT从一个对话助手跃升为一从一个对话助手跃升为一个可以独立执行实质任务的自主智能体个可以独立执行实质任务的自主智能体。报告通常包括引言、发现和结论等部分,并在内容中附有清晰的引用出处,报告通常包括引言、发现和结论等部分,并在内容中附有清晰的引用出处,标明每一论断背后的来源标明每一论断背后
42、的来源。这种报告式输出旨在达到研究分析师的专业水准,方便用户直接将其用作决策依据或进一步引用。OpenAI强调,每个输出都经过充分文档化,便于读者核查引文的真实性。Deep Research=搜索引擎搜索引擎+数据分析数据分析+报告撰写报告撰写借助上述机制,Deep Research擅长处理复杂、多层次的问题,特别是在以下类型的研究任务中表现突出:跨领域的综合研究:跨领域的综合研究:对于涉及多个知识领域、需要广泛收集资料的问题,Deep Research能够逐一查找相关信息源,避免疏漏要点。例如政策分析、行业报告、学术综述等,需要整合不同来源观点和数据的任务,它都能快速胜任。传统上,这类工作需
43、要研究员花费大量时间阅读文献、统计数据,而Deep Research可以大幅缩短这一过程。知识密集型问答:知识密集型问答:当用户提出的问题难以通过单一知识库回答时(如高度细节化或专业化的问题),Deep Research的多步搜索能力就发挥作用。例如前述NFL球员退役年龄的例子,以及“某领域近年的重要进展”等,需要查证多个来源才能得出准确答案的问题。Deep Research会针对问题的各个方面分别检索,再整合成连贯的答复,其答案可靠性和细节完备度往往优于普通聊天模型。数据收集与对比分析:数据收集与对比分析:Deep Research擅长从网上提取定量数据并进行对比。例如市场份额统计、人口统计
44、数据、产品规格参数比较等任务,它可以自动在官方网站、报告、数据库中提取数据,然后在报告中生成对比表格或清单。这对商业分析、科学研究中的调研阶段非常有用。用户也可以提供自己的数据文件,Deep Research会将其与网上数据结合分析,适用于需要内外部数据融合的研究。Deep Research适用的研究任务类型(一)适用的研究任务类型(一)借助上述机制,Deep Research擅长处理复杂、多层次的问题,特别是在以下类型的研究任务中表现突出:个性化决策支持:个性化决策支持:对于个人用户需要做出决策但信息繁杂的情况,Deep Research能提供显著帮助。例如高价值商品的购买决策(汽车、电子产
45、品等),涉及阅读大量评测、论坛帖子和规格表。Deep Research可以根据用户的偏好要点,汇总各候选产品的优缺点和他人经验,从而产出量身定制的建议报告。又如旅行规划、求职准备(调研目标公司的背景)等场景,也符合其强项。它特别擅长那些需要浏览多个网站才能拼凑出的零散且不直观的信息。这类任务人工完成常常费时费力,而交给Deep Research处理可以省下大量时间。实时更新的信息:实时更新的信息:由于Deep Research可以访问互联网,它能够处理那些需要最新资料的问题(取决于其联网搜索能力)。例如了解最新法规政策动态、最近的科技新闻综述等。相比之下,普通大模型知识截止于训练数据,无法直接
46、提供此类实时信息。因此在时效性要求高的研究任务上,Deep Research更为适用。Deep Research适用的研究任务类型(适用的研究任务类型(二)二)研究质量与准确性有限:研究质量与准确性有限:目前,Deep Research离真正媲美人类专家还有相当距离。在一个名为“人类最后的考试”(Humanitys Last Exam)的最新综合评估中(涵盖100多个主题的3000多道专家级问题),Deep Research支持的模型正确率只有26.6%。虽然这已是AI模型在该测试中的新高(此前的OpenAI O3-mini模型仅约13%,竞品“DeepSeek”约10%,但不足30%的得分仍
47、意味着大多数复杂问题它未能答对。因此在严谨场景下,它并不能保证万无一失,需要人工对结果进行审阅。正如一位早期试用者所指出的,那些针对特定领域的多步骤查询,Deep Research给出的结果虽经充分引用但仍可能存在遗漏或推理不当之处,尚不能完全替代领域专家的判断。新发现能力有限:新发现能力有限:Deep Research擅长汇总已有资料,但未必能产生超出现有资料的新见解。有测试者让Deep Research调研其熟悉的专题,结果发现AI找出的18个来源几乎都是他早已知晓的,并没有提供新的信息来源。这表明对于资深专家来说,Deep Research可能难以挖掘他们未知的资料,更多是充当信息整理助
48、手的角色。其生成的报告在专家看来内容“并不出乎意料”,因此对于已经深谙某领域的人,价值体现在节省时间上而非知识突破。过程不可完全复现:过程不可完全复现:另一方面,Deep Research当前仅在最终报告中引用它实际用到的资料来源,对于它过程中过目但未采信的资料并不会全部列出。这意味着用户无法完全追踪AI检索过的所有路径,可能错过那些被AI判定不重要但人类认为有价值的参考。Deep Research的局限性(一)的局限性(一)AI生成内容,数据待核实 速度与成本代价:速度与成本代价:Deep Research运行一次可能耗时长达30分钟。如此深入的搜索和分析在云端消耗相当多的计算资源。目前Op
49、enAI仅向ChatGPT Pro订阅用户开放了该功能,并且每月限制使用100次。ChatGPT Pro订阅费用高达每月200美元左右(后续可能逐步开放给Plus套餐用户),这使得Deep Research在初期仅对少数付费用户可用。高昂的成本和调用限制反映出该功能的资源开销较大,也限制了其大规模应用。在速度方面,尽管几十分钟对复杂研究而言已相当快速,但相较即时的普通对话,它无法做到实时回答。因此不适合紧急的即时查询,更适合预先计划的调研任务。可能的内容局限和风险:可能的内容局限和风险:1 1)由于Deep Research自动从互联网上抓取信息,它的表现取决于公开它的表现取决于公开资料的可获
50、取性和质量资料的可获取性和质量。对于互联网中少见或缺失的信息,或者需要创见性的研究问题,Deep Research可能同样束手无策。2 2)自动化的网络浏览也带来误导信息整合的风险)自动化的网络浏览也带来误导信息整合的风险如果网上存在错误或不可靠的信息源,AI可能将其纳入报告,哪怕有引用也不意味着内容真实无误。因此用户仍需对结果保持审慎,核实关键事实。3 3)在教育领域,人们担心学生可能借助Deep Research跳过亲自研究的过程,直接使用AI生成的报告。这将带来学术诚信和学习效果方面的隐忧这将带来学术诚信和学习效果方面的隐忧尽管从积极面看,也有人主张教学应与时俱进,培养学生正确使用AI工
51、具的能力。总之,如何避免对总之,如何避免对AIAI产出过度依赖、确保用产出过度依赖、确保用户真正理解内容,是一个需要关注的方面。户真正理解内容,是一个需要关注的方面。Deep Research的局限性(的局限性(二)二)“许多早期使用者将Deep Research视为“游戏规则改变者”级别的功能。一方面,它展示了AI从对话助手向自主智能体迈进的重要一步,令人生畏又令人兴奋。”非正式非正式Deep Research评测打分:良评测打分:良 某预测类研究课题完成度:60%病例报告完成度,给出诊疗方案“75%综述:推理大模型的未来发展方向(综述:推理大模型的未来发展方向(一)一)提升模型能力:提升模
52、型能力:大模型厂商无疑将会继续优化推理框架背后的模型。随着更多的反馈和数据积累,模型在检索策略和推理准确性上有望进一步提高,减少错误和遗漏。一项潜在改进是扩大模型的上下文窗口和记忆,使其在长程研究中能够考虑更多信息而不丢失细节,这有助于提升复杂任务的完成质量。丰富输出形式:丰富输出形式:正如部分厂商所预告的,深度研究板块也将在不久内加入图像嵌入、数据可视化和其他分析输出。这意味着报告里将不仅有文字,还有由AI自动生成或提取的图表、插图等,从而使结论更加直观。(我们已经有所进步,2月12日分享)届时用户在浏览报告时,可以直接看到相关的统计图或示意图,大大改进阅读体验和信息传达效果。除了视觉元素,
53、输出的格式定制也可能改进,例如允许用户选择报告的详细程度(简报 vs 深度报告)或侧重方向。综述:推理大模型的未来发展方向(二)综述:推理大模型的未来发展方向(二)加强事实校验与控制:加强事实校验与控制:为了缓解AI整合错误信息的风险,未来推理大模型引入更多事实校验机制。例如结合知识库验证引用内容,或在模型生成结果前后加入审查环节,避免明显不可信的内容输出。另外,对于使用者来说,提供更细粒度的控制选项也是改进方向之一 如允许用户指定必须包含哪些来源、排除某些站点,或者在特定子问题上要求更深入的挖掘。这些都会让输出材料更加可控和可靠。与其他与其他AgentAgent的整合:的整合:多智能体协作的
54、愿景被多个推理大模型所提出,使得在思想层面更加拟人的大模型能够不但调研信息,还能执行现实世界的操作(辅助劳动)。例如,AI可以先调研一项投资机会然后直接模拟执行交易,或先比较多家供应商并直接发出询价邮件等。这种整合将把推力大模型从“信息助理”升级为“执行助理”。不过在安全与信任方面,这也需要非常谨慎地设计。欢迎关注欢迎关注视频号视频号清华沈少阳清华沈少阳 系列直播系列直播PART TWOPART TWO参与式观察一个团队的大模型应用与内化团队简介:全方位整合各类数据库、互联网实时公开数据等信息矩阵,基于专业大数据产品,提供个性化智库服务。300余名分析师,承担着报告撰写和行业咨询任务,提供深度
55、的舆论分析、政策评估、社会调研、以及危机管理咨询服务,近三年累计交付各类研究材料、分析报告近100万份。观察时间:2022年12月-2025年2月贰人与AI共同进化,由GPT4o生成团队大模型应用与内化的知行合一团队大模型应用与内化的阶段划分2022年 12月2023年3月认知、兴趣、评估期2023年12月2024年12月2025年2月采纳期实验、采纳期内化期评估期内化期o1推理模型正式上线DeepSeek上线o3-mini上线DeepResearch上线AI会商上线AI热点上线AI热搜上线Zeelin Deep Research内测元知上线 应用尽用:应用尽用:2022年12月至2023年1
56、2月:第一个学习期和爆发期,在团队层面推进AI的应用,不仅需要从技术层面完成培训,还需要在制度层面启动保障,抵消认知和心理层面对AI的非正影响。无中生有:无中生有:2024年1月至2024年10月,团队完成了AI的第一轮内化,实现了从以生成式大模型为主的应用到场景化、行业化AI智能体产品封装的关键跃升。你有我优:你有我优:2024年12月以来,在DeepSeek推理大模型的加持下,既有AI智能体封装产品性能直追中级分析师,AI智能体封装技术能力成熟已达商用水平。大模型应用模拟图大模型内化模拟图程度时间制度基石维:规范驱动制度基石维:规范驱动强调通过规章制度和考核体系构建AI舆情化应用的管理闭环
57、。设定评价体系,不定期开展技能大比拼。智能跃迁维:智能体赋能智能跃迁维:智能体赋能对舆情研究步骤进行模块化拆解,开发AI智能体,摒弃舆情AI,开启AI舆情时代。普及实践维:场景渗透普及实践维:场景渗透推动AI技术在舆情研究的日常工作中全面融入,从局部试点到全流程覆盖。基基石层石层场景层场景层产品层产品层工具创新维:产品驱动工具创新维:产品驱动借助AI大模型技术,迭代开发AI+舆情研究产品,实现从辅助工具到智能化平台的跃升。跃迁层跃迁层广度深度效度创新性工作流及工作场景拆解团队大模型应用与内化参考首次分享于2024年11月26日AIGC数智化如何助力舆情研究AIAI会商:会商:智能决策分析系统智
58、能决策分析系统智能推理引擎:智能推理引擎:融合知识图谱构建、因果推理模型及蒙特卡洛模拟技术,可自动识别事件关联要素,量化评估不同发展路径的概率分布。实时数据感知网络:实时数据感知网络:深度对接互联网公开、权威数据源,动态捕捉行业动向、热点事件、社媒讨论等关键信息流,确保分析结论始终基于最新事实依据。专业级报告体系:专业级报告体系:严格遵循结构化思维框架报告,输出内容满足企业决策层、政策研究机构对专业文档的合规性要求。010102020303AIAI会商:会商:智能决策分析系统智能决策分析系统事件基本情况及影响力事件简介事件简介判断当前舆情发展所处阶段,并研判后续趋势发展趋势发展趋势总结舆情讨论
59、观点,输出事件的舆论关切点和风险点舆论观点舆论观点关键媒体是否介入报道或评论,内容和倾向是什么媒体导向媒体导向态势引爆点、舆论争议点等核心要素核心要素核心要素基于已形成的内容为下一步舆情处置和引导提供建议未来建议未来建议报报告告结结构构AI会商样例AIAI热搜热搜:热搜聚合与:热搜聚合与智能分析系统智能分析系统1.1.媒体与内容创作者:媒体与内容创作者:快速捕捉热点话题,为内容创作提供灵感与选题方向,提升内容的时效性和关注度。2.2.品牌营销人员:品牌营销人员:实时掌握品牌相关热搜动态,监测品牌舆情,及时调整营销策略,提升品牌影响力。3.3.市场研究人员:市场研究人员:通过分析热搜数据,洞察市
60、场趋势与消费者需求,为市场调研与决策提供数据支持。4.4.普通用户:普通用户:随时随地获取最新热搜信息,紧跟热点潮流,满足日常信息获取与社交需求。适配用户多平台数据集成:多平台数据集成:利用爬虫技术,结合各平台API接口,无缝对接八大热门平台构建全面的热搜数据池。实时信息推送:实时信息推送:基于用户订阅偏好,通过多种移动设备通知渠道,以秒级速度将最新热搜信息推送给用户,确保用户第一时间掌握热点动态。数据聚合与推送数据聚合与推送分钟动态监测:分钟动态监测:系统实时跟踪热搜上榜、热度/排名变化、掉榜、重复上榜等关键事件,采用增量式数据存储策略,高效记录每一次动态变化,为后续分析提供翔实数据基础。数
61、据持久化存储:数据持久化存储:采用分布式数据库架构,结合数据压缩与加密技术,保障海量热搜数据的长期稳定存储,支持历史数据的快速查询与回溯分析。数据监测与记录数据监测与记录数据可视化与分析数据可视化与分析变化趋势图绘制:变化趋势图绘制:运用数据可视化引擎,结合时间序列分析算法,将热搜热度与排名变化数据转化为直观的图表,包括折线图、柱状图、热力图等多种形式,帮助用户清晰感知热搜态势演变。智能分析与洞察:智能分析与洞察:基于机器学习算法,对热搜数据进行深度挖掘,分析热点话题的传播路径、用户关注焦点、舆论倾向等,为用户洞察网络生态提供有力依据,辅助用户做出精准决策。AIAI热搜热搜:热搜聚合与:热搜聚
62、合与智能分析系统智能分析系统八平台历史热搜八平台历史热搜新建监测新建监测监测报告监测报告AIAI热搜热搜:热搜聚合与:热搜聚合与智能分析系统智能分析系统热搜名称 榜单类型上榜热搜排名 上榜热搜时间 上榜热度值 最高热搜排名最高热搜排名时间最高热度值 标签类型 话题主持人 主持人类型 在榜时长粉丝数 资源位热度概况热度概况热搜个数与热度走势热搜个数与热度走势热搜排名分布情况热搜排名分布情况最热热搜传播路径最热热搜传播路径日热搜个数与热度走势日热搜个数与热度走势分阶段热搜时段走势分阶段热搜时段走势阶段热搜类型特征阶段热搜类型特征热搜主持贡献热搜主持贡献TOPTOP账号账号官方热搜资源机制官方热搜资
63、源机制数据源标签数据源标签数据分析报告维度数据分析报告维度自动采集全网数据,大模型一键生成专业报告;八大维度覆盖事件分析重要视角;一事一议,精准把握风险和对策;大模型分析逻辑清晰,观点深入;自动化生成分析图表,可在线校对。大模型智能报告大模型智能报告“传统”自动报告事件分析深度不足,数据统计表面化缺乏个性化描述,往往通用文字模版缺乏对事件的风险评估缺乏事件后应对建议事件分析媲美专业分析师事件分析媲美专业分析师透过数据总结规律特征透过数据总结规律特征依据具体细节研判风险点依据具体细节研判风险点针对研判风险给出对应建议针对研判风险给出对应建议民生热点互联网服务汽车制造信息技术金融食品制造行业分类A
64、IAI热点热点:行业热点事件智能分析与定制化报告系统:行业热点事件智能分析与定制化报告系统AIAI热点是一款基于先进人工智能技术的行业热点事件分析系统,专注于为用户提供全面、深入且结构化的热点事件分析热点是一款基于先进人工智能技术的行业热点事件分析系统,专注于为用户提供全面、深入且结构化的热点事件分析报告。系统通过智能数据抓取、自然语言处理和机器学习技术,实时监测不同行业的热点事件,并生成涵盖事件概况、报告。系统通过智能数据抓取、自然语言处理和机器学习技术,实时监测不同行业的热点事件,并生成涵盖事件概况、传播走势、情感分析、平台分布、媒体报道、网民评论、风险研判与舆情应对等多维度的分析报告。传
65、播走势、情感分析、平台分布、媒体报道、网民评论、风险研判与舆情应对等多维度的分析报告。A AI I热点:行业热点事件智能分析与定制化报告系统热点:行业热点事件智能分析与定制化报告系统市场研究人员可以借助AI热点的数据分析功能,深入了解消费者需求和市场趋势。企业可以利用AI热点监测行业动态,及时调整市场策略,提升竞争力。通过舆情分析和风险研判,提前应对潜在危机,保障企业声誉。普通用户可以快速了解感兴趣的热点事件,满足日常信息获取需求企业决策支持企业决策支持市场研究市场研究分析分析媒体与内容创作,媒体机构可以快速获取热点事件信息,为内容创作提供灵感和素材。利用情感分析和传播走势数据,优化内容传播效
66、果。普通用户普通用户媒体与内容媒体与内容创作创作1.1.热点事件监测与记录热点事件监测与记录 多行业覆盖多行业覆盖:系统支持对多个行业的热点事件进行监测,涵盖民生、互联网服务、汽车制造、信息技术、金融、食品制造等领域。实时数据抓取实时数据抓取:利用智能爬虫技术,实时抓取全网数据,确保热点事件的及时发现和记录。2.2.结构化分析报告生成结构化分析报告生成 多维度分析多维度分析:系统自动生成的报告涵盖事件概况、传播走势、情感分析、平台分布、媒体报道、网民评论、风险研判与舆情应对等八大模块。数据可视化数据可视化:通过图表、曲线等形式直观展示热点事件的传播走势和情感倾向,帮助用户快速理解事件动态。3.
67、3.用户定制化功能用户定制化功能 专属案例库构建专属案例库构建:用户可以根据自身需求输入特定案例,系统将为其生成专属的案例库,方便用户管理和复用。模块自选模块自选:用户可以根据实际需求选择报告中的模块组合,灵活定制报告内容核心功能AIAI热点热点:看案例与自建案例库:看案例与自建案例库看案例自建案例管理案例AIAI热点:热点:DIYDIY事件智能分析事件智能分析模块自选:8个一级维度13个二级维度支持用户根据自身需求定制报告内容和模块组合,满足不同行业、不同企业的多样化需求,AI热点分析-数据型AIAI热点:热点:DIYDIY事件智能分析(事件智能分析(内测)内测)事件概述:事件概述:2025
68、年春节期间,*街道为了营造古城夜间氛围,倡议沿街商户夜间亮灯。不料2月3日晚,因一商户未按要求彻夜开灯,数名身着制服的工作人员深夜撬锁进入店铺强制开灯,并更换门锁。店主曝光监控视频后,此事在网上引发强烈关注和批评。网民和媒体普遍认为,基层执法人员手段粗暴、逾越法律红线,仅为追求“亮化”政绩不惜侵犯商户权益。事件迅速登上热议话题,当地街道办于2月7日凌晨发布致歉信,承认工作方法失当,反思急于求成和简单粗暴的问题,并表示将规范管理,确保不再发生类似事件。总体来看,舆论对这种“倡议变强制、执法变违法”的现象反响强烈,要求严肃追责整改,以维护法治与营商环境。倡议下发倡议下发(1 1月下旬)月下旬)事件
69、曝光与初步回应事件曝光与初步回应(2 2月月4 4日日-5-5日)日)官方致歉及处理官方致歉及处理(2 2月月6 6日日-7-7日)日)事件脉络:事件脉络:强化法治培训,规范执法行为对于政府倡议类事项,应明确其非强制性质,不得层层下达硬性指标。上级部门在发出倡议时要同步强调执行红线,防止基层将倡议异化为命令。建立监督机制,严格禁止以完成任务为由对倡议事项强制执行。一旦发现“倡议变强制”苗头,应及时纠偏,确保倡议始终遵循自愿参与原则。各级执法和基层工作人员需加强法律法规和执法规范培训。牢固树立“依法行政、依法执法”观念,杜绝以行政命令替代法律程序的行为。本事件暴露出一些人员法律常识欠缺、底线意识
70、不足,应开展针对性的警示教育,让“不经授权不得入内”“保护私有财产”等成为不可逾越的红线。同时完善执法流程,明确任何进店检查都须依法依规、征得同意或持合法手续,杜绝私自撬锁等现象。对擅自违规执法者严肃处理,以儆效尤。基层政府应摒弃急于出政绩的心态,切实转变作风。从此次事件汲取教训,在推进夜间经济等工作时,多站在商户和群众立场考虑可行性,避免“一刀切”式要求。杜绝“数字出政绩”和表面工程,评估措施的实际效果和负担。对于亮灯工程这类旨在营造氛围的举措,可采用激励而非压迫的方式,例如通过补贴、电费减免或评优表彰来鼓励商家参与,而非简单下令。上级主管部门也应反思考核导向,避免给基层下达不切实际的任务指
71、标。相关部门应欢迎社会各界监督,如街道办在致歉信中承诺的那样,积极倾听商户和市民的意见。12345热线等渠道对涉及自身的投诉也应及时介入处理,不能因为牵涉公权力就敷衍了事对超越职责、滥用职权者依法依规问责处理,并将结果向社会公布,以重建公众信任。AIAI热点:热点:DIYDIY事件智能分析(事件智能分析(内测)内测)舆论观点:舆论观点:倡议演变倡议演变强制,基强制,基层形式主层形式主义作祟义作祟强制执法强制执法涉嫌违法,涉嫌违法,侵害商户侵害商户权益权益粗暴执法粗暴执法破坏营商破坏营商环境,公环境,公众信心受众信心受损损政绩冲动政绩冲动与与“面子面子工程工程”遭遭炮轰炮轰该事件中执法人员公然破
72、门而入、剪锁开灯,被普遍视为逾越法律底线的行为。法律界人士指出舆论聚焦于“倡议为何沦为命令”的现象,批评基的现象,批评基层工作中的形式主义和层层加码作风。在官方文件层工作中的形式主义和层层加码作风。在官方文件上,夜间亮灯本是倡议性质,并无强制效力。然而上,夜间亮灯本是倡议性质,并无强制效力。然而从实际执行看,基层部门往往将上级倡议当作硬性从实际执行看,基层部门往往将上级倡议当作硬性命令,不容违背命令,不容违背许多评论从营商环境和政府形象角度,批评“撬锁亮灯”给当地带来的负面影响。商户本是城市经济活动的主体,却在节日里遭遇如此对待,引发企业群体对当地营商环境的担忧。有舆论指出,被强制打开的灯光照
73、亮的不是繁华,而是破坏营商环破坏营商环境的阴影境的阴影,如果不彻底纠正问责,必然让投资者和经营者对当地“敬而远之”在更深层次上,很多媒体将矛头指向事件背后的政绩观扭曲与面子工程心态。风险研判:风险研判:公信力与形象风险:公信力与形象风险:事件已在网络引发广泛负面关注,暴露出基层治理乱象。如果相关部门处理不当、避重就轻,可能导致公众对政府公信力的进一步下降。官方致歉虽及时,但其措辞被部分舆论批评避实就虚(仅称“工作方式失当”而未提法律责任)。若后续问责和整改不彻底,网民的不满情绪可能累积,引发新一轮舆情。对设市而言,城市形象已受冲击,需防范舆论持续发酵影响当地旅游和投资意愿。正如评论所警示,破坏
74、营商环境的行为不纠正,将使企业对当地“敬而远之”,长远看将削弱地区经济活力。启示建议:启示建议:01030204明确倡议边界,严禁强制加码转变工作作风,杜绝形式主义健全监督问责机制Zeelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解决方案提供高效、深度的信息解决方案Zeelin Deep ResearchZeelin Deep Research旨在帮助用户高效完成复杂得多步骤分析任务。用户只需输入一个查询问题(一个指令),系统就会自动先从知识库中检索与问题相关的内容块,然后通过标签器和标注器筛选出有用信息,并由过滤器生成新的查询,指导后续检索
75、;进行多轮检索、分析并整合信息来源,直到获取足够信息生成最终答案;最终,会生成一份详尽的报告,类似于专业分析师撰写的深度分析报告,为用户提供全面且精准的信息支持。Zeelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解决方案提供高效、深度的信息解决方案“有趣的是,尽管这些“TikTok难民”逃离的是中国背景的TikTok,却将大量用户转移到了另一个中国应用小红书(RedNote)。这一现象引发了有关“数字悖论”的讨论。然而,当美国用户涌入小红书等中国社交平台时,这种“逃离一款中国应用却投奔另一款中国应用”的现象,反映了数字世界错综复杂的全球化特质
76、。这一悖论不仅揭示了平台的地域文化和内容生态的差异,还反映了跨国数字平台竞争中的复杂动态。TikTok难民的选择并非简单的逃离与投靠,而是在面临政治、文化和技术多重约束下的“无奈选择”。因此,在分析TikTok难民现象时,不能仅仅从平台的归属国来进行二元对立的简单推论,而应该从全球数字生态、文化认同、技术依赖等多角度出发,深入剖析其背后的深层次因素。”Zeelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解决方案提供高效、深度的信息解决方案 政府监管与数字主权的再定义政府监管与数字主权的再定义随着“TikTok难民”的迁移,平台的跨境运营和全球化
77、发展对政府监管能力提出了巨大挑战。在传统的国家主权框架下,政府往往能够控制本土的数字平台,但随着社交平台的全球化扩展,尤其是像RedNote这样的跨国平台,它们在全球范围内的内容传播和数据流动使得国家监管边界变得模糊。这种变化促使各国政府重新审视如何在全球数字化进程中保持对数字平台的监管权,如何平衡数字自由与国家安全的需求。数字主权数字主权成为了全球化数字平台面临的重要议题之一。国家如何在保障数字经济和数据安全的同时,防止外部平台对本国信息流和文化传播的过度干预,成为了各国政府的一个重要考量。以美国为例,其政府在TikTok的监管政策中就展现了对数字主权的担忧,尤其是在数据流动和平台内容的控制
78、方面。未来,随着全球数字平台间竞争的加剧,如何建立更加公平、透明的全球数字治理机制,避免数据垄断与文化霸权,成为了全球互联网治理中的一个核心问题。ZeelinZeelinDeepResearchDeepResearch商用服务商用服务Zeelin Deep Research是服务,在DeepSeek推理大模型基础上,它将是为你开发专属、私有“AI应用”推理大模型与智能体应用的技术伙伴。马文明斯基设想“Agents心智社会”,即“智能”是由多个Agents协作产生的,它们会符合进化论和博弈论的潜在规则。要构成了一个“Agents的推理社会”,仍然需要在强化学习多多投入。“我们离AI自主做出重大发
79、现的时间,不会超过几年了。”提示语管理与自动化调用提示语管理与自动化调用多模态大模型集成与封装多模态大模型集成与封装用户通过简单操作(如输入关键词、选择任务类型等)触发生成流程。系统自动将用户指令转化为模型可理解的格式,并调用封装好的提示语模块,驱动大模型完成目标材料的生成。生成结果通过实时反馈机制进行优化,用户可以根据需要调整生成参数或重新生成,以获得更符合需求的内容。ZeelinZeelin DeepResearchDeepResearch服务:智能体封装搭建服务:智能体封装搭建逻辑逻辑通过构建一个集成框架,将多个大语言模型、推理模型进行按需封装,形成一个统一的接口。每个模型针对特定任务(
80、如文本生成、图像描述、代码生成等)进行优化,并通过模块化设计,将不同功能模块(如文本理解、内容生成、风格调整等)封装为独立的提示语(Prompts)单元。这些提示语单元通过参数化配置,能够根据输入需求动态调整模型的生成逻辑。开发一个提示语管理系统,用于存储、管理和调用封装好的提示语。该系统通过自然语言处理(NLP)技术解析用户输入的简单指令,自动匹配并调用对应的提示语模块。同时,利用上下文感知算法,根据用户需求的复杂性和具体场景,动态组合多个提示语模块,以实现复杂任务的自动化生成。自动化生成与交互优化自动化生成与交互优化系统架构与技术实现系统架构与技术实现整个系统采用分层架构设计,底层为多模态
81、大模型集成层,中层为提示语管理与自动化调用层,上层为用户交互层。技术实现上,利用微服务架构将各功能模块解耦,通过API接口实现模块间通信。同时,引入机器学习算法对用户反馈进行分析,持续优化提示语的准确性和生成效果。通过这种智能体封装和自动化设计,系统能够高效地将复杂的多模态大模型能力转化为用户友好的简单操作,大幅提升内容生成的效率和可扩展性。ZeelinZeelin DeepResearchDeepResearch服务:智能体封装搭建服务:智能体封装搭建路径路径模块化优势:将行业研究拆解为结构化子任务(子产品),通过路由智能体动态调度,符合复杂问题分解的工程学逻辑。类似AlphaFold2中注
82、意力路由的设计思想。领域适配性:不同行业(如医药vs制造业)的研究范式差异较大,专用智能体比通用模型更能捕获行业特有的分析框架和知识图谱。路由智能体的设计需要突破传统决策树的局限:融合元学习能力,动态感知问题复杂度、数据完备性、时效性要求。引入强化学习机制,通过历史任务反馈优化路由策略知识封装标准化:需建立统一的行业本体论框架(Ontology Framework);结构化报告应包含可机器解析的元数据标签(如分析维度、数据来源、置信度)认知一致性难题:各智能体底层认知基模(Schema)需对齐;设计跨模块的一致性校验层,类似分布式系统中的共识机制动态演进机制:行业研究范式会随政策/技术变迁而改
83、变;需要构建智能体版本的灰度发布和A/B测试能力多智能体协作架构的合理性多智能体协作架构的合理性关键技术实现考量关键技术实现考量潜在潜在挑战与优化方向挑战与优化方向由GPTs-Flowchart Generator梳理文本生成代码,Mermaid AI生成思维导图推理大模型推理大模型十条十条使用心得使用心得如果传统生成式大模型是兼职助理,那推理大模型应该是“正式员工”,且是一位对工作可以“兜底”的员工,包括理解需求、推测使用场景、寻找生产资料、组织生产资料并可输出一份完整的结构化内容。基于数据等生产资料的复杂、推理任务,可以试试推理大模型,包括预测型任务,输出结果最高八成满足研究目标。简单任务
84、仍交给传统生成式大模型,以免陷入自寻烦恼画蛇添足陷进,所谓“简单任务”,好比传统搜索引擎式任务。模板类任务需要结合生成式大模型和推理大模型,各取所长,前者避免“华而不实”,围绕中心内容打转;后者避免“自作主张”,脱离模板太遥远。提示语如果研究不明白,可以考虑放弃研究,强大的推理大模型是一个“善解人意”的好助手,如果理解不对,再纠正不迟。在推力大模型面前,会出现对提示语“视而不见”情况,毕竟太“聪明”,所以会自作主张,自由发挥。大胆启用推理大模型,但仍需谨慎验证,幻觉问题依然存在,尤其数据源本源性错误在所难免,且容易以AI的方式“举证”。优先使用DeepSeek本推,实在“系统繁忙”那就试试秘塔、硅基流动、Sider、MAXai等访问路径。现阶段还需保持耐心,随时接受推理大模型“罢工”。推理大模型也需要“调教”,当他不出结果时,多试试兵法。摩尔定律18个月迭代一次,某大模型每12个月就实现了10倍增长,所以永远保持“在场”很重要,不断实验,不断采纳,不断“碰南墙”,等待下一轮实验、采纳如果谈人与AI共同进化太过宏大,AI内化着实不可逆,所以是否要做AI创新与扩散的创新者(约占2.5%)、早期采用者(约占13.5%)以及早期大众(约占34%),还是通常在社会压力下才采纳创新的晚期大众(约占34%)甚至落后者(约占16%)?