• 首页 >  人工智能 >  AI产业
  • 人工智能之地:2025AI力觉醒——从“人工智障”到“人工智能”报告(81页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《人工智能之地:2025AI力觉醒——从“人工智障”到“人工智能”报告(81页).pdf》由会员分享,可在线阅读,更多相关《人工智能之地:2025AI力觉醒——从“人工智障”到“人工智能”报告(81页).pdf(81页珍藏版)》请在薪酬报告网上搜索。

    1、“AI”力觉醒从人工“智障”到人工“智能”2025.02 140104人工智能发展历程05全球AI大模型PKAI大模型在企业层面应用及未来发展趋势0203DeepSeek目录CONTENTSAI工具使用案例人工智能发展历程萌芽期(1950-1980)早期探索阶段l 1950年,艾伦图灵提出“图灵测试”,探讨及判断机器是否能思考问题,具备智能l 1956年,达特茅斯会议首次提出“人工智能”概念,标志着AI学科诞生1960年,人工智能开始应用在军事领域,如无人机发展期(1980-2006)专家系统、机器学习阶段l 专家系统成为人工智能发展的第一个阶段,解决了知识工程的瓶颈l 机器学习逐渐崭露头角,

    2、通过从数据中自动提取特征改进模型性能l 2006年,深度学习概念正式提出,开启了深度学习在学术、工业界的浪潮,推动了人工智能技术的快速发展。突破及爆发期(2006-至今)深度学习及大模型时代阶段l 2010年后,深度学习成为人工智能领域的热点,推动了语音识别、图像分类等技术的突破l 2020年,OpenAI发布GPT-3,标志着大模型进入规模化应用阶段l 大模型技术被认为是通用人工智能的核心引擎,推动了从感知智能向认知智能的转变人工智能发展历程人工智能(AI)是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新技术科学人工智能发展历程人工智能技术经过70年的发展已经进入

    3、成熟期,即将进入大规模应用落地阶段人工智能技术架构演变第一阶段AI主要以逻辑推理为主,聚焦决策和认知;第二阶段注重概率统计建模、学习和计算,聚焦感知、认知和决策;第三阶段聚焦学习阶段,注重大模型建设,AI能力覆盖学习和执行;第四阶段聚焦执行和社会协作环节,注重人机交互协作,人类对人工智能的反馈训练当下处于第四阶段,这一阶段从2020年开始,代表性事件为GPT-3的发布,突破了以往模型在自然语言处理领域的限制,为语言模型的进一步发展提供了强有力的基础,也为实现智能化的语言交互和人机对话打开了全新的可能性人工智能三要素数据、算力和算法作为人工智能发展的核心三要素已具备基础条件AI能力进化曲线大数据

    4、+大算力+通用大模型成为新的发展范式,将推动AI能力提升逼近通用人工智能大模型基本分类大模型按照功能可以分为NLP大模型、CV大模型、科学计算大模型和多模态大模型lNLP(NaturalLanguageProcessing,自然语言处理)大模型:主要用于处理自然语言文本数据,具备强大的语言理解和生存能力,例如OpenAIGPT系列模型lCV(ComputerVision,机器视觉)大模型:主要用于处理图像和视频数据,具备强大的图像识别和视频分析能力,例如腾讯的PCAM大模型l科学计算大模型:主要应用于解决科学领域的计算问题,需要处理大规模数值数据,例如华为的盘古气象模型l多模态大模型:可以同时

    5、处理多种类型的模态数据,如文本、图像、语音,实现跨模态搜索和生成任务,例如谷歌的VisionTransformer模型大模型主要特征以Transformer架构为基础的大模型不断取得新突破,进一步确认了人工智能技术发展走向新范式AI大模型AI大模型是人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预训练后,仅需要少量的数据微调甚至无需微调,就能直接支撑各类应用脑力效率飞跃人工智能将推动人类文明生产力的跃迁,标志着人类生存效率出现了第二次脑力效率飞跃元宇宙全球AI大模型PKTransformer架构的出现2017年,Go

    6、ogle提出Transformer架构,引入自注意力机制,极大地提升了序列建模的能力,能够更好地处理文本等序列数据,成为后续大模型的基础,如GPT系列。Transformer架构的出现是深度学习领域的一个重要里程碑,它改变了人们对序列数据处理的理解和方法,为大模型的发展提供了强大的技术支持。01GPT系列的崛起2018年,OpenAI发布GPT-1模型,初步展示了基于Transformer架构的语言模型的强大能力。2019年,GPT-2发布,进一步提升了模型性能,在自然语言处理领域取得了显著的进步,能够生成更加自然和连贯的文本。2022年11月,GPT-3.5发布,其强大的语言理解和生成能力引

    7、发广泛关注,标志着大模型在性能和应用方面达到了一个新的高度。02多模态大模型的出现2023年3月,OpenAI发布多模态模型GPT-4,新增图像功能,标志着大模型从单一模态向多模态的重要转变,能够同时处理文本和图像等多种模态的数据。同年,百度的“文心一言”、阿里巴巴的“通义千问”等多模态大模型相继亮相,推动了多模态大模型的发展和应用,为人工智能技术的进一步发展开辟了新的方向。03全球AI大模型突破与快速发展截至2024年7月,全球AI大模型数量约1328个,美国占比44%,中国占比36%。国际主流大模型如OpenAI(推出了GPT系列,在自然语言处理领域具有重要影响力)、谷歌(AlphaGo展

    8、示了深度学习在复杂任务中的潜力)、微软、英伟达、Meta。国内大模型如DeepSeek、阿里巴巴(Qwen、通义千问)、百度(文心一言)、华为(盘古大模型)、科大讯飞(星火认知)等在性能上逐渐接近国际领先水平,展现出强劲的发展势头。国内外大模型竞争加剧DeepSeek通过稀疏注意力机制、混合专家模型等创新,实现了轻量级参数与卓越性能的平衡,为大模型的高效训练和推理提供了新的思路。Qwen采用两阶段强化学习等技术,提升了模型在多模态任务中的表现,进一步拓展了大模型的应用范围和能力。技术创新与优化大模型在自然语言处理、计算机视觉、语音识别、医疗、金融、教育等多个领域得到广泛应用,为各行业的发展带来

    9、了新的机遇和挑战。未来,大模型将更加注重多模态融合、具身智能、知识更新等方向的发展,进一步提升其在复杂场景中的应用能力和价值。应用场景拓展当前格局与趋势国外大模型及其合作伙伴生成式AI里程碑ChatGPTChatGPT产品迭代图ChatGPT能力实现解析国内外主要大预言模型研发路径与技术对比围绕新兴生产力的国家博弈AI大模型应用场景AI大模型掀起多模态和多场景革命。多模态融合模型通过充分利用大模型的泛化能力,构建多模态数据集,解决融合和对齐问题,以及提供强大的计算资源支持,可以将不同类型的数据通过预处理转化为统一的表现形式,结合多个模态的信息进行联合建模和分析,从而提升其在多个感知任务上的性能

    10、和表现国内大模型玩家科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满等。除科技型企业入局外,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,他们在布局时间、基础设施建设和应用场景等方面具备明显优势国内头部大模型玩家及其合作伙伴国内外大模型竞争加剧中国大语言模型产业价值链基于新一代人工智能开源技术架构的大模型开源生态系统DeepSeek初创与起步DeepSeek公司是由私募公司幻方量化(宁波幻方量化投资管理合伙企业)孵化,是一家总部位于中国浙江省杭州市的对冲、量化基金和人工智能公司,成立于2016年,实际控制人为梁文峰梁文峰是一位在

    11、人工智能和金融领域具有深厚背景的专家。他通过创立量化对冲基金High-Flyer取得了显著成就,管理着超过100亿元人民币的资金。他拥有清华大学、北京大学和斯坦福大学等顶尖高校的学术背景,并曾与谷歌、微软、百度等科技公司的资深工程师合作幻方量化专注于开发多种量化投资策略,利用数学模型、计算机算法和人工智能技术对金融市场数据进行分析和预测,从而制定和执行量化交易策略。其主要业务涉及量化投资策略研发:开发多种量化投资策略,涵盖股票、债券等多种金融工具人工智能应用:通过深度学习等人工智能技术优化传统量化策略研究方法DeepSeek幕后投资方公司概况DeepSeek(杭州深度求索人工智能基础技术研究有

    12、限公司)是一家专注于通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用,致力于推动人工智能技术的发展和应用。公司成立于2023年7月,团队主要由国内高校毕业生和未毕业的博士生组成,拥有一支高素质、富有创新精神的研发团队。技术优势DeepSeek的模型基于当前最先进的Transformer架构,融合了稀疏注意力机制、混合专家模型等创新技术,能够实现高效的计算和推理。通过优化算法、硬件与软件的协同优化、模型压缩与量化技术等,实现了低算力下的高水准性能,为大模型的广泛应用提供了技术支持。发展愿景DeepSeek致力于推动人工智能技术的普及和应用,为人类社会带来更多便利和价值,推动人工智能技术

    13、在各行业的广泛应用。公司将继续在跨语言理解、多模态智能交互、具身智能等方面取得更多突破和创新,为人工智能技术的发展贡献更多力量。DeepSeek公司基本介绍DeepSeek热点事件回顾上架18天登顶160多国,日活用户超1500万DeepSeekR1凭借其免费且聪明的特性,迅速在全球范围内获得关注,短时间内用户量激增,成为全球增速最快的AI应用这一现象不仅反映了用户对AI工具的需求,也显示了DeepSeekR1在用户体验和功能上的强大竞争力对全球股市的冲击DeepSeekR1的发布导致美股市值一夜蒸发超1万亿美元,英伟达股价单日下跌16%,引发市场对AI技术变革的深度思考这表明DeepSeek

    14、R1的出现不仅改变了用户对AI的认知,也对传统科技企业的市场地位产生了巨大冲击行业竞争格局的变化DeepSeekR1的崛起改变了AI应用市场的竞争格局,促使其他企业加快技术研发和产品优化传统AI应用如ChatGPT等面临新的挑战,市场对AI工具的性能和用户体验要求进一步提高全球市场表现与用户增长010203技术创新与性能优势DeepSeek通过技术创新,实现了轻量级参数与卓越性能的平衡,在多项基准测试中,DeepSeek的性能媲美GPT-4和Claude等领先的闭源模型,为用户提供了更强大的性能支持。DeepSeek的混合专家架构和创新的训练方法使其在处理复杂任务时表现出色,能够满足用户在不同

    15、场景下的多样化需求。低成本与高性价比DeepSeek-V3的总训练成本为557.6万美元,相比GPT-4o等模型的训练成本约为1亿美元,大幅降低了成本,API定价低至每百万Token输入1元、输出2元,引发行业价格战,推动中小企业和开发者采用AI技术,为用户提供了更经济实惠的选择。DeepSeek通过优化算法和硬件资源的合理配置,实现了高效的模型训练和推理,降低了用户的使用成本。开源与广泛应用DeepSeek-R1是开源的推理模型,擅长处理复杂任务且可免费商用,为开发者提供了更多的自由和灵活性。DeepSeek支持多种应用场景,如自然语言处理、智能客服、内容创作、多模态交互等,能够满足用户在不

    16、同领域的多样化需求。DeepSeek爆火原因DeepSeekR1属于推理模型,专注于逻辑推理和复杂任务解决,与传统的指令模型(如ChatGPT)有本质区别推理模型能够自主处理多步骤分析和复杂决策任务,适合解决更复杂的实际问题推理模型与指令模型的差异DeepSeekR1的“聪明”特性使得用户无需复杂的提示词技巧,只需简单表述需求即可获得高质量回答这降低了AI工具的使用门槛,使更多普通用户能够轻松上手并高效利用AI辅助工作和学习简化提示词策略DeepSeekR1目前完全免费,与OpenAI的o1等付费推理模型相比,具有更高的性价比这使得DeepSeekR1能够迅速吸引大量用户,推动AI技术的普及和

    17、应用免费使用的优势DeepSeekR1的技术优势与特点DeepSeek入门使用方法与技巧关于“深度思考R1”:当你需要更简单快速的回答时,不必打开“深度思考”,使用默认模型V3即可;当你需要完成更复杂的任务,你希望AI输出的内容更结构化,更深思熟虑时,你应该打开“深度思考R1”选项,这也是今天我这篇文章主要在讨论的模型;关于“联网搜索”:当你的任务所涉及的知识在2023年12月之前,你无须打开“联网搜索”功能,大模型本身就有此前被充分训练过的语料知识;当你的任务所涉及的知识在2023年12月及之后时,比如昨天NBA比赛的赛果,硅谷对DeepSeekR1的评价等,你必须打开“联网搜索”功能,否则

    18、大模型在回答时会缺乏相应的知识大语言模型在训练时将文本切割成token单元,如“Strawberry”被拆分为“Str”“aw”“berry”,这与人类理解语言的方式不同这种机制导致模型在处理某些任务(如数字母数量)时存在困难,但并不影响其在其他领域的强大能力token化训练过程用户需要了解token化对模型行为的影响,避免提出过于依赖精确字符处理的任务在使用DeepSeekR1时,应关注其对复杂任务的推理能力,而非纠结于token化带来的细节问题对token化的理解与应对任务设计应避免要求模型进行精确的字符操作或过于复杂的文本结构处理,而是发挥其在逻辑推理和内容生成方面的优势例如,要求模型生

    19、成一篇有逻辑结构的文章,而不是精确控制文章的字数或字符数token化对任务设计的启示内容token化与理解方式训练数据的时间限制DeepSeekR1的基础模型训练数据窗口期在数月前关闭,导致其对2023年12月之后的知识缺乏了解这种知识滞后性会引发一系列问题,如对新模型、新事件的无知,甚至可能出现幻觉回答突破知识限制的方法激活联网搜索功能,让模型能够实时获取最新信息用户可以通过上传文档或在提示词中补充必要知识,帮助模型完成时效性任务知识截止时间对用户的影响用户在使用DeepSeekR1时,应明确任务是否涉及最新知识,必要时主动提供相关信息,避免因知识滞后导致错误回答知识截止时间与局限DeepS

    20、eekR1缺乏“我是谁”的概念,甚至可能因训练数据中的错误信息而产生幻觉,误认为自己是其他模型这表明模型无法像人类一样进行自我反思或自我定位自我认知的缺失用户无法直接从模型获取其自身特点、使用技巧等信息,需要通过实践和经验总结来掌握在与模型交互时,用户应避免提问涉及自我认知的问题,以免得到错误或无意义的回答缺乏自我认知的影响用户应通过自己的学习和实践,了解模型的特点和使用方法,而不是依赖模型自身的自我认知在使用过程中,关注模型的输出结果,根据实际效果调整使用策略自我认知缺失的应对策略缺乏自我认知与意识上下文记忆限制DeepSeekR1的上下文长度限制为64ktoken,约3万4万字,这限制了其

    21、处理超长文档和多轮对话的能力当输入文档过长或对话轮次过多时,模型可能会遗忘初始信息或无法完整处理所有内容输出长度限制DeepSeekR1的单次输出长度通常不超过4k或8ktoken,即2千4千中文字符,无法一次性生成超长文本这要求用户在设计任务时,合理规划输出内容的长度,避免超出模型的输出能力应对记忆与输出限制的策略对于长文档处理任务,可采用分段处理或多次交互的方式,逐步完成任务在长文写作任务中,先让模型生成框架和提纲,再逐部分生成内容,以满足用户需求记忆与输出长度限制在使用DeepSeekR1时,应清晰表达任务的具体要求,避免让模型猜测意图。例如,要求模型为跨境电商平台设计用户增长方案时,需

    22、明确目标市场、期望成果等关键信息避免使用模糊或不具体的指令,这可能导致模型无法准确理解用户需求,从而给出不符合预期的结果明确的要求能够帮助模型更高效地完成任务,提高用户体验避免模糊指令错误示范:为跨境电商平台写个用户增长方案优化方案:为服饰跨境电商平台设计30天新用户增长计划,重点突破东南亚市场,包含社交媒体运营策略、KOL合作框架、ROI预估模型明确要求的案例分析明确任务目标提出明确的要求DeepSeekR1在风格化写作方面表现出色,能够模仿各种作家、名人的风格进行创作这使得用户可以根据需求生成具有特定风格的文本,如诗歌、讽刺文、脱口秀脚本等风格化写作的优势用户可以让模型“说人话”或假设其为

    23、特定年龄段的人,从而将复杂概念简化为更易理解的表达例如,让模型以初中生的视角解释机器学习,能够帮助初学者更好地理解复杂概念简化复杂概念错误示范:给我写一首诗优化方案:用李白的风格写一首关于秋天的诗特定风格的案例分析要求特点的风格避免信息缺失缺乏背景信息可能导致模型生成的内容与用户需求不符,甚至出现错误或不合理之处因此,用户在提出任务时,应尽可能提供详细的相关信息背景信息的重要性向DeepSeekR1提供充分的任务背景信息,能够帮助模型更好地理解任务的背景和需求,从而生成更符合用户期望的结果例如,在生成减肥计划时,提供用户的身高、体重、运动习惯等信息,能够使计划更具针对性背景信息的案例分析错误示

    24、范:帮我生成为期一个月的减肥计划优化方案:我是男性,身高175厘米,体重160斤,每天步行1公里,希望1个月内瘦到150斤,请帮我制定运动及饮食减肥计划提供充分的任务背景信息知识状态标注的作用在向DeepSeekR1寻求知识型帮助时,明确标注自己的知识状态,能够让模型根据用户的理解层次提供更精准的内容例如,告诉模型自己是“初中生”或“文科生”,模型会调整输出内容的难度和深度避免知识错位如果用户的知识状态与模型的输出内容不匹配,可能导致理解困难或信息不准确因此,用户应根据自己的实际情况,清晰地向模型传达自己的知识水平知识状态标注的案例分析错误示范:给我讲讲机器学习优化方案:我是刚接触AI的文科生

    25、,请用生活案例解释什么是机器学习,要求300字以内,避免数学公式主动标注自己的知识状态DeepSeekR1作为推理模型,能够自主思考并完成任务,因此用户应更多地定义任务目标,而不是详细规定执行过程这样可以让模型充分发挥其推理能力,创造性地解决问题目标导向的思维过度规定任务的执行过程可能会限制模型的灵活性和创造力,导致无法充分利用其推理优势用户应关注任务的最终目标,让模型自行决定如何实现避免过度限制错误示范:优化下面这段录音转录的文字稿,删掉语气词,按时间分段,每段加小标题优化方案:优化下面这段录音转录的文字稿,需要整理成可供新员工快速理解的会议纪要,重点呈现功能迭代决策与风险点目标导向的案例分

    26、析定义目标,而非过程知识背景补充的必要性由于DeepSeekR1的知识截止时间限制,对于2023年12月之后的新信息,用户需要主动提供相关知识背景这有助于模型更准确地处理涉及最新事件、行业趋势或内部信息的任务01避免知识空白如果不提供必要的知识背景,模型可能会因缺乏信息而给出错误或不完整的回答因此,用户在提出涉及最新信息的任务时,应确保提供足够的背景信息02知识背景补充的案例分析错误示范:分析2024年巴黎奥运会中国代表团的金牌分布优化方案:上传2024巴黎奥运会中国夺金项目统计表,基于我提供的奥运会数据,请分析2024年巴黎奥运会中国代表团不同运动项目的金牌贡献率03提供AI不具备的知识背景

    27、思考过程的价值DeepSeekR1的思维链是全透明的,用户可以通过观察其思考过程,发现潜在的信息需求或问题这有助于用户进一步完善任务描述,使模型能够提供更精准的结果逐步细化需求根据模型的思考推测,用户可以逐步收敛需求,从开放性问题逐步聚焦到具体任务这种方法能够充分利用模型的推理能力,同时避免因需求不明确导致的错误回答从开放到收敛的案例分析例如,用户在询问产品涨价策略时,模型的思考过程可能提供多种可能性和潜在需求,用户可以根据这些信息进一步明确目标,优化问题描述从开放到收敛思维链提示的失效要求DeepSeekR1一步步思考或提供思维思路的提示词策略已失效,甚至可能起反作用模型通过强化学习已经能够

    28、自主产生高效的思维链,无需用户额外引导避免思维链提示的原因过多的思维链提示可能会干扰模型的自然推理过程,降低其效率和准确性用户应相信模型的推理能力,避免过度干预其思考过程思维链提示的案例分析错误示范:请一步步思考如何解决这个问题优化方案:直接提出问题,让模型自主思考解决方案思维链提示虽然结构化提示词在某些情况下仍有作用,但其必要性已大大降低。DeepSeekR1能够理解更自然的语言描述,用户无需过度依赖结构化提示词结构化提示词的有限性过度结构化的提示词可能会使问题变得复杂,反而不利于模型理解用户的真实需求用户应尽量使用简洁、自然的语言表达任务要求避免过度结构化的原因错误示范:以表格形式列出解决

    29、方案的步骤优化方案:直接描述问题,让模型根据需要生成结构化内容结构化提示词的案例分析010203结构化提示词专家角色的失效要求DeepSeekR1扮演专家角色的提示词已失效,模型本身已经具备专家级别的推理能力用户无需通过角色扮演来获取专业答案避免角色扮演的原因角色扮演可能会限制模型的推理范围,使其无法充分发挥其综合能力用户应直接提出问题,让模型从整体角度提供答案专家角色的案例分析错误示范:请以医学专家的身份回答这个问题优化方案:直接提出医学相关问题,让模型提供专业回答要求扮演专家角色奖励提示的无效性假装完成任务后给奖励的提示词不仅无效,还可能被模型视为无意义的指令这种提示词无法提高模型的性能或

    30、回答质量避免奖励提示的原因模型的运行基于算法和训练数据,不受人类的情感或奖励机制影响用户应专注于提出清晰、明确的任务要求,而不是试图通过奖励激励模型奖励提示的案例分析错误示范:如果你回答得好,我会给你奖励优化方案:直接提出问题,让模型根据任务要求生成答案假装完成任务后给奖励01.DeepSeekR1团队明确建议避免使用少示例提示词,因为这可能会干扰模型的理解和推理过程模型更擅长根据清晰的任务描述生成答案,而不是依赖示例02.少示例提示可能会使模型过度依赖示例,而无法灵活处理其他类似任务用户应直接描述任务要求,让模型根据自身的推理能力生成答案03.错误示范:给出一个示例,然后让模型根据示例回答问

    31、题优化方案:直接描述问题,让模型根据任务要求生成答案少示例提示的失效避免少示例提示的原因少示例提示的案例分析少示例提示DeepSeekR1不太擅长情感化的角色扮演,例如构建AI女友/男友等这是因为情感化的对话依赖直觉,而模型的推理过程是基于逻辑和数据的角色扮演的局限性角色扮演可能会使模型的回答偏离实际需求,甚至产生不合理的回答用户应专注于提出具体、实际的任务,而不是试图通过角色扮演获取情感化的内容避免角色扮演的原因错误示范:请扮演我的男朋友,安慰我。优化方案:直接提出问题,如“请给我一些建议,帮助我缓解压力”角色扮演的案例分析角色扮演当要求DeepSeekR1模仿某个作家或名人的风格时,无需对相关概念进行详细解释模型已经具备对这些概念的理解和推理能力,用户只需直接提出要求即可概念解释的无效性过多的概念解释可能会干扰模型的理解,使其无法准确把握用户的真实需求用户应相信模型对已知概念的理解能力,直接提出任务要求避免概念解释的原因错误示范:请解释李白的诗歌风格,然后模仿他的风格写一首诗优化方案:直接要求“用李白的风格写一首关于秋天的诗”概念解释的案例分析对已知概念进行解释DeepSeek培训资料AI工具使用案例AI能力征服地图PPT制作KiMiKimi.ai-会推理解析,能深度思考的AI助手https:/