• 首页 >  人工智能 >  AI产业
  • 2025向量数据库市场需求现状、行业竞争格局及未来发展趋势分析报告(23页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《2025向量数据库市场需求现状、行业竞争格局及未来发展趋势分析报告(23页).pdf》由会员分享,可在线阅读,更多相关《2025向量数据库市场需求现状、行业竞争格局及未来发展趋势分析报告(23页).pdf(23页珍藏版)》请在薪酬报告网上搜索。

    1、 2025 年深度行业分析研究报告 目录目录 1.向量数据库AI Infra 的兵家必争之地.3 1.1.向量数据库与 AIGC 密不可分.3 1.2.为大模型提供“外置海马体”,打破“AI 幻觉”.5 1.3.提高大模型检索效率,改善用户体验.6 2.本地部署浪潮下,向量数据库迎来成长期.6 2.1.DeepSeek 开源,本地部署大模型已成未来趋势.6 2.2.本地部署是最适合大型企业和特殊行业企业的 AI 调用方式,AI 需求不断增长.8 2.3.多场景渗透推动向量数据库需求扩张.10 3.信创加速向量数据库市场集中化.11 3.1.信创背景下,企业 IT 基础设施 AI 化升级.11

    2、3.2.信创加速国产数据库渗透多行业.12 4.产品化能力变现创新:向量数据库的突围法则.13 4.1.多方布局向量数据库,竞争格局分散.13 4.1.1.初创公司各显神通,本土企业 Zilliz 行业领先.14 4.1.2.星环科技:卡位金融客户私有化部署,腾讯系资本加持.16 4.1.3.拓尔思:深度融合“DeepSeek-R1+海量行业数据+行业应用”19 4.2.向量数据库&RAG 技术发展趋势.22 nWhXrQmOtQmRpRaQaObRtRqQmOmRkPoOsQiNmOsP6MoOuNMYoOpRvPnRuN 1.向量数据库向量数据库AI Infra 的兵家必争之地的兵家必争之

    3、地 1.1.向量数据库与向量数据库与 AIGC 密不可分密不可分 向量数据库,就是用于存储、索引和搜索向量数据的仓库。向量数据库,就是用于存储、索引和搜索向量数据的仓库。向量数据库早在2018 年便开始应用,主要面向 AI 企业用户,曾被质疑天花板不高。一方面大模型出现前,向量数据库的使用场景常限于推荐系统、视觉检索等,应用场景局限被投资者质疑市场天花板不高,空间有限。另一方面由于用户可以基于诸如 Faiss、pgvector 等开源的向量检索插件自己研发满足需求,因此向量数据库被认为市场需求弱。向量数据库向量数据库作为大模型的外置“记忆体”,其重要性今非昔比作为大模型的外置“记忆体”,其重要

    4、性今非昔比。在 AI 时代浪潮下,涉及大型语言模型、生成式 AI 和语义搜索的应用程序,都依赖于向量嵌入,即不同于传统关系型数据库的数据以表格形式存储,向量数据库中的数据均以向量的形式存储。嵌入由 AI 模型生成,具有许多属性或特征,因此难以管理、复杂性较高,但是对于 AI 大模型和机器学习模型却至关重要。向量数据库允许以向量形式储存和索引向量嵌入,同时具备快速检索和相似性搜索的功能,借助向量数据库,我们可以向 AI 添加知识,例如语义信息检索、长期记忆等。与独立向量索引相比,向量数据库具备更专业的数据管理、数据存储和筛选、可扩展性、实时更新、备份和收集、生态系统集成、数据安全和访问控制等多个

    5、优势,为处理向量嵌入提供了卓越的解决方案。向量数据库是大模型开发过程中的重要软件基础设施。向量数据库是大模型开发过程中的重要软件基础设施。在传统的关系型数据库中,数据往往被存储为表格形式。然而,随着 AI 时代的到来,众多企业面临着海量的非结构化数据,例如图像、音频和文本等。根据 Gartner 的数据,非结构化数据占企业生成的新数据比例高达 90,并且增长速度比结构化数据快三倍。这些数据无法简单地用表格形式存储,因此需要通过机器学习算法从中提取出“特征”,向量数据库的兴起便是为了解决对这些向量进行存储与计算的问题。向量数据库是专门用于存储和管理向量数据,其具备的快速检索、混合存储、向量嵌入等

    6、能力很好的解决了 AI 大模型技术中普遍存在的知识时效性低、输入能力有限、回答问题准确度低等问题。向量数据库的优势向量数据库的优势:对比传统数据库对比传统数据库 可存储非结构化数据可存储非结构化数据 向量数据库专门为非结构数据检索而设计,通过向量嵌入函数(vector embeding)来精准描写文本、语音、图像、视频等非结构化数据的特征,从而提供查询、删除、修改、元数据过滤等操作。而像 SQL、Mysql 这样传统的数据库根本无法完成这些操作。近似最近似最近邻搜索(近邻搜索(Approximate Nearest Neighbor Search,ANNS)不同于传统数据库只能在行跟列中进行一

    7、一对应的精确检索,向量数据库通过将向量数据组成一个“立体高维空间”,在空间中进行模糊检索,输出权重最高的答案,向量数据库不仅能够完成传统数据库所具备的基本的 CRUD(添加、读取查询、更新、删除)等操作,还能够对向量数据进行更快速的相似性搜索,商业化潜力巨大,可应用于搜索广告推荐、图像音视频检索、文本挖掘、语言识别处理等广泛领域。具备高性能的快速检索与分析能力具备高性能的快速检索与分析能力 向量化执行引擎可以减少节点间的调度,提高 CPU 的利用率。不同于传统模式的一次对一个值进行运算,向量化实现了到一次对一组值进行运算的跨越。通过实现批量读取和处理,大大精简了函数调用开销,减少了重复运算,提

    8、高了执行效率。向量数据库实现了从数据预处理、存储到高效检索的端到端向量搜索解决向量数据库实现了从数据预处理、存储到高效检索的端到端向量搜索解决方案。方案。根据 Pinecone 公开的技术资料,向量数据库的整个处理过程高度系统化,性能显著提升。向量数据库通过创建索引结构以存储向量数据,并利用嵌入模型将原始数据转化为向量表示,再将向量及关联元数据导入索引,借助命名空间实现数据分区及多租户隔离。随后,将用户输入的查询内容转化为向量,并进行相似性检索,最后,通过元数据过滤、结果重排序或混合搜索策略优化来检索精度与效率。图图1:向量数据库实现了从数据预处理、存储到高效检索的端到端向量搜索向量数据库实现

    9、了从数据预处理、存储到高效检索的端到端向量搜索解决方案解决方案 数据来源:Pinecone 官网 全球数据总量爆炸式增长,非结构化数据成为主流趋势。全球数据总量爆炸式增长,非结构化数据成为主流趋势。计算机信息化系统中的数据分为结构化数据和非结构化数据,结构化的数据通常是由二维表结构来表达和实现,包括文字、表格等形式,而非结构化的数据没有预定义的数据模型,具体表现为办公文档、文本、图片,HTML、各类报表、图像和音频/视频信息等等。未来,非结构化数据的增长将呈现稳定增长态势。据 IDC DataSphere 数据显示,到 2027 年,全球数据总量从 103.67ZB 增长至 284.30ZB,

    10、年复合增长率为 22.4%,全球非结构化数据将占到数据总量的 86.8%,达到 246.9ZB。向量形式储存非向量形式储存非结构化数据,向量数据库成为大模型高效处理和准确检索结构化数据,向量数据库成为大模型高效处理和准确检索高维数据的基石。高维数据的基石。由于数据源的多样化和数据量的激增,大模型需要处理图像、音频和文本等海量非结构化数据,并提取出以向量为表示形式的“特征”,以便模型能够理解和处理。向量数据库通过向量嵌入函数,支持在数据导入阶段,将各类非结构化数据转化为向量嵌入,同时擅长处理高维向量数据,这对于 AI 应用极为重要。因此,向量数据库较传统基于索引的数据库有明显优势。同时,这种存储

    11、结构还可以保证数据的快速读取,从而提高了查询的效率。根据腾讯云发布的公告,企业原先接入一个大模型需要花 1个月左右时间,使用腾讯云向量数据库后,3 天时间即可完成,极大降低了企业的接入成本。向量数据库有效向量数据库有效清洗数据,提升模型训练效率。清洗数据,提升模型训练效率。在 AI 模型训练的数据导入环节,首先要进行数据清洗和筛选,向量数据库能够对大规模非结构化数据进行分类、标注和清理,优化数据集,从而极大程度提高 AI 模型的训练效率。在实际应用中,Altas 数据管理平台,通过接入 Pinecone、Weaviate 等向量数据库,实现训练数据的清洗和去重,腾讯将腾讯云向量数据库用于大模型

    12、预训练数据的分类、去重和清洗,相比传统方式可以实现 10 倍效率的提升。1.2.为大模型提供“外置海马体”,打破“为大模型提供“外置海马体”,打破“AI 幻觉”幻觉”数据实时交互数据实时交互,为大模型提供实时数据更新,为大模型提供实时数据更新。大模型虽具备强大的向量计算能力,但本身存储空间有限,无法长期保存大量向量嵌入数据。向量数据库则如同“外置记忆块”,能将大模型产生的海量向量嵌入数据,以向量形式存储在多维空间中,每个向量代表一个点的位置。当大模型需要处理新问题时,能快速从向量数据库中检索相关向量数据,实现数据的实时交互,为模型推理提供最新信息,突破预训练带来的知识时间限制。比如,当智能客服

    13、大模型遇到新的客户咨询时,通过与向量数据库实时交互,获取以往相似问题的解答思路和相关知识,快速给出准确回复。目前,Qdrant 向量数据库与 Pienso 合作,已经实现在开源 AI 大模型的基础上开发私域大模型。整合私域数据,整合私域数据,构建企业专属知识库,深化大模型业务理解能力。构建企业专属知识库,深化大模型业务理解能力。企业的私域数据在经过文本分割、向量化后,可以存储在向量数据库中,构建起企业专属的外部知识库,从而在后续的检索任务中,为大模型提供提示信息,辅助大模型生成更加准确的答案。通过将大模型与企业高质量私域数据相结合,能显著提升模型对业务的洞察能力,加速大模型应用落地。Zilli

    14、z 开源方案 Deep Searcher 引入 Milvus 向量数据库,最大化利用私有数据,实现对用户存储在本地的数据进行海量低延时的离线搜索。图图2:腾讯云腾讯云构建企业专属知识库,深化大模型业务理解能力构建企业专属知识库,深化大模型业务理解能力 数据来源:腾讯云 向量数据库作为“向量数据库作为“AI 海马体”,突破大模型对文本数的限制,保留上下文信海马体”,突破大模型对文本数的限制,保留上下文信息。息。大模型均有上下文长度限制,超过最大输入 token 数,模型则会忘记上文信息,从而导致回答准确性降低。向量数据库通过记忆客户端和大模型之间的对话信息,为大模型提供长期记忆,打破“AI 幻觉

    15、“。1.3.提高大模型检索效率,改善用户体验提高大模型检索效率,改善用户体验 语义搜索帮助语义搜索帮助 AI 大模型更好地理解自然语言。大模型更好地理解自然语言。过往最主流的搜索方式为关键词检索,搜索引擎事先收集数据并构建索引,接受用户输入的关键词后,将关键词进行匹配、计算相关性并排序,最后将结果呈现给用户。而随着 AI大模型的兴起,以及海量结构化数据的应用,语义检索成为一种新的选择。语义搜索通常将用户交互的信息转化成为向量数据,并通过计算其与另外一组向量的相似度,搜索到对应相似度较高的向量数据后,再生成回答,这帮助 AI 大模型真正理解了用户所表达的含义。向量数据库为向量数据库为向量向量数据

    16、数据构建索引,提升大模型搜索效率构建索引,提升大模型搜索效率、响应速度响应速度和推理和推理能力能力。在应用阶段,AI 大模型存在较多的向量相似性搜索需求,但是大模型进行语义搜索的过程耗时较长,响应速度较慢,可能会降低即刻需要得到内容生成的用户体验。而向量数据库通过 ANN 算法给不同的向量数据构建索引,有效提升搜索效率,缩短生成内容的反馈时间。混合搜索结合混合搜索结合语义搜索(语义搜索(Semantic search)和和关键词搜索(关键词搜索(keyword search),提升回答相关性,提升回答相关性,为下一代搜索和为下一代搜索和 AI 应用程序铺平了道路应用程序铺平了道路。混合搜索使得

    17、即使在查询文本与文档之间没有直接的关键词匹配,或者查询文本与文档之间的语义相似度较低,却含有相同关键词的情况下,结果仍能被检索出来,以此提高搜索结果的相关性,提升搜索结果的质量。星环科技在其自主研发的企业级向量数据库 Transwarp Scope,支持混合搜索,能够高效处理多种数据类型,提供强大的数据检索和分析能力。Milvus 引入全文检索功能,结合原有的稀疏向量检索和混合检索能力,改善语义检索在需要精确关键词匹配时存在的不足。为大模型提供缓存能力,为大模型提供缓存能力,减少减少模型模型运算量,降低储存和计算成本运算量,降低储存和计算成本。用户输入数据后,系统可以生成向量并执行缓存查找,若

    18、缓存命中,就可以直接返回结果,若缓存未命中,则调用 AI 大模型进行查找和推理,因此可以实现快速响应,并减少对大模型调用的开销。向量数据库向量数据库集成集成 GPU,加速加速搜索速度搜索速度。向量数据库的相似度计算具有并行性较高的特点,Zilliz 与英伟达携手发布的 Milvus2.4 版本极大地加快了搜索效率。Milvus 2.4 向量数据库将计算密集型任务,如索引构建和查询处理,转移到 GPU 上执行,充分利用 GPU 的并行加速能力和高速计算特性,大幅提升 Milvus 2.4 向量数据库执行高维距离计算和相似性搜索的速度,降低延迟,同时加快查询响应时间,支持更高的并发用户请求,使其成

    19、为支持实时决策和复杂数据分析的理想工具。基准测试显示,与目前市面上最先进的基于CPU处理器的索引技术相比,Milvus 2.4向量搜索性能提升高达50倍。2.本地部署本地部署浪潮浪潮下,向量数据库下,向量数据库迎来成长期迎来成长期 2.1.DeepSeek 开源,本地部署大模型开源,本地部署大模型已成未来趋势已成未来趋势 DeepSeek 产品产品 API 定价低定价低,大幅降低,大幅降低企业本地部署一流大模型的企业本地部署一流大模型的资本开资本开支。支。根据 DeepSeek 的技术报告披露,DeepSeek-V3 训练时长仅为 278.8 个GPU 小时,训练成本低至 557.6 万美元,

    20、因此,DeepSeek 大模型 API 定价仅为 Open AI 旗下产品的零头。DeepSeek R1 的 API 输入价格为 1 元(缓存命中)/M Tokens,4 元(缓存未命中)/M Tokens,输出价格为 16 元/M Tokens。若假定汇率为 7.00,则 Open AI 的 o1 模型的 API 输入价格为 52.5 元(缓存命中)/M Tokens,105 元(缓存未命中)/M Tokens,输出价格为 420 元/M Tokens。一方面,在 DeepSeek 大模型开源后,企业以有限的预算本地部署一流大模型成为可能,企业成本大幅降低。另一方面,Open AI 在 De

    21、epSeek R1 之后发布的 o3 模型价格的大幅下调也降低了全球各个国家的入局门槛,各个国家、各个行业部署大模型的成本都将大幅减少。图图3:Deepseek 以极低的以极低的 API 定价打响大模型价格战定价打响大模型价格战 数据来源:Deepseek 官网,OpenAI 官网,国泰君安证券研究(注:假设美元兑人民币汇率为 7.00)DeepSeek 开源开源的的蒸馏小模型具备多场景适配能力。蒸馏小模型具备多场景适配能力。DeepSeek R1 以宽松的 MIT License 开源协议发布,该协议赋予使用者极大的自由。在这一协议下,企业和开发者能够对 DeepSeek R1 大模型进行自

    22、由修改、开发专属插件,且不用支付版税或申请特别许可,并允许商业用途。这一开放的模式极大地激发了创新活力,让大模型在不同的应用场景中得以灵活拓展,为企业本地部署一流大模型铺平道路。此外,DeepSeek R1 性能好、具有很强的推理和反思能力,而且知识蒸馏技术进一步压缩模型,蒸馏出 32B、14B、7B 和1.5B 等小模型,使其能在边缘设备上实现实时 AI 推理。由此,DeepSeek R1 多场景适配能力卓越,从云端到本地,甚至普通 CPU 都能运行,成本极低,为大中小企业部署 DeepSeek 提供支持。多家大模型宣布免费开放使用,多家大模型宣布免费开放使用,DeepSeek 迫使头部玩家

    23、迫使头部玩家打破封闭生态打破封闭生态,行行业格局业格局重构重构。DeepSeek 开源后,行业内多家大公司竞相宣布免费使用。2 月6 日,OpenAI 宣布向所有用户开放 ChatGPT 搜索功能,用户无需注册,可直接使用 ChatGPT 的搜索引擎,并且数月内即将发布的 GPT 5.0 也支持免费使用。2 月 13 日,百度称随着文心大模型迭代升级和成本不断下降,所有 PC 端和 App 端用户均可体验文心系列最新模型。此后,谷歌最新人工智能模型套件也宣布正式向所有用户开放使用。随着大模型的开放,AI 技术将普及行业内其他企业以及其他行业,未来 AI 大模型的应用成本将持续降低。国家超算互联

    24、网平台推出“国家超算互联网平台推出“AI 生态伙伴加速计划”,拓展应用边界,加速各生态伙伴加速计划”,拓展应用边界,加速各企业本地部署大模型进程。企业本地部署大模型进程。国家超算互联网平台已连接国内 20 多家超算和智算中心,拥有超过 6500 款各类算力商品,包括国内外多种知名的 AI 开源模型,如 DeepSeek、Qwen、Llama 等,包括近 240 款 AI 模型服务,为企业提供强大的算力支撑。国家超算互联网平台宣布免费开放 3 个月DeepSeek API 接口,即用户无需下载到本地部署,即可在线完成 DeepSeek系列模型的推理、部署及定制化训练与开发。开发者将充分利用 De

    25、epSeek API 接口的强大功能,更敏捷地将 DeepSeek 模型集成到自有应用和服务中,并前所未有得实现功能和范式上的创新与突破。一方面,此举极大降低了AI 开发的门槛,为众多 AI 创业团队和中小企业提供了探索 AI 大模型的机会。另一方面,将加速 AI 技术在各类应用场景的落地,或将加速各企业本0.52814168.7517.57052.51054203.857.730.8050100150200250300350400450输入API价格(缓存命中)输入API价格(缓存未命中)输出API价格大模型API定价(元/M Tokens)DeepSeek-V3DeepSeek-R1GPT

    26、-4oOpenAI o1OpenAI o3-mini地部署一流大模型的进程。本地部署大模型趋势明显。本地部署大模型趋势明显。随着 DeepSeek 等开源大模型的发展以及国家超算互联网平台的支持,支持本地部署的大模型技术将不断完善,从模型的适配性到开发的便捷性都有显著提升,未来将吸引更多的企业和政府机构本地部署 AI 大模型,助力 AI 普惠发展。根据 IDC 预测,到 2028 年,75%的中国 500 强企业将使用 LLM 来加速企业大模型本体的开发,这也会反过来指导特定 LLM 的训练,来实现知识管理和决策智能。2.2.本地部署是最适合大型企业和特殊行业企业的本地部署是最适合大型企业和特

    27、殊行业企业的AI调用方式调用方式,AI 需求不断增长需求不断增长 注重数据安全与隐私保护。注重数据安全与隐私保护。大型企业和特殊行业企业,如金融、能源、政务、医疗等,往往持有大量敏感数据,这些数据关乎国家安全、企业核心竞争力以及客户隐私等。企业本地部署 AI 模型后,数据无需上传至外部云端,可有效降低数据泄露风险,满足严格的数据安全和隐私监管要求。符合符合 IT 开支习惯。开支习惯。国内很多大型企业在长期的信息化建设过程中,已经形成了自己的 IT 基础设施建设与运维体系,更倾向于自主掌控 IT 资源。本地部署 AI 模型契合这种开支习惯,企业可以根据自身的预算和需求,灵活配置硬件设施、软件系统

    28、和人力资源,避免对外部云服务的长期依赖和费用支出。网络依赖降低与响应速度提升。网络依赖降低与响应速度提升。大型企业业务复杂,特殊行业企业业务关键,对系统响应速度要求极高。本地部署的 AI 模型直接在企业内部网络运行,无需依赖外部网络传输数据,可避免因网络波动、延迟或故障导致的服务中断或性能下降。在一些对实时性要求高的业务场景,如金融交易风险实时监控、能源生产调度等,本地部署的 AI 模型能够快速响应,保障业务的高效稳定运行。定制化与灵活配置。定制化与灵活配置。大型企业和特殊行业企业的业务具有独特性和复杂性,通用的 AI 服务难以完全满足其个性化需求。本地部署使得企业能够根据自身业务流程、业务规

    29、则和行业特点,对 AI 模型进行定制化开发和优化,更好地适配企业业务,提升 AI 应用效果。多地政务系统多地政务系统陆续陆续接入接入 DeepSeek 大大模型,丰富政务服务场景应用。模型,丰富政务服务场景应用。在政务系统中,大模型可应用于政务办公、城市治理、民生服务等多个热门政务领域,提升服务效率,改善服务质量。深圳市龙岗区在政务外网部署上线了DeepSeek-R1 全尺寸模型,广州市政务服务和数据管理局在政务外网部署上线 DeepSeek-R1、V3 671B 大模型,同时成功适配国产硬件。同一时间,深圳市基于政务云环境,面向全市各区各部门正式提供 DeepSeek 模型应用服务,呼和浩特

    30、市大数据管理局完成了 DeepSeek-R1 在政务外网的本地化部署,模型规模覆盖 7B、14B、32B 和 70B,成为内蒙古自治区首个将 DeepSeek应用于城市大脑的地区。此外,江西赣州市、江苏无锡市、江苏常州市等已完成政务环境 DeepSeek 系列大模型部署。随着各地陆续接入 DeepSeek 大模型,将迅速实现政务系统在性能和服务能力上的显著跃升,加速智能城市、数字城市建设。图图4:多地政务系统接入多地政务系统接入 DeepSeek 大模型,丰富政务服务场景应用大模型,丰富政务服务场景应用 数据来源:无锡市数据局微信公众号 券商券商、基金等、基金等金融机构金融机构本地部署本地部署

    31、 DeepSeek 大模型,赋能各业务场景。大模型,赋能各业务场景。证券证券公司率先部署,银行、基金等紧随其后。公司率先部署,银行、基金等紧随其后。国泰君安、国金证券、中泰证券、兴业证券、国元证券、华福证券在内的多家券商,已完成 DeepSeek-R1 模型的本地化部署,用以赋能信息检索、文档处理、行业研究、市场研判、辅助软件研发、辅助制定营销方案、合规问答、业务办理指引等多个业务场景。预计未来向量数据库不再是大模型厂商专属的工具,而是会泛化到各个部署本地模型的企业中。中金财富相关业务负责人公开表示,在 DeepSeek 的辅助下,投顾信息处理效率显著提升,单日处理量突破万份文档,较传统人工处

    32、理效率提升 90%。此外,包括易方达基金、财通基金和西部利得基金在内的至少有 16 家基金公司宣布基本完成 DeepSeek 大模型本地化部署,重点关注模型在量化因子分析、智能研报生成、交易决策优化、风险管理体系升级等关键领域的能力提升。根据沙丘智库不完全统计,截止 2025/2/20,共计 46 家金融机构宣布接入 DeepSeek 模型或完成本地化部署。从应用场景上看,券商、基金等公司主要将 DeepSeek 模型用于投研投顾、产品销售、风控合规、客户服务与投教等核心业务场景;而银行出于安全合规方面的要求,多用于提升内部流程效率。工业、工业、高端设备制造业高端设备制造业加速本地部署进程加速

    33、本地部署进程,大模型助力科技创新,大模型助力科技创新。工业管理解决方案供应商蒂姆维澳网络技术有限公司成功本地部署DeepSeek大模型,导入煤矿知识安全库进行问答,未来公司将根据特定工业场景的需求和数据,对模型特定参数进行微调,或者进行二次开发,以适配 IT 系统和实现新功能,为国企、军工、医疗设备等企业的涉密数据安全保驾护航。大连本土科创企业科德数控股份有限公司宣布本地化部署验证 DeepSeek 等 AI 大模型。一方面,利用 AI 大模型快速整合多学科知识,大大缩短技术决策周期,另一方面,将设备参数手册导入本地化模型,客户可通过自然语言交互快速获取技术指导,售后支持效率得以提升,推动售后

    34、服务智能化。本地部署确保客户敏感加工信息无需上传云端,尤其是在涉及航空航天等重点行业,真正做到国产化技术从芯片到系统的全面自主可控,助力探索高端装备制造业数控系统嵌入“国产芯+AI”的无限可能。交通交通、文旅、文旅行业部署大模型,助力行业部署大模型,助力城市生活智能化城市生活智能化。昆山市交通运输局成功本地部署 DeepSeek 智能平台,接入实时数据,构建交通本地知识库,实现科技在流量预测、智能感知与监测、智能巡检、一站式智能问答等方面全面赋能。吉林省国有企业吉视传媒成功完成 DeepSeek 大模型的本地化部署,打造的“吉林文旅大模型”将应用于智能导游、个性化路线推荐、文化 IP打造等多个

    35、场景。未来随着各个行业和 DeepSeek 的应用持续加深,人们日常出行将朝着智能化、高效化前进。2.3.多场景渗透推动向量数据库需求扩张多场景渗透推动向量数据库需求扩张 向量数据库的应用场景正从单一向量数据库的应用场景正从单一 AI 模型训练辅助工具向多行业核心系统模型训练辅助工具向多行业核心系统渗透。渗透。医疗行业。医疗行业。首先,在制药行业,向量数据库可用于蛋白质性质预测。通过向量嵌入编码化合物的化学结构,测量其与目标蛋白质的相似性,加速识别有前景的药物候选物,节省药物发现过程所需的时间和资源。其次,基于向量数据库构建的智能问答系统可用于智能问诊。由于智能问答系统中的问题和答案通常被转换

    36、为向量表示,并存储在向量数据库中,因此,当用户通过自然语言提问获取相关信息时,系统可以更快速、准确地响应用户的请求,提高用户体验。第三,多模态搜索能力为智能病理分析提供技术保障。图像、视频、音频被分解为向量,这使得可以通过比较存储在向量数据库中的嵌入向量来进行高级搜索。金融领域。金融领域。首先,向量数据库的应用可以提高风控能力。信息通常由向量储存,在数据库中表示为一个数据点,可以通过计算点与点之间的距离或不相似性来检测异常,提高对潜在问题的识别能力。其次,向量数据库可以加速金融支付。由于金融数据通常涉及多维数据,比如交易金额、地理位置、用户行为、交易时间等等,向量数据库可以将高维特征向量化,提

    37、升检索速度,实现支付的低延迟与高吞吐。互联网服务。互联网服务。一方面,向量数据库支持个性化推荐。用户信息、项目、用户行为特征通常被表示为向量储存在向量数据库中,通过测算相似度,推荐系统可以根据个人偏好提供个性化推荐,提升用户满意度。另一方面,向量数据库支持以图搜图等多模态信息检索,为互联网服务赋能。工业制造。工业制造。首先,向量数据库为工业监测赋能。通过计算点与点之间的相似度,从而对工业产品实现质量监控与良率分析,帮助工厂识别异常。此外,向量数据库支持多模态数据的存储,赋能工业图像检测。大模型基础设施。大模型基础设施。向量数据库注重数据安全与隐私保护,可以实现本地数据在不出域的情况下,搭建大模

    38、型的私域应用。向量数据库是人工智能基础设施的向量数据库是人工智能基础设施的重要一极,市场前景广阔重要一极,市场前景广阔。未来是数据时代,市场对数据库的需求将不断增加。根据中国信通院测算,2022 年全球数据库市场规模为 833 亿美元,中国数据库市场规模为 59.7 亿美元(约合 403.6 亿元人民币),占全球 7.2%。预计到 2027 年,中国数据库市场总规模将达到 1286.8 亿元,市场年复合增长率(CAGR)为 26.1%。向量数据库作为大模型的重要支撑,能够存储和管理海量的向量数据,为大模型提供高效的检索和匹配服务。目前我国向量数据库产品数量仅占数据库产品总数量的 3.1%,但

    39、AI 和 ML 的兴起、对实时应用程序的需求增加以及云计算的日益普及将推动向量数据库市场的增长。根据 Markets and Markets 的数据,全球向量数据库市场的复合年增长率(CAGR)为 23.3%,预计到 2028年将从 2023 年的 15 美元增加到 43 亿美元。越来越多的企业将大模型和向量数据库相结合,展现出向量数据库在赋能越来越多的企业将大模型和向量数据库相结合,展现出向量数据库在赋能大模型的强劲实力。大模型的强劲实力。腾讯在早年就开始布局向量数据库,将其混元大模型结合自研向量数据库腾讯云 VectorDB,并应用到各软件产品当中。公开数据显示,通过腾讯云向量数据库,QQ

    40、 音乐人均听歌时长提升 3.2%、腾讯视频有效曝光人均时长提升 1.74%、QQ 浏览器成本降低 37.9%,就在于检索效率、运行稳定性、运营效率、推荐算法等,有了较大的提升。2023 年,恒生电子率先入局,在其智能投研平台 WarrenQ 中推出金融文档挖掘器ChatMiner 产品,该产品基于大模型和向量数据库构建,根据用户对话指令对指定文档进行快速解读,提供精准检索与定位、提取关键信息、整合归纳本报告来源于薪酬报告网站(),由用户Id:93117下载,文档Id:614483,下载日期:2025-02-26有效信息、精炼或拓展等功能。2024 年,各个行业的企业开始探索“AI+向量数据库

    41、”的无限可能。东吴证券、星环科技、豆神教育均基于自研大模型和向量数据库,搭建 AIGC 应用平台或应用软件,中国高科子公司的产品考试宝则依托腾讯云向量数据库搭建平台 AI 基础设施,加速了向量数据库在各个领域的应用与落地。2025 年初,在开源大模型 DS 的加持下,中科曙光发布其人工智能管理平台 3.0 版本,成功构建基于“向量数据库+大模型”的 AI 智能体,打响 2025 年向量数据库赋能 AI 智能体的第一枪。未来,越来越堵多的企业将深化数字转型,打造公司的 AI 智能平台、AI 智能软件,大模型和向量数据库的结合将持续为 AI 智能体赋能。表表1:越来越多的企业将大模型和向量数据库相

    42、结合越来越多的企业将大模型和向量数据库相结合 企业企业 行业行业 内容内容 中科曙光中科曙光 计算机、通信和其他电子设备制造业 在开源 AI 模型助力下,人工智能管理平台 SothisAI 3.0 成为结合向量数据库技术以及提示词快速构建检索增强生成(RAG)的智能体。腾讯腾讯 软件服务 腾讯的混元大模型采用自研向量数据 VectorDB 恒生电子恒生电子 货币金融服务 智能投研平台 WarrenQ 推出两款 AI工具产品WarrenQ-Chat 和ChatMiner,其中 ChatMiner 则是一款金融文档挖掘器,基于大模型和向量数据库构建 东吴证券东吴证券 资本市场服务 采用自研大模型东

    43、吴秀财 GPT+LangChain 开发框架+PieCloudVector 向量数据库构建了 AIGC 应用平台 星环科技星环科技 软件和信息技术服务业 无涯问知是一款基于自研模型无涯 Infinity和自研向量数据库 Hippo、图数据库 StellarDB 构建的企业级垂直领域问答知识库应用 豆神教育豆神教育 软件和信息技术服务业 豆神教育和 Zilliz 合作,推出了集成大模型技术和全语文学科知识图谱的豆神 AI,通过向量数据库解决大模型的幻觉问题以提升准确性 中国高科中国高科 教育 和腾讯合作,考试宝搭建起了平台的 AI 基础设施,依托腾讯云向量数据库为用户提供更加高效、准确的检索服务

    44、 数据来源:国泰君安证券研究 本地部署大模型的趋势将拉动向量数据库的需求本地部署大模型的趋势将拉动向量数据库的需求。在腾讯云向量数据库的实际应用中,其已服务腾讯内部 40 多个业务以及超 2000 家外部客户,覆盖 SaaS、电商、出行、教育等多个行业。随着企业对数据安全、模型定制化等需求的增加,本地部署大模型的需求不断增加,AI 大模型将不再是互联网企业独有的工具,而是深入各个行业和企业,爆发出巨大的应用空间。向量数据库作为 AI 大模型应对海量数据的重要基础设施,未来投资额与建设量势必增长,尤其是在对数据安全和隐私要求较高的行业,如党政、金融、医疗等。3.信创加速向量数据库市场集中化信创加

    45、速向量数据库市场集中化 3.1.信创背景下,企业信创背景下,企业 IT 基础设施基础设施 AI 化升级化升级 DeepSeek 助力国产助力国产 AI 生态构建,生态构建,芯片厂商实现国产替代芯片厂商实现国产替代。自 2月 1日起,华为、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯等共计 18家芯片供应厂商与 DeepSeek达成合作,华为昇腾平台将、绕过 CUDA 生态,为国产 AI 大模型的发展第二条路径。对于国内 AI 芯片厂商而言,DeepSeek 模型极大程度降低了预训练对 GPU精度的要求,国产芯片的单卡算力虽然和英伟达的 H800 相差较远,

    46、但是DeepSeek 模型的训练精度降低为 FP8,极大提升了国产芯片的算力。华为最新发布的 AI 处理器升腾 910C 芯片的推理性能已达英伟达 H100 GPU 的60%,帮助降低中国对 NVIDIA GPU 的依赖,节省大量成本。此外,芯动力与 DeepSeek-R1的适配花费时间不到 24 小时,龙芯联合太初元碁仅用 2 小 时就完成模型迁移。未来 DeepSeek 将更利好国产算力芯片,甚至可以完全实现 AI推理国产化、AI生态国产化。各类科技各类科技企业加入,加速产业链上下游协同。企业加入,加速产业链上下游协同。华为云、天翼云、腾讯云等各类云服务商,无问芯穹、硅基流动、云轴科技等各

    47、类智能计算企业,以及Intel、NVIDIA、AMD 等国外科技公司纷纷部署 DeepSeek 模型及蒸馏小模型,未来随着更多企业和科研机构的加入,将深化跨行业协作,国产 AI 生态有望在全球 AI 领域中占据更重要的位置。2025 年是信创的关键年,随着更多的企业和科研机构的加入,企业 IT 基础设施 AI 化升级加速。摩尔线程摩尔线程凭借高凭借高性价比性价比显卡显卡助力国产助力国产 GPU 加速加速替代。替代。国产 GPU 厂商摩尔线程发布 MTT S80 和 S70 两款显卡的最新驱动程序(v290.100),在部分游戏中的平均帧率提升显著,其中瘟疫传说:安魂曲平均帧率提升超过120%,

    48、标志着国内显卡性能大幅增长。此外,最新驱动程序支持 MTT S30显卡,或将极大程度提升国产 GPU 替代的速度。相较于 MTT S80 高达 255W的功耗,MTT S30 显卡功耗仅 为 35-40W,将大幅降低耗电量以及显卡运行时的散热需求,提升系统的稳定性和可靠性。此外,MTT S30 显卡售价为 399 元,为大规模企业级、政府级单位的应用提供可能性,或将加速国产GPU 替代浪潮。信创背景下,各行业信创背景下,各行业国产数据库国产数据库替换蕴藏巨大市场潜力。替换蕴藏巨大市场潜力。根据第一新声调研,目前党政领域的数据库国产替代率高达 80%,已经基本处于替换的尾声阶段;金融行业中,银行

    49、业的非核心系统,国产数据库替换比例突破 50%,核心系统替换比例仍在 15%左右,证券和保险业,非核心系统国产数据库使用比例均低于 30%,核心系统低于 20%,能源行业不足 15%,医疗、制造、教育等多个行业甚至不足 5%。不同于党政,八大行业主要注重数据库的稳定性,因此国产替代主要集中在非核心部分,但数据库的国产替代正从非核心、次核心系统向核心系统突破,国产数据库加速替代,市场空间巨大。面对未来“大模型+GPU+向量数据库”的竞争模式,国内向量数据库企业将加快发展脚步,深度参与国产替代进程。3.2.信创加速国产数据库渗透多行业信创加速国产数据库渗透多行业 国产数据库在党政、电信等领域稳步推

    50、进,但金融核心系统替换进度仍低国产数据库在党政、电信等领域稳步推进,但金融核心系统替换进度仍低于预期。于预期。金融行业因核心业务迁移复杂度高、容错空间小,普遍采取外围系统先行替代策略,而医疗、教育等公共服务领域则受限于场景适配不足与预算周期长等问题,导致早期市场热度未能有效转化为规模化落地。随着“安全可靠测评”名单落地及核心系统替代案例经验积累,未来 2-3 年或迎来替代加速拐点。分布式与集中式数据库的技术路线选择趋于理性,场景适配成为关键。分布式与集中式数据库的技术路线选择趋于理性,场景适配成为关键。用户已摒弃“分布式即先进”的片面认知,集中式数据库通过共享存储集群技术(如类 RAC 架构)

    51、在强一致性场景巩固优势,而分布式数据库则聚焦高并发、弹性扩展需求。当前国产集中式数据库在多写多读、共享存储稳定性等方面仍落后于 Oracle 等国际厂商,分布式技术则在跨节点事务处理等核心能力上亟待突破,短期内双路线将并行发展。国产数据库在稳定性、易用性等核心技术上仍面临“可用”到“好用”的鸿国产数据库在稳定性、易用性等核心技术上仍面临“可用”到“好用”的鸿沟。沟。与国际领先产品相比,国产数据库缺乏千万级 QPS、PB 级数据量场景验证,自动化运维工具链缺失导致容灾切换依赖人工干预,分布式架构跨数据中心同步延迟高达分钟级,而 Oracle、Spanner 等已实现毫秒级响应。底层模块的深度优化

    52、需持续投入 5 年以上迭代周期。向量数据库成为国产换道超车的重要机遇,技术代差小与向量数据库成为国产换道超车的重要机遇,技术代差小与信创需求形成双信创需求形成双重推力。重推力。相比传统数据库赛道,国内外向量检索技术起跑线接近,国产厂商在量化索引优化、GPU 加速等环节已局部领先,叠加政务、安防等领域 100%自主可控要求,国产向量数据库有望在工业 AI 质检、金融智能投研等场景快速渗透。需警惕国际厂商通过“大模型+向量数据库”捆绑模式建立生态壁垒,加快国产技术协同。生态共建与差异化竞争是破局关键。生态共建与差异化竞争是破局关键。集中式数据库可聚焦存量替代市场,联合信创伙伴共建性能基准测试体系破

    53、解“不敢用”难题;分布式与向量数据库需主攻增量场景,通过云平台绑定(如腾讯云 PaaS 服务)实现协同销售。长期需加强数据库内核开发与 AI 工程化复合人才培养,推动“集中式内核+分布式扩展”的云原生架构演进。4.产品化能力产品化能力变现创新:变现创新:向量数据库的突围法则向量数据库的突围法则 4.1.多方布局向量数据库多方布局向量数据库,竞争格局分散竞争格局分散 当前,当前,RAG 与向量数据库是与向量数据库是 AI 厂商布局的重点方向之一。厂商布局的重点方向之一。传统数据库厂商(如 Oracle、MySQL 生态企业)凭借现有客户基座与工程化能力,可通过升级现有产品线快速嵌入向量检索模块;

    54、而拥有大模型技术积淀的科技大厂(如谷歌、微软、Meta、百度等大厂),则依托 AI 基础设施优势,将向量数据库深度集成至机器学习平台,形成“模型训练-向量化-检索应用”的全链路闭环。两类参与者的技术路径差异显著:前者侧重平滑迁移与存量兼容,后者强调云原生架构与 AI 场景绑定,共同推动市场从技术验证向规模化落地演进。国内国内互联网巨头早期互联网巨头早期便便布局向量数据库市场。布局向量数据库市场。2023 年起,随着大规模生成式 AI 模型的崛起,以人工智能(Artificial Intelligence,AI)为代表的新一代信息技术快速创新应用,带动数据处理需求的爆发式增长以及数据类型的多元化

    55、,向量数据库有望得到更加广泛的应用。互联网作为 AI 率先推进和落地的场景,各大巨头陆续下场研发向量数据库产品。国外 Google、微软、Meta 等传统互联网大厂,都相继在其云服务平台中推出了自己的相关产品。腾讯云发布国内首个 AI 原生向量数据库 TencentCloud VectorDB,在正式发布之前,该向量数据库已经过腾讯内部海量场景的实践,并应用在腾讯视频、QQ 浏览器、QQ 音乐等 30 多款软件中。此后,京东云、百度智能云、360 等巨头纷纷布局,并推出和不断完善产品。图图5:互联网巨头早期布局向量数据库市场互联网巨头早期布局向量数据库市场 数据来源:DB-Engines 海外

    56、海外初创公司异军突起,众多企业加入向量数据库赛道。初创公司异军突起,众多企业加入向量数据库赛道。国外 Pinecone、Weaviate、Qdrant 等公司成为向量数据库的新势力。国内目前有超过 17 家企业布局向量数据库,向量数据库的开创者 Zilliz 旗下的 Milvus 成为向量数据库的标杆,新兴企业零一万物旗下的笛卡尔(descartes)基于全导航图的新型向量数据库包揽权威榜单 ANN-Benchmarks 的 6 项数据集评测第一名。未来随着对数据处理的需求增加,将滋生市场对向量数据库的需求,更多的企业有机会加入布局。表表2:初创公司异军突起,众多企业加入向量数据库赛道初创公司

    57、异军突起,众多企业加入向量数据库赛道 数据库类型数据库类型 企业企业 产品产品 开源数据库开源数据库 Zilliz Milvus 京东云 Vearch 墨奇科技 Myscale 矩阵起源 MatrixOne 零一万物 笛卡尔 九章云极 DingoDB 蚂蚁金服 Zsearch 商业数据库商业数据库 爱可生 TensorDB 拓尔思 海贝 火山引擎 VikingDB 智臾科技 DolphinDB 阿里云 DashVector 腾讯云 VectorDB 柏睿数据 Rapids VectorDB 百度智能云 VectorDB 爱可生 TensorDB 星环科技 Hippo 联汇科技 Om-iBASE

    58、 Fabarta ArcVector 360 MatrixBase 数据来源:国泰君安证券研究 4.1.1.初创公司各显神通,本土企业初创公司各显神通,本土企业 Zilliz 行业领先行业领先 Pinecone 成立于 2019 年,在向量数据库领域具有重要影响力。公司的产品 Pinecone 是一个全托管的云原生向量数据库,服务客户超 3 万余家,包括 Shopify、Gong、Disco、hyperleap 和 Zapier 等各行业龙头企业。此外,2025 年 1 月 公司正式发布 Pinecone Assistant(GA),已帮助客户打造数千个知识渊博的 AI 助手,基准测试显示 P

    59、inecone Assistant 提供的结果准确率比 OpenAI Assistant 高 12%。Chroma 公司成立于 2022 年 4 月,专注于开发向量数据库。Chroma 向量数据库一方面的优势在于其开源免费,代码透明,支持快速二次开发,另一方面是轻量级架构,部署简单,适合中小企业、初创团队快速实现向量数据库的应用。此外,Chroma 社区活跃,截至 2025 年 1 月13 日,Chroma 月访问量达 95113,同比增长 62.46%。凭借发展潜力,公司在 2022 年、2023 年获得两轮融资。Qdrant 公司成立于 2021 年 10 月,与 Microsoft Az

    60、ure、Google Cloud Marketplace、AWS Marketplace 成为云合作伙伴。公司的 Qdrant 向量数据库具备检索增强生成、异常检测、高级搜索和推荐系统的功能,并能够释放 AI Agents 的全部潜力,开源社区用户增长迅速,下载量超过 5M。Meilisearch 公司成立于 2019 年,旗下的 Meilisearch 搜索引擎可无缝集成到应用程序和工作流程中,支持多种集成方法,具备全文搜索、语义搜索、混合搜索、多模式搜索、筛选分面和排序、向量储存、联合搜索、搜索分析、地理搜索等诸多搜索功能,此外,Meilisearch 1.12 引入了新的 API 来禁用

    61、分面搜索和前缀搜索,加快索引过程。公司在 2022 年发布 Meilisearch cloud,拓展应用边界。ActiveLoop 成立于 2018 年,在 2024 年 Gartner 报告中被评为数据管理领域最酷的供应商,解决方案涵盖农业、音频处理、自动驾驶与机器人、生物医学与保健、多媒体、安全与保障等多个领域。旗下的 Deep Lake 是面向 AI 的企业级数据库,与基本向量搜索相比,RAG 知识检索的准确率提高了 22.5%,其高级可视化和数据沿袭功能将数据准备时间缩短 50%。向量数据库初创公司获得大量融资。向量数据库初创公司获得大量融资。其中行业领先者 Zilliz 成立于 20

    62、17 年,在 2022 年完成 6000 万美元的 B 轮融资,估值高达 6 亿美元,Pinecone在 23 年 4 月获得 1 亿美元的融资,估值高达 7.5 亿美元,Chroma 在 2023年 4 月获得 1800 万美元的融资后,估值为 7500 万美元。表表3:海外初创公司获大量融资海外初创公司获大量融资 公司名称公司名称 成立时间成立时间 最新一轮融资金额最新一轮融资金额(单位:万美元单位:万美元)最新一轮最新一轮 融资日期融资日期 Pinecone 2019 10,000 2023.4.26 Zilliz 2017 6,000 2022.8.24 Weaviate 2019 5

    63、,000 2023.4.21 Qdrant 2021 2,800 2024.1.23 Chroma 2022 1,800 2023.4.7 Meilisearch 2018 1500 2022.10.24 ActiveLoop 2018 1,100 2024.4.22 数据来源:国泰君安证券研究 Zilliz 是向量数据库领域的先驱是向量数据库领域的先驱。在向量数据库市场中,公司可以分为三个阵营。第一类则是以 Zilliz、Pinecone、Qdrant、Weaviate 为代表的独立向量数据库创业公司,通常以产品与压强式投入见长,专注提升产品的性能与服务;第二类则是传统数据库公司,例如甲骨文

    64、和 MongDB 等,其通过在传统数据库上加上一个具备向量检索能力的插件,赋予传统数据库向量检索能力;第三类则是以 Microsoft 为代表的云服务巨头,在云服务的产品体系中加入自研的向量数据库产品进行售卖。2024 年三季度,Forrester 发布“Forrester Wave 向量数据库报告”,Zilliz 进入领导者象限,整体而言,头部向量数据库中,独立向量数据库创业公司数量较多,且排名较高。未来,各类向量数据库供应商将不断完善索引功能、数据管理功能、实用功能以及可拓展性,独立向量数据库创业公司发展潜力巨大。图图6:向量数据库的开创者向量数据库的开创者 Zilliz 领导领导市场市场

    65、 数据来源:The Forrester Wave Zilliz 携手英伟达携手英伟达深耕向量数据库领域的技术突破。深耕向量数据库领域的技术突破。在 GTC2024 大会上,英伟达宣布全球首个 GPU 加速向量数据库诞生中国公司 Zilliz 与英伟达携手发布了 Milvus2.4 版本。Milvus 2.4 新增支持 CAGRA 索引,CAGRA 是 NVIDIA RAFT 库中最先进的基于图形处理器的图形索引。与以前只在大批量下获得性能优势的图形处理器索引不同,CAGRA 即使在小批量查询中也表现出压倒性的优势,虽然这是 CPU 索引传统上擅长的领域。此外,CAGRA 在大批量查询和索引构建

    66、速度方面的性能确实是无与伦比的。除了 CAGRA,该版本 Milvus 还支持了 GPU 暴搜,性能有数十倍提升,进一步满足需要高召回率的场景。4.1.2.星环科技星环科技:卡位:卡位金融金融客户私有化客户私有化部署,部署,腾讯系资本加持腾讯系资本加持 星环科技的定位从星环科技的定位从Data Infra进一步延伸到进一步延伸到AI Infra。公司成立与2013年,致力于打造企业级大数据和人工智能基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务,构建明日数据世界。2016 年公司成为中国首个进入 Gartner 数据仓库及数据管理解决方案魔力象限

    67、的厂商,且被评为最具前瞻性的远见者,2020-2023 年,星环科技成为连续四年蝉联IDC 中国大数据平台市场份额第一的专业厂商。目前公司产品已经在十几个行业应用落地,拥有超过 1500 家终端用户。随着人工智能大模型正在催生新一轮技术创新与产业变革,星环致力于为企业客户打造 AI 基础设施,打造从语料处理、模型训练、知识库建设等的一 整套的工具链,帮助企业快速建立行业大模型,快速使用 AIGC。公司形成丰富完整的产品矩阵公司形成丰富完整的产品矩阵,无涯大模型结合向量数据库潜力巨大,无涯大模型结合向量数据库潜力巨大。公司产品涵盖大数据与云基础平台(TDH&TDC)、分布式数据库(ArgoDB)

    68、、数据开发与智能分析工具(TDS&Sophon)、知识平台与领域大模型(TKH&无涯)。面向人工智能大模型时代的需求,公司在 2023 年 5 月发布分布式向量数据库 Hippo 和大模型运营管理软件 Sophon LLMOps,创新推出了企业级垂直领域问答大模型“无涯”及其衍生的数据分析大模型“求索”。其中,公司的“无涯”大模型是基于自研预训练模型和向量数据库 Hippo、图数据库 StellarDB 构建的企业级垂直领域问答大模型,并在 2023 年底获人民匠心产品奖,多次入围 IDC 大模型及生成式 AI 报告。图图7:无涯大模型结合向量数据库潜力巨大无涯大模型结合向量数据库潜力巨大 数

    69、据来源:星环科技公司官网 星环向客户提供了星环向客户提供了从语料到模型再到应用的完整的从语料到模型再到应用的完整的 AI Infra 工具集工具集。星环知识平台 Transwarp Knowledge Hub 集成了先进的语料开发与管理、大模型训练与优化、多模态知识工程、知识存储与检索、原生 AI 应用开发等全栈能力,为用户打通从数据到模型再到应用的完整 AI 开发链条,助力实现人工智能技术与行业知识的深度融合,加速人工智能在各行各业的规模化应用。星环的高性能向量数据库星环的高性能向量数据库深度集成深度集成 AI 基础设施全栈工具链,实现模型训练基础设施全栈工具链,实现模型训练-向量化向量化-

    70、检索应用闭环。检索应用闭环。星环的分布式向量数据库 Hippo 支持文本、图片、音视频等转化后的百亿级向量数据的存储、索引和管理,支持多种索引,具有全文检索+向量检索以及稀疏向量+稠密向量的混合检索等能力。Hippo 2.0 可以实现百亿级向量存储,提供灵活索引支持、20 倍内存成本下降和向量全文混合检索等特性。图图8:星环向客户提供了从语料到模型再到应用的完整的星环向客户提供了从语料到模型再到应用的完整的 AI Infra 工具集工具集 数据来源:星环科技公司官网 金融行业金融行业 60%市占率的私有化部署能力以及腾讯系资本加持市占率的私有化部署能力以及腾讯系资本加持构筑双重护城构筑双重护城

    71、河。河。公司深耕金融领域近 10 年,服务了大量金融行业客户,客户资 源深厚,在 AI 业务线上目前金融客户一直与公司持续着深度交流,积极探讨大模型的具体场景;公司股权结构中,第二大股东腾讯 8%的持股比例不仅带来资本背书,更打开生态协同空间,腾讯云与星环科技自 2017 年成为战略合作伙伴,随着国民级别应用微信接入 Deepseek R1,腾讯生态 AI 场景将加速发展,作为生态合作伙伴以及腾讯系的星环科技有望率先受益。业绩方面业绩方面星环科技短期承压星环科技短期承压。星环科技 2024 年前三季度实现营收 2.095 亿元,同比下降 5.94%,业绩短期内承压。主营业务收入由软件产品于技术

    72、服务、应用与解决方案、软硬一体产品与服务三方面构成,其中软件产品与技术服务收入占比 80%左右,2024 上半年实现营收 1.122 亿元。图图9:业绩短期承压业绩短期承压 图图10:软件产品与技术服务收入为主要收入来源软件产品与技术服务收入为主要收入来源 数据来源:Wind,国泰君安证券研究 数据来源:Wind,国泰君安证券研究 企业多年坚持自主研发,企业多年坚持自主研发,铸就铸就技术技术壁垒,部署壁垒,部署 DeepSeek 加速大模型应用落加速大模型应用落地地与创新。与创新。2020-2023 年间,公司研发投入持续上升,2024 年上半年研发投入达 1.28 亿元,同比上升 22.07

    73、%,公司自主研发投入较大。截至 2024 年-10%0%10%20%30%40%50%60%010020030040050060020202021202220232024Q1-Q3营业收入(单位:百万元)营收yoy(单位:%)0100200300400500201920202021202220232024H1软件产品与技术服务收入应用与解决方案收入软硬一体产品与服务收入 上半年,公司已积累了 31 项核心技术和 11 项在研技术,累计获得发明专利 139 个,实用新型专利 1 个,外观设计专利 2 个,软件著作权 419 个,技术体系完善。此外,公司积极部署 DeepSeek,无涯涯问知(网页

    74、版和小程序)已接入全参版本 DeepSeek671B 推理模型,同时,公司的大模型运营平台 Sophon LLMOps 现已支持 DeepSeek R1 全参版本和蒸馏版本。图图11:企业多年坚持自主研发企业多年坚持自主研发,铸就,铸就技术技术壁垒壁垒 数据来源:Wind,国泰君安证券研究 4.1.3.拓尔思拓尔思:深度深度融合融合“DeepSeek-R1+海量行业数据海量行业数据+行业应用行业应用”拓尔思起源于高拓尔思起源于高校校,是是中文全文检索技术的始创者,领先的人工智能、大数中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商据和数据安全产品及服务提供商。拓尔思公

    75、司成立于 1993 年,坚持“数智+赛道”的发展战略,以优秀的科技能力打造丰富的行业解决方案,为企业、政府实现数字化升级赋能,具备自主核心技术,安全可信、自主可控的特点。公司是 A 股第一家上市的大数据技术企业,凭借 30 余年的技术积累,以及在大数据、人工智能、数据安全三大领域积累的核心技术,公司市场占有率领先,在网络舆情监测、政府门户网站、融媒体、边界安全、金融风控各种领域的应用场景数字化实现深度应用。拓尔思的客户群体庞大且权威,覆盖了 80%的中央和国务院机构、全部省级公安部门、五大国有银行、三大政策性银行、92%的股份制商业银行、证监会、银保监会、上海证券交易所与深圳证券交易所、400

    76、 家地方金融监管单位、72%的中央新闻单位,公司的拓天大模型已服务国内外 10000 余家企业级用户。0%5%10%15%20%25%30%35%40%05010015020025030020202021202220232024H1研发投入(单位:百万元)研发投入yoy 图图12:拓尔思是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商拓尔思是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商 数据来源:拓尔思公司官网 拓尔思一直坚持拓尔思一直坚持“高质量数据高质量数据+行业大模型行业大模型”的双轮驱动战略的双轮驱动战略。自 2023 年 6月

    77、发布拓天大模型以来,在数据服务方面,拓尔思的高质量数据集已经被蚂蚁、小米、华为、云知声、上海人工智能实验室等数十家公司和研究单位采用;在大模型应用落地方面,相继推出了政务、媒体、金融、舆情、公安、开源情报、专利七大行业大模型,应用案例数量居全国领先地位;为降低大模型部署和交付成本,增加灵活性,推出了拓尔思拓天大模型一体化平台。打造行业打造行业数字化底座,布局向量数据库。数字化底座,布局向量数据库。公司自主研发的 TRS 大数据平台、TRS 人工智能平台和安全一体化平台,已成为行业领先的数字化基座。同时,公司已建立了大规模的数据和知识资产,正在全面构建云和数据服务生态(SaaS&DaaS),加速

    78、推进大模型落地应用推广,自主研发的拓天大模型与华为等企业展开合作,并聚焦行业优势,针对金融、媒体、政务、舆情、公安等各细分领域场景落地需求进行了系列迭代创新,入选2024 中国 AI 大模型产业图谱 1.0 版。此外,公司发布 TRS 海贝搜索数据库,优化了多副本同步、向量搜索性能、向量索引的多线程等能力,并迭代了 RAG 平台开发,为平台多种功能提供支持。海贝被中国软件行业协会评为“中国软件产业 40 年典型产品”,成功入选 2024 中国数据库产业图谱。多维集成融合多维集成融合 DeepSeek,拓尔思以“平台,拓尔思以“平台+系统系统+服务”三重奏领航行业大服务”三重奏领航行业大模型应用

    79、模型应用。拓尔思在数字政府、融媒体、金融科技、公共安全等多个领域拥有成熟的行业解决方案,全面接入 DeepSeek 的技术,打造 DeepSeek-R1+海量行业数据+行业应用的解决方案,实现系统层面的深度融合与升级。面向行业的企业级 AI 服务通过适配最终用户的真实性需求,以 Agent 智能体的模式耦合高质量数据和行业认知,再加上拓尔思拥有长期合作的客户,聚焦打造爆款系统应用。通过这种深度整合,拓尔思的行业解决方案具备了更 强的智能化能力,能够更高效地处理复杂业务场景,为客户创造更大的价值,且以更低成本实现落地。未来 AI Agent 的技术发展趋势将呈现多元化、创新化和生态化的特点。对此

    80、,公司将紧密跟随这一趋势,持续加大研发投入以推动 AI Agent 技术的进一步创新与应用拓展。公司营收持续下滑,大数据软件产品及服务为公司主要营收来源。公司营收持续下滑,大数据软件产品及服务为公司主要营收来源。公司 21年至 23 年营业收入持续下跌,截至 2024 年三季度,公司实现营收 6.19 亿元,同比上涨 2.95%,形式有所扭转。公司主营业务收入由大数据软件产品及服务、人工智能软件产品及服务、系统集成和其他业务、安全产品四个板块构成,截至 2024 年上半年,大数据软件产品及服务实现营收 2.13 亿元,占总营收的 53.6%。图图13:公司营收持续下滑,大数据软件产品及服务为公

    81、司主要营收来源公司营收持续下滑,大数据软件产品及服务为公司主要营收来源(单(单位:百万元)位:百万元)数据来源:Wind,国泰君安证券研究 拓尔思研发投入逐年攀升,深耕核心技术,深度融合拓尔思研发投入逐年攀升,深耕核心技术,深度融合 DeepSeek 技术。技术。2020年-2023 年,公司研发投入高速增长,截至 2024 年上半年,公司研发投入1.60 亿元,同比增加 13.8%,公司坚持核心技术自主研发。自成立以来,拓尔思拥有 40+发明专利、1000+软件著作权。公司积极推进“平台+系统+服务”架构级的深度融合,拓天新版本采用“通用底座+垂直专家”的混合架构,通过动态路由算法实现参数级

    82、任务分配,模型通过 DeepSeek 的训练优化应用深度知识蒸馏技术,适配多个开源大模型的成果迁移至行业服务领域,此外,拓尔思行业软件全面接入 DeepSeek,SaaS 服务全面支持 DeepSeek,实现了拓尔思技术栈从数据智能向认知智能的飞跃。02004006008001,0001,2002021202220232024H1大数据软件产品及服务人工智能软件产品及服务系统集成和其他业务安全产品 图图14:公司营收持续下滑,大数据软件产品及服务为公司主要营收来源公司营收持续下滑,大数据软件产品及服务为公司主要营收来源(单(单位:百万元)位:百万元)数据来源:Wind,国泰君安证券研究 4.2

    83、.向量数据库向量数据库&RAG 技术发展趋势技术发展趋势 原生向量数据库及检索引擎是原生向量数据库及检索引擎是 RAG 技术落地的核心支撑。技术落地的核心支撑。RAG 的重要组成部分就是外挂的专业知识库,因此这个知识库中需要涵盖能够精准回答问题所需要的专业知识和规则。目前向量数据库最先落地的客户和场景包括银行(客服、知识库)、制造业(故障检测)、汽车(知识库、图片相似性搜索)、搜索(相似性搜索)等。当前市场需求呈现显著矛盾:客户对 RAG技术栈与向量数据库的功能边界认知模糊,选型决策仍以部署成本、工程实施难度等短期因素为主导,但随着非结构化数据规模膨胀,需求焦点已向数据逻辑治理与效果量化评估(

    84、检索准确率、大模型输出稳定性)等深层诉求迁移。技术选型视角下,原生与非原生向量数据库将呈现长期共存态势,其核心技术选型视角下,原生与非原生向量数据库将呈现长期共存态势,其核心差异主要聚焦于企业级应用场景的适配性。差异主要聚焦于企业级应用场景的适配性。从商业决策维度分析,基础设施成本控制、系统部署复杂度以及大模型生态兼容性构成企业选型的关键考量指标。尽管两类数据库在基准性能测试中存在梯度差异,但通过架构优化和算法调优均可实现效能提升。具体而言,原生架构在分布式扩展能力、多维检索精度、海量数据处理吞吐量及高并发查询响应等工程指标上具有显著优势。结合自研嵌入模型的应用,可有效提升大语言模型输出的语义

    85、相关性和知识准确性。但需注意的是,实际应用效果受多重变量制约:包括数据清洗质量、基座模型能力、检索结果重排序策略、提示工程优化等关键环节。当前技术演进趋势显示,主流解决方案已普遍集成近似最近邻(ANN)、分层可导航小世界(HNSW)、图神经网络等前沿算法,导致不同技术路线间的功能边界呈现融合态势。当前向量数据库市场的技术演进主要受生成式人工智能(当前向量数据库市场的技术演进主要受生成式人工智能(GenAI)需求驱动,)需求驱动,其商业价值更多体现在大模型应用的整体解其商业价值更多体现在大模型应用的整体解决方案中。决方案中。从商业化进程观察,真正形成独立产品闭环的行业应用仍属少数,金融领域(如银行保险机构)成为现阶段主要实践场景。市场发展同时面临双重挑战:一方面 RAG 开源框架持续降低技术准入门槛,另一方面 LLMOps 工具链的完善正在重构技术生态格局。0%5%10%15%20%25%05010015020025030035020202021202220232024H1研发投入yoy 图图15:向量数据库向量数据库&RAG 技术发展趋势技术发展趋势图图 数据来源:IDC