定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638

《思博伦:2024测试为人工智能建设的网络和通过人工智能增强网络报告(21页).pdf》由会员分享,可在线阅读,更多相关《思博伦:2024测试为人工智能建设的网络和通过人工智能增强网络报告(21页).pdf(21页珍藏版)》请在薪酬报告网上搜索。
1、测试为人工智能建设的网络和通过人工智能增强网络思博伦电子书目 录人工智能对网络的影响测试和保障扮演的角色建议:如何测试为人工智能构建的网络建议:如何测试和保障通过人工智能增强的网络思博伦的承诺:您的测试和保障伙伴 为人工智能构建和通过人工智能增强的网络310141620思博伦电子书3测试为人工智能建设的网络和通过人工智能增强网络根据研究企业IDC的预测,到2028年时,人工智能相关解决方案所引发的部署竞赛将带动高达6320亿美元的全球支出,年复合增长率达29%。通信网络将注定成为该进程中的受益者,因为大量的人工智能技术将被集成到通信网络中,用以增强、自动化和优化网络的管理、性能和安全性。当人工
2、智能不断集成到网络的过程中,人们时常担忧人工智能是否值得信任,能否承担决策、处理敏感数据,以及防御最新黑客战略的重任。各方都在努力快速验证专为人工智能搭建和人工智能增强的网络是否能够满足预期。测试和保障是连接这些开发工作的纽带,为面对这一全新的领域的人们建立信心和可预测性。这些网络还将担负满足前所未有需求的重任。AI应用需要实时的数据处理和推理,因此要依赖不间断的上行和下行链路网络接入。只有这样才能实现处理所需的原始数据的传输,以及从边缘计算节点、区域和全球数据中心上托管的AI模型接收推理结果的过程。无论是在边缘,还是IP核心网上,这些流量都必须满足低时延、高吞吐量,以及有保证的连接能力,而此
3、类要求也加速了100G、400G和800G技术的推广普及。利用真实的流量仿真和网络数字孪生等新方法学,可以加速大规模和拥塞条件下对AI场景的全面和可复现测试,并且可以避免投资建设昂贵的专有实验室。本电子书将探讨人工智能如何影响当前的网络,以及人工智能融入关键网络功能方面的最新趋势。本电子书还将阐述测试和保障如何应对人工智能推广相关的挑战,以及它们在验证人工智能用例过程中无可估量的价值。我们还将援引思博伦的客户合作和市场经验,并针对为人工智能构建和通过人工智能增强的网络,提出其测试和保障方面的建议。接下来,我们将深入探讨。现代网络并不是为支持人工智能的数据密集型、高带宽、低时延、无损,分布式云和
4、边缘处理需求而设计的。这种变化正在推动数据中心的完全重新设计,同时无线和有线运营商也在竞相升级其联网基础设施。Dell Oro曾预计,数据中心方面的资本支出将从2023年的2600亿美元增至2028年的5000亿美元以上。IDC预计,到2028年时,人工智能软件方面的支出将高达6320亿美元29%年复合增长率达人工智能对网络的影响在本章节中,我们将讨论人工智能对网络的影响,以及人工智能在支持更高效和更智能的网络与运营过程中扮演的崭新角色。我们还将重点陈述减缓人工智能推广的各类制约因素。1G/10G100G/400G400G/800G10G/25G100G设备小语言模型和超低时延推理中央数据中心
5、大模型区域数据中心特定域大语言模型(LLM)(电信、企业和政府)安全边缘低时延推理AI流量AI流量构建的网络为人工智能人工智能对网络基础设施的影响全新的网络性能要求思博伦电子书5测试为人工智能建设的网络和通过人工智能增强网络今天的网络基础设施主要是为视频和互联网流量而设计的,而要想支持人工智能,就必须不断演进。特别是,一些新的能力需要设计到网络中,并针对人工智能通信和进程加以优化。这些网络设计应适应不断演进的性能要求、更强的传输和互联架构,并且具备充足的灵活性,把握全新联网商业模型所创造的机遇。人工智能推理。通过在训练好的人工智能模型上运行新的数据,人工智能推理应用可用于做出预测或决策。人工智
6、能推理引擎可以部署在网络中的不同点,例如网络的边缘或企业的基础设施内,目的就是改善响应时间或增强安全性和隐私。要想实现快速(以微秒计)、准确和安全的决策,就需要消除处理和传输的延迟。人工智能应用和工作负载流量。诸如文本和对话、图像、音频和视频生成,以及XR增强等人工智能应用都会在上行和下行方向生成巨大的流量。例如,视频分析会产生较大的上行流量流。人工智能正在将网络性能要求推向前所未有的水平,而重点关注的便是全新的网络。自诞生伊始,这些网络就必须能够处理人工智能应用生成的巨大流量,以及运行推理模型和执行人工智能训练的工作负载。人工智能训练和再训练。训练学习模型(如大语言模型(LLM)时需要大量的
7、数据才能识别各类模式或做出预测。这些人工智能训练任务属于计算密集型,并可能耗费数小时、数日,甚至数周的时间。为了提高效率并加快响应速度,人工智能会将这些训练数据和处理工作分发到分散程度很高多个计算节点和xPU上。这种工作需要节点之间的海量通信。为缩短训练时间,网络必须以较高的精度和速度处理这些分布式的通信,避免包重传造成的延迟。接下来,我们就来探索这些工作负载产生的影响。人工智能应用和进程对网络提出了全新的独特需求。它们引入了高水平的计算复杂性、巨大的数据量、低时延和近于无损的流量要求,目的就是为实时的决策提供支持。所有的处理通常都被分配到众多设备、边缘,以及区域和中央数据中心中。人工智能效应
8、:人工智能应用需要低时延、近乎无损的传输、高吞吐量和可扩展的架构,因此要求网络通过不断演进来实现实时决策和海量的数据流量。为人工智能构建的网络思博伦电子书6测试为人工智能建设的网络和通过人工智能增强网络人工智能训练和再训练人工智能推理人工智能应用和工作负载流量高带宽达400 Gbps或更高,用于搬运巨型数据集,通常的尺寸达数TB或PB。用于支持存储和计算节点之间大数据量的持久传输,从而优化训练时间。上下行方向均具备较低至较高的可用带宽连续高吞吐量用于通过网络将巨大的数据量搬运至推理引擎用于在必要时满足多种人工智能应用的要求通常达数百Gbps,用于加速多个数据流的并发处理。较低至微秒甚至亚微秒级
9、的时延,可同步多个所用的节点,对人工智能模型开展高效的训练。在多个计算节点上使用数据分片和并行数据传输来优化大型训练数据集的交付进程,并尽可能缩短GPU的闲置时间。用于在人工智能模型和数据集增长的过程中,为节点间越来越高的数据传输和通信需求提供支持。低时延分布式数据的高效处置水平扩展低抖动使人工智能推理能够实现实时或近实时的响应确保连贯的包交付,从而减少因包错误和重传导致的延迟。提供连贯的包交付,将数据流和决策进程受到的干扰降至最低水平,而这对于时间敏感应用尤为关键。高可靠性和容错能力尽可能减少长训练任务中因代价高昂的网络干扰和数据丢失造成的失败和重启。可靠性和可用性尤其是在关键任务应用中,用
10、于避免存在误差或延误的人工智能预测。强健的扩展能力通过随需方式应对起伏波动的工作负载,且不会造成性能的降级。以随需方式生成5或10倍于正常条件的峰值。安全的数据传输可在推理期间避免数据篡改和未经授权的访问。思博伦电子书7测试为人工智能建设的网络和通过人工智能增强网络全新的传输和互连架构 全新的联网业务模型和机遇根据预计,人工智能流量将每两年增长十倍,而更高的带宽和高性能都是其关键的网络需求。这些不断加速的要求正在刺激新数据中心,以及有线和无线通信架构不断推出。人工智能还在对容量刷新周期产生影响,并推动更强联网能力和协议的发展。数据中心运营商已经在快速转变后台架构和互连网络架构,以便为高效和安全
11、训练人工智能模型所需的高吞吐量、低时延和无损性能提供支持。相关的支持技术包括先进的以太网协议,以及迁移至800G和最终的1.6 T的互连速度。人工智能的演进已经超越了集中化的数据中心。领先的网络运营商已在将人工智能处理任务分发到整个网络上,而其自身的定位是提供网络即服务模型,实现多租户人工智能,并为新颖的人工智能流量模式提供支持。在这种离散式的架构中,区域数据中心通常负责特定域的模型,而安全边缘则提供低时延,以及本地化和专有推理。相关的支持技术包括,用于确保性能和QoS的有线和无线网络切片、用于实现高效和弹性人工智能流量路由的IPv6上的分段路由,以及用于支持量子加密联网的后量子密码(PQC)
12、技术。随着各个行业和政府机构对人工智能的需求不断提高,电信、云和联网企业将也迎来新的机遇,为客户提供与人工智能相关的各类定制、可扩展和安全的服务。这类服务通常被称为网络基础设施即服务(NIaaS),可以为企业和开发商提供针对人工智能做好准备,且经过优化的联网和xPU基础设施,能够应对人工智能的各种具体挑战。NIaaS运营商已经做好了准备,可以提供有保证的性能SLA,例如时延和响应时间、可靠性和丢包、扩展能力、安全性,以及应用层面的服务质量(QoS)。NIaaS还可以帮助运营商实现现有5G、光纤网络和数据中心的实际创收。服务的示例包括:用于多个行业和多种大语言模型(LLM)的托管式多租户人工智能
13、联网。可扩展的随需式人工智能联网和GPU即服务接入,用于实现多租户运营。安全的通信,例如零信任网络访问(ZTNA)、安全服务边缘(SSE),以及企业经营场所内的专有边缘分发。超低时延网络连接,所用到的技术包括5G、边缘计算和光纤等。专用网络切片(有线和无线),用来提供人工智能训练和推理所需的性能和QoS。利用人工智能惠及网络和运营目前,人们还在将人工智能技术集成到网络中,使之成为增强、自动化和优化网络管理、性能和安全性各个方面的系列工具。这些网络功能会发挥人工智能的能力,例如机器学习、数据分析和自动化,实现实时决策,预测网络问题,调整自身来适应不断变化的条件,并且提高运营的整体效率。1G/10
14、G100G/400G400G/800G10G/25G100G如图中所示区域,人工智能将被嵌入到整个网络的各项网络功能。设备小语言模型和超低时延推理中央数据中心大模型区域数据中心特定域大语言模型(LLM)(电信、企业和政府)安全边缘低时延推理构建的网络为人工智能思博伦电子书9测试为人工智能建设的网络和通过人工智能增强网络阻碍人工智能普及的各项挑战对人工智能决策和结果缺乏信任它们是否可靠、公平、安全和一致?透明度和可解释性人工智能系统如何和为何做出如此的预测或决定?安全性恶意行动方是否会欺骗人工智能做出错误的决定?隐私我的数据如何被收集、存储、使用和共享?法规新法规将会如何规定,以及它们对投资回报
15、会产生怎样的影响?人工智能系统和网络方面的大量投资是否能够带来回报?价值与成本的关系能源人工智能会对可持续性和成本产生哪些影响?人工智能的能力正在为网络注入智能,其中的用例包括:安全系统 用于优化策略和配置管理,并增强攻击预防和威胁探测能力。无线电接入网络(RAN)用于增强RAN的性能,并通过资源管理来优化能源效率。IP传输网络 用于实现基于目的的联网,并简化策略和配置的管理。核心网络 用来提供预测性的深入认知,并加强生命周期管理和编排的性能。全球导航卫星系统(GNSS)用于在复杂区域实现精确的定位、干扰消除和消减,以及欺骗攻击预测。网络管理系统 用于实现编排和服务保障任务的自动化,优化配置,
16、预测缺陷和分析问题的根源。尽管人工智能的机遇和潜在惠益十分巨大,但下列这些问题和不确定性却在阻碍它的普及:思博伦电子书10测试为人工智能建设的网络和通过人工智能增强网络测试和保障扮演的角色验证性能和标准及法规一致性方面的测试工作正在紧锣密鼓地进行中,同时此类测试也将减少现网在面对真实世界场景时可能出现的意外情况。鉴于软件驱动的分布式多厂商网络所具备的动态特质,贯穿整个生命周期的持续测试和保障将发挥无可估量的作用。由于人工智能可加强自主网络运行,并推动频繁的实时变化,从而优化其性能,因此每一项变化都需要持续不懈的验证。网络运营商需要以实时方式了解受影响的组件是否仍能实现互操作,并保持应有的性能水
17、平和安全性。通过在问题发展为代价高昂的故障之前查明各类问题,持续测试可以让上述构想变为现实。通过建立对人工智能的信任,提高运营的透明度,并增强治理能力,测试和保障在应对阻碍人工智能普及的挑战方面扮演着重要的角色。所用到的方法学包括真实的仿真、合成测试数据的使用、持续测试和自动化、主动测试,以及非功能性测试。我们将探索每种方法学在协助应对人工智能普及挑战方面所扮演的角色。所有人的目光都集中于通过测试来协助应对人工智能在普及方面的挑战,并确保为人工智能构建的网络和通过人工智能增强的网络具备鲁棒性、可信的特质,并且为支持巨大的投资做好准备。缩短上市时间利用自动化测试在数周内部署新的产品和服务。降低成
18、本和复杂性管理厂商和运营商的不同组合,扼制成本的无序变化。优化用户体验快速精确定位 和解决各类问题,优化用户体验。强化安全防御针对该进程中任意阶段的恶意网络攻击做好准备。从实验室验证到现场验收和现实世界的实际部署,测试和保障可以帮助我们应对加速技术变化过程中的各项挑战,实现更快捷的创新,降低成本,提供完美无暇的用户体验,并降低该技术生命周期中每个步骤的风险。思博伦电子书11测试为人工智能建设的网络和通过人工智能增强网络关键的人工智能测试方法学及能力网络数字孪生是一系列的仿真副本,其作用是充当网络和流量的“已知良好参考”。在面对为人工智能构建和通过人工智能增强的网络时,它们可以支持真实、低成本和
19、无风险的测试。数字孪生可以在现实部署之前,实现对人工智能解决方案和网络行为、性能、安全性和效率的评估。例如,我们可以使用xPU仿真器,对数据中心后台互联网络架构执行测试,而无需购买实际的GPU和计算服务器。利用网络数字孪生实现的真实仿真和模拟主动测试可以将少量的合成流量注入到网络中,用以仿真网络的各项功能和使用模式。这种作法可以生成预测性的数据,以前瞻方式监视各类性能、SLA和人工智能编排的网络变化。主动测试可以通过一个闭环系统加强人工智能的决策,在潜在缺陷影响网络之前迅速查明和隔离此类缺陷,并在该过程中提供积极和消极的反馈。主动测试非功能测试可以评价为人工智能构建和通过人工智能增强的网络在真
20、实世界条件下的表现如何。该测试可以对性能、扩展能力、安全性和可靠性的运营方面执行评估,确保安全的大规模商业部署。非功能测试合成测试数据可模拟真实世界的流量和数据,并将其用于测试的目的。此类数据不包含个人可识别信息,但可以模仿出真实的数据特性,因此可用于执行受控的、可重复的网络和系统测试,尤其是当真实数据不可用、过于敏感,或数量不足时。例如,合成测试数据可生成应用的安全流量,用于在L4-7层流量仿真器中测试已知和未知的攻击与规避技术。合成测试数据持续测试可以生命周期的每一个阶段执行自动化的测试,确保整个交付管线中的质量功能和性能。它可以充当DevOps和实验室至现网测试的关键支柱,并与持续集成(
21、CI)和持续部署(CD)进程实现集成,从而尽早探测和解决各类问题。这种作法可以尽可能降低风险,并保持设备或系统的可部署状态,随时为现网运营做好准备。持续测试和自动化思博伦电子书12测试为人工智能建设的网络和通过人工智能增强网络人工智能网络生命周期中的测试在人工智能网络的生命周期中,测试可以解决真实性、规模、弹性和安全效能方面的问题,从而扮演着至关重要的角色。此类测试有助于应对那些阻碍人工智能普及并限制其运营用途的多种基本挑战。贯穿整个人工智能生命周期的严格测试 从0日的设计和开发,到第1日的部署,以及第2日和之后的运营,都可以安全地释放人工智能的潜力,同时尽可能减少相关的风险。在设计和开发阶段
22、,数字孪生和仿真解决方案能够在无风险的环境中模拟各种网络,以极低的成本提供真实性和测试的准确性。部署阶段中的自动化持续测试可以验证人工智能在部署前后的可靠性,提供不涉及功能的扩展能力、弹性和安全性测试,而这些对于安全的启动和运营均具有至关重要的意义。最后,在运营阶段,主动测试能够以前瞻的方式监视、优化和巩固人工智能,确保它可以持续输出预期的性能,并为人工智能模型的持续改进提供反馈闭环。在人工智能得到普及的过程中,从设计到生产的持续测试和改进闭环可以确保网络以安全的方式不断演进。0日第1日第2日及之后人工智能生命周期测试的角色测试解决的挑战方法学左移(尽早测试)右移(生产中的测试)设计/开发建模