定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638
《人工智能行业专题:Openai发布会梳理-241223(35页).pdf》由会员分享,可在线阅读,更多相关《人工智能行业专题:Openai发布会梳理-241223(35页).pdf(35页珍藏版)》请在薪酬报告网上搜索。
1、请务必阅读正文之后的免责声明及其项下所有内容20242024年年1212月月2323日日人工智能专题:人工智能专题:OpenaiOpenai发布会梳理发布会梳理行业研究行业研究 行业专题行业专题 投资评级:优于大市(维持)投资评级:优于大市(维持)证券分析师:熊莉联系人:云梦泽021-61761067021-S0980519030002证券研究报告证券研究报告|请务必阅读正文之后的免责声明及其项下所有内容摘要摘要OpenAI从12月5日连续12个工作日每天公布一个新应用或功能。1)DAY1:发布完整版o1;2)DAY2:发布强化微调技术;3)DAY3:发布视频大模型Sora;4)DAY4:发布
2、协作平台Canvas;5)DAY5:发布ChatGPT Apple Intelligence;6)DAY6:发布高级语音模式;7)DAY7:发布Projects in ChatGPT;8)DAY8:发布ChatGPT搜索;9)DAY9:发布o1 API;10)DAY10:发布通话访问模式;11)DAY11:发布全新桌面应用;12)DAY12:发布新一代推理模型o3&o3 mini。风险提示风险提示:AI应用落地不及预期、行业竞争加剧、大模型研发不及预期。0YRVsMnPzQrQzRrOoRoPmMaQcM7NtRnNmOmQlOrQmOjMtRpMbRoPrPxNrNnRwMpOoP请务必阅读
3、正文之后的免责声明及其项下所有内容目录目录Openai 12天发布会0101风险提示 0202请务必阅读正文之后的免责声明及其项下所有内容Openai发布会 基础模型资料来源:OpenAI,国信证券经济研究所整理 发布三大基础模型,模型性能跨越式提升12天的发布会中,OpenAI推出了三款基础模型,分别是增强的ChatGPT o1模型、Sora视频生成模型、o3模型,新的模型在数学和科学领域均有着卓越表现,同时也意味着openai在推理能力方面迈出了重要一步。o3模型的发布,更是标志着AI在编程、科学推理等领域的巨大进步。o3模型接近通用人工智能(AGI)的标准,为复杂决策和高端问题解决提供了
4、新的技术基础。Sora的发布将极大降低内容创作的成本和时间。为营销、培训、市场等各领域提供AI生成的高质量视频,有望成为企业未来内容创作的新标准。发布日期发布日期发布产品发布产品产品描述产品描述DAY1完整版o1o1的完整版本,相较之前在推理方面具有更快的速度和更优的性能DAY3Sora在文生视频的基础上,加入多种编辑工具,同时支持生成20s视频输出及多种分辨率和格式DAY12o3&o3 mini预告更强的推理模型,在ARC-AGI测试中达到87.5%,超过人类阈值,是o1的三倍表1:openai 发布会基础模型部分请务必阅读正文之后的免责声明及其项下所有内容Openai发布会 微调资料来源:
5、OpenAI,国信证券经济研究所整理发布日期发布日期发布产品发布产品产品描述产品描述DAY2强化微调使用较小的数据集即可在特定场景创建专家模型,对科研领域帮助较大DAY9o1 APIopenai 向第三方开放调用o1 API权限,可支持函数调用、结构化输出、开发者消息、视觉功能表2:openai发布会微调部分 强化微调技术,提升垂直行业模型能力用户可以根据极少量的数据,训练特定领域的专家模型。这意味着企业构建定制化的AI模型,不再需要大量的特定数据集标注。定制化能力:相较于通用AI,强化微调技术为企业提供了更灵活的定制化路径。企业可以通过这一技术打造专属的AI助手,在提高生产效率的同时,提供更
6、具个性化的服务,从而有效地提升用户体验。例如,个性化推荐、AI诊疗系统、AI审查工具等特定场景均都可以通过这一技术快速部署。请务必阅读正文之后的免责声明及其项下所有内容Openai发布会 ai agent资料来源:OpenAI,国信证券经济研究所整理发布日期发布日期发布产品发布产品产品描述产品描述DAY4Canvas集智能写作、代码协作于一身的ai工作台DAY5ChatGPT Apple IntelligenceApple Intelligence对ChatGPT的深度整合,在Siri、协作工具和相机控制方面增加与ChatGPT的集成DAY6高级语音模式将5月发布的实时视频通话功能全量开放DA
7、Y7Projects in ChatGPT允许用户创建特定项目,设置自定义指令,并将相关对话集中DAY8ChatGPT 搜索可在实时对话中调用搜索功能,并支持多模态搜索DAY10通话访问模式用户可通过拨打电话的方式与ChatGPT对话DAY11桌面应用在MAC其他程序中可轻松调取ChatGPT表3:openai发布会ai agent部分 多款ai智能体升级,大幅提升用户体验发布会发布了集智能写作&代码协作于一身的ai工作台、新的桌面应用、高级语音模式、通话访问模式等多款ai agent产品,标志着ChatGPT从简单的会话助手向更强大的代理工具的转变,从而可以代表客户执行更多任务,为用户带来全
8、新的便捷体验。请务必阅读正文之后的免责声明及其项下所有内容图1:o1在数学、编程领域能力有了极大提升DAY1:完整版o1发布 正式发布完整版o1,性能大幅提升在今年9月份,OpenAI发布o1-preview,对模型的技术思路进行了改进:将更多算力运用于推理侧,o1是使用大规模强化学习训练并使用思维链进行推理的系列模型。今年12月,OpenAI正式发布了o1完整版,o1完整版在数学、编程、博士阶段科学问题(困难问题)领域的性能远超GPT4o,在科学问题领域超越人类专家,并在数学、编程领域的性能较o1-preview有了大幅提升。相较于o1-preview,OpenAI对o1进行了使用体验方面的
9、改进:o1目前对于简单问题能够回答更加迅速,OpenAI测试目前o1较o1-preview重大错误率降低了34%,速度提升50%。目前o1已面向所有Plus订阅用户推出,用于替代o1-preview,并将上线后续推出的Pro订阅。资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容 支持多模态,可处理模糊问题OpenAI对o1进行了改进,目前支持图像、文本两种输入方式。在演示中,对于一张手绘的太空太阳能驱动的数据中心示意图,o1估计出了其散热器表面积并解答了两个问题:如何处理太阳和深空环境,以及这里如何体现了热力学第一定律,整个推理过程仅需10秒钟。在示例
10、中,OpenAI故意省略了冷却面板的温度等关键数据,用以测试o1在处理模糊问题时的能力。示例中o1自行识别了关键参数缺失,并选择了合理的温度范围进行后续的推理,输出了合理结果。OpenAI表示,o1未来还会添加网页浏览、文件上传等功能,以及引入API,具体上线时间未知。图4:o1根据手绘图像准确回答问题资料来源:OpenAI,国信证券经济研究所整理图3:研究人员用手绘图片测试o1性能资料来源:OpenAI,国信证券经济研究所整理DAY1:完整版o1发布请务必阅读正文之后的免责声明及其项下所有内容图5:o1 pro模型较o1性能有全方位提升资料来源:OpenAI,国信证券经济研究所整理图6:o1
11、 pro模型具有更强稳定性,适用于专业领域资料来源:OpenAI,国信证券经济研究所整理 推出PRO订阅OpenAI发布最新订阅选项ChatGPT Pro,定价200美金/月,在这个套餐里,OpenAI 提供了o1 pro mode,这个模式中o1处理非常难的题目时,用户可要求o1 pro获得更多算力,并强化思考。o1 pro mode在数学、编程、科学问题领域性能较o1均有提升,但重点在于o1 pro mode的连续性。OpenAI设计了“四次测试”评估:模型需要连续四次都答对同一个问题才算通过。在这种条件下,o1 pro模式保持了相当高的可靠性:在竞赛数学中达到80%,编程测试中达到74.
12、9%,科学问题中达到74.2%。远超普通版o1。这说明o1 pro能提供更佳的稳定性和一致性,对于需要AI协助完成重要工作的专业人士来说能够有更好的保障。同时,ChatGPT Pro订阅计划能无限制访问OpenAI o1,以及o1-mini、GPT-4o和Advanced Voice。图7:Pro订阅可以解锁o1 Pro及其他权益资料来源:OpenAI,国信证券经济研究所整理DAY1:完整版o1发布请务必阅读正文之后的免责声明及其项下所有内容图9:o1可展示详细思考进度资料来源:OpenAI,国信证券经济研究所整理图8:o1长时间思考将显示进度资料来源:OpenAI,国信证券经济研究所整理 o
13、1 pro拥有更强的推理能力在示例中,OpenAI的研究员要求o1找到一种符合六个标准的特定蛋白质。这个问题的挑战在于,需要模型回忆起相当专业的化学领域知识,而对于任何给定的标准,可能会有数十种蛋白质符合该标准。所以模型必须全面考虑所有候选者,然后检查它们是否符合所有标准。o1-preview在此问题经常出错,而示例中o1 pro仅使用53秒便准确回答了相关问题,并可查看详细的思考过程。在思考困难问题时,目前o1模型的思考时间可达几分钟,因此OpenAI为模型添加了思考进度条,以直观展示目前模型的进程。DAY1:完整版o1发布请务必阅读正文之后的免责声明及其项下所有内容 什么是强化微调?强化微
14、调可让开发者使用强化学习针对具体任务对模型进行进一步微调,并根据提供的参考答案对模型的响应进行评分具体来说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。当模型发现问题时,要为它提供思考问题的空间,然后再对模型给出的响应进行打分。之后,利用强化学习的力量,可以强化模型得到正确答案的思维方式并抑制导向错误答案的思维方式。强化微调的优势?快速高效:相比于传统技术,强化微调技术更高效,不需要大规模的数据集支持。使用灵活:用户可根据需求即时调整模型,使模型更加符合特定场景需求。应用广泛:强化微调技术可以推动客服、教育、创意、研究等各个领域的应用。图10:OpenAI公布强
15、化微调技术DAY2:强化微调技术资料来源:OpenAI官方推特,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容 强化微调后在特定领域性能明显提升在官方演示里,OpenAI设置了一个实验:在给定症状列表的情况下,用模型预测可能导致罕见遗传疾病的基因,并让模型解释为什么选这些基因。实验人员使用三种模型进行对比:o1 mini、o1完整版、o1 mini强化微调版。对于o1 mini强化微调版,实验人员汇集了大约1100个病例报告作为训练和验证的数据集,在使用训练数据集对模型进行训练后,上传验证数据集对模型推理能力进行反复测试和调整,同时保证验证数据集和训练数据集之间的正确基因没
16、有重叠,以防模型作弊。评估结果时,实验人员设置了三项指标:1)模型一次答对的概率;2)模型前五次预测中有正确答案的概率;3)模型预测中有正确答案的概率。结果显示,经过强化微调的o1 mini在一次答对的准确率上跃升180%达到了31%,各方面全面超越了o1。强化微调技术将使开发者能够通过更快、成本更低的o1 mini模型获得超越o1的专业性能,将极大促进AI在各领域的应用。图11:强化微调后o1 mini模型超越o1资料来源:OpenAI,国信证券经济研究所整理图12:强化微调后o1 mini性能评测资料来源:OpenAI,国信证券经济研究所整理DAY2:强化微调技术请务必阅读正文之后的免责声
17、明及其项下所有内容图13:用户可通过故事板工具直接描述生成相应视频DAY3:视频大模型Sora发布 正式发布视频大模型Sora文本/图像生成视频:Sora用户可以使用文本、图像来提示Sora生成相关视频时间线编辑:全新推出的故事板工具让用户可以精准地指定每个帧的输入和生成视频的内容,并轻松进行视频剪辑,用户指令越少,Sora会尝试填充更多细节,用户指令越详细,Sora会尝试遵循要求方向生成视频。用户可在Sora中保存自己喜欢的风格,并在后续视频生成任务中重复调用。高分辨率、多种格式支持:Sora可以生成480p-1080p分辨率、5-20秒、宽屏、竖屏或方形的视频。并且用户可以利用资源进行扩展
18、、remix(用户只需描述对视频的更改,Sora将自行完成)和融合。对于同一指示,Sora可生成多个不同视频方向的变体,供用户选择。资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容 多种工具支持Sora1)Remix:使用Remix替换、删除或重新构想视频中的元素;2)Re-cut:找到并提取最佳帧或视频段落,然后向任一方向延伸它们以完成特定场景,例如可对之前生成的视频进行裁剪,要求Sora生成全新开头或结尾;3)Loop:使用Loop剪辑并创建无限重复的视频,例如:用户喜欢灯塔视频,可使用Loop工具,Sora将自动生成内容将重复视频的开头和结尾连接
19、,生成可重复视频;4)Blend:将两个视频合并为一个视频,给Sora两个视频场景,Sora会将其中元素合并生成全新视频,用户可用指令提示Sora两个视频的合并方向;5)Style presets:使用Presets创建和分享自己的视频风格。资料来源:OpenAI,国信证券经济研究所整理图14:Sora定价 Sora定价Sora目前已在欧洲和英国以外的其他地区上线,Plus用户可获得一个月生成50个优先视频的权限,Pro用户可获得无限生成权限,以及500次优先生成权限。DAY3:视频大模型Sora发布请务必阅读正文之后的免责声明及其项下所有内容图15:Canvas工具目前已被整合进ChatGP
20、T中DAY4:Canvas协作平台发布 正式发布Canvas协作平台Canvas全面开放,已被整合进ChatGPT中;提升了代码功能,用户可以直接在Canvas上运行Python代码,并可直观看到代码结果输出;Canvas目前可被CustomGPT调用资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY4:Canvas协作平台发布 Canvas主要功能用户编辑文字:在使用Canvas工具后,交互页面将被分为两部分,左侧为与模型的对话,右侧为用户可直接编辑的文档,用户可直接在Canvas工具中删除、添加、修改ChatGPT回复的内容,以及进行加粗等格式
21、调整。不论是写信、写公文还是论文,这种新生成模式都可以大幅提升效率。同时OpenAI在Canvas工具右下角集成了部分快捷工具,用户只需点击即可实现包括询问模型反馈(Suggest edits)、文档长度调整(Adjust the length)、语言风格转化(Reading level)、文档润色(Add final polish)、添加表情(Add emojis)这些用户在处理文档时的常用功能。审稿:很多人使用ChatGPT帮助写作,但以前一问一答的形式非常繁琐,现在用户只需要把文章复制粘贴到ChatGPT的文本框中,通过文本输入让其给出修改建议,大模型给出的建议会以逐条批注的形式出现。用
22、户可在页面中对应位置看到ChatGPT给出的修改建议,并决定是否根据批注进行润色,之后关闭建议,或者直接选择Apply,让ChatGPT自行对内容进行修改。这使用户可以更直观的使用模型帮助自己审阅文章,并给出建议。资料来源:OpenAI,国信证券经济研究所整理图16:Canvas可快捷实现对模型回复的修改图17:Canvas可让用户更直观的看到ChatGPT对文章的修改建议资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY4:Canvas协作平台发布 Canvas主要功能编程:Canvas可以直接识别代码,并转变成为代码编辑模式。用户还可以在Can
23、vas上直接运行测试,以及错误识别和修改错误的建议。用户想要Debug时,可直接代码复制到ChatGPT上,即可让模型解释问题,给出正确代码的示例。如果在ChatGPT上点运行代码出错了,还可以使用AI给出的comment,与文本编辑内容类似,如果用户点击Fix Bug按钮,ChatGPT可自行对Bug进行修改,修改的位置可以高亮显示。引入CustomGPT:CustomGPT允许用户根据自己的需求和偏好定制GPT模型,通过给予GPT自定义指令以及自定义上下文等方法,使其更好地适应特定的应用场景或任务,并支持将模型与他人分享,使用GPT Store平台,用户可快速浏览、购买、下载和使用由Ope
24、nAI或第三方开发的定制GPT模型和插件。资料来源:OpenAI,国信证券经济研究所整理图17:Canvas可直接进行代码修改、运行等功能图18:CustomGPT可对模型进行自定义资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY5:Chatgpt进一步集成到Apple生态系统 Day5,苹果公司发布了其iPhone、iPad和Mac软件的更新(iOS和iPadOS 18.2),将ChatGPT进一步嵌入苹果系统当中,此次更新包括在Siri、写作工具和视觉智能中与ChatGPT的集成。据彭博社消息,ChatGPT在回答问题时的准确率比Siri高出
25、25%,且能回答30%更多的问题,苹果选择与OpenAI合作,将ChatGPT整合进iOS、iPadOS和macOS系统将极大提升其智能体验。目前,在iPhone、Mac、iPad等设备中,新版的苹果智能已经包含ChatGPT拓展功能,用户可在设置中自行选择是否调用ChatGPT。资料来源:OpenAI,国信证券经济研究所整理图19:ChatGPT已集成在Apple intelligence中请务必阅读正文之后的免责声明及其项下所有内容DAY6:增强版高级语音模式发布 增强版高级语音模式增强版高级语言模式具备屏幕共享和视觉功能,ChatGPT可以协助理解手机摄像头以及屏幕上所查看的内容。这些功
26、能在高级语音模式已有的基础上进一步增强,目前ChatGPT支持像人类的自然对话对话,同时对话可以被中断,具有多轮交互,并理解非线性的思维过程。实时视频通话:用户现在可以使用视频与ChatGPT进行交流,这使得沟通更加直观和生动。在官方展示案例中,OpenAI的工作人员通过ChatGPT的视频功能现场获取了如何制作一杯咖啡的指引。当演示者按照步骤操作时,ChatGPT会同时口头提供见解和指导。实时屏幕共享:用户可以将自己的屏幕内容分享给ChatGPT,以获取ChatGPT提供的技术支持或协助处理屏幕内容。在官方演示中,OpenAI的工作人员通过与ChatGPT共享屏幕,获得了关于如何回复其消息的
27、建议。资料来源:OpenAI,国信证券经济研究所整理图20:增强版高级语音功能支持视频交互图21:增强版高级语音功能支持屏幕共享资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY7:Projects对话管理工具上 Projects in ChatGPT可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,不仅支持Canvas界面,还能通过ChatGPT Search轻松接入互联网资源。分项目管理ChatGPT:Projects赋予用户将聊天与数据分组的能力,从而使用户能够依据自身需求更加便捷地定制ChatGPT。在创建Project
28、s的过程中,用户可以在界面内设定标题、自定义文件夹的颜色、上传与项目相关的文件,并编写说明来指导ChatGPT如何最高效地协助用户完成项目。在项目内部,用户可以即刻开启聊天,并通过侧边栏轻松地将过往的聊天记录添加到项目中,同样支持利用上下文信息来回答问题。聊天内容能够保存在项目中,便于支持用户稍后继续对话,并清楚地知道在哪里查找所需内容。资料来源:OpenAI,国信证券经济研究所整理图22:用户可根据自身需求创建项目图23:Projects自动启动Canvas并生成邮件资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY8:ChatGPT搜索功能更新
29、 搜索功能全新升级全方位体验升级:用户现在可以直接访问嵌入式YouTube视频、图片、电影资源,还能便捷地使用商业地图和餐厅导航。在官方演示中,演示者只需与ChatGPT自然对话,ChatGPT便可自行判断是否需要调用ChatGPT search,同时,用户也可以选择开启ChatGPT search功能。ChatGPT search将自动根据要求总结网页内容,并允许用户追溯网站来源。移动设备的优化体验:针对移动设备,OpenAI根据用户反馈优化了聊天搜索的体验。在官方演示中,演示者搜索了Mission附近的墨西哥餐厅,ChatGPT search可自行进行筛选,并展示了路线、网站、电话和营业时
30、间等详细信息。用户可进一步提问哪些餐厅支持室外用餐,ChatGPT search可自行进行下一步筛选,并列示符合要求的选项,用户可点击商家地址,即可调用苹果地图规划路线。在Advance Voice模式中集成:可以在高级语音模式中使用搜索,通过语音命令访问最新的网络信息,增强了ChatGPT的交互性和便利性。在官方演示中,演示者通过语音向ChatGPT提问在12月23日苏黎世有什么活动,ChatGPT可在搜索后语音进行回复,并支持用户对感兴趣的活动进一步提问,如举办时间、地点、活动举办当天的天气等。资料来源:OpenAI,国信证券经济研究所整理图24:用户可在ChatGPT网站中直接播放来自Y
31、ouTube的视频图25:通过ChatGPT search调用苹果地图资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY9:o1正式版API全面上线 o1 API全面开放Function calling:允许开发者将外部API和数据库连接到o1模型;Structured Outputs:确保模型输出遵循开发者定义的JSON模式,使解析和使用模型输出更加容易;Developer messages:为模型指定指令,例如定义语气、风格及其他行为;Vision capabilities:支持对图像进行推理,解锁科学、制造或编码等领域中更多依赖视觉输入的应用
32、;Lower latency:o1在每个请求中平均使用比o1-preview少用60%的推理tokens;Reasoning_effort:一个全新参数,允许开发者控制模型在回答前思考的时间长度。资料来源:OpenAI,国信证券经济研究所整理图26:开发者可调用o1 API寻找文档中的错误图27:模型通过自定义格式输出信息资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY9:o1正式版API全面上线 o1 在各领域性能显著提升现场展示了对o1 API调用的测试结果,o1在函数调用、内部结构化输出、数学、编程等领域均达到了目前所有模型的最高准确度。在
33、数学领域,OpenAI测试了经过自定义输出结果的o1模型(o1 with Structured Outputs),结果显示其仍能保持极高的准确度,因此开发者对模型进行自定义调整后,模型仍能够保持其性能。资料来源:OpenAI,国信证券经济研究所整理图28:o1在函数调用领域准确度明显高于GPT4o图29:o1在内部结构化输出领域准确度明显高于GPT4o 图30:o1在编程领域准确度明显高于GPT4o图31:o1在数学试题场景准确度明显高于GPT4o请务必阅读正文之后的免责声明及其项下所有内容DAY9:o1正式版API全面上线 实时API集成WebRTC(网页实时通信)实时API现在支持WebR
34、TC,这将简化实时语音体验的构建,使得在各类平台(包括基于浏览器的应用、移动客户端、物联网设备或直接的服务器到服务器部署)上构建和扩展实时语音产品更加容易。通过WebRTC,现在只需几行Javascript代码,开发者就能为应用添加实时功能。WebRTC提供了许多优势,例如更好的网络适应性、回声消除和更简单的代码实现。以及将GPT-4o音频价格降低 60%,同时将Realtime API测试版中引入GPT-4o mini。在官方演示中,演示者只需极短的代码,就可以在网页端构建一个语音助手。同时,仅需将网页端与带有音频交互功能的玩具连接,就可实现玩具的语音交互功能。演示者提到,后续开发者可自行将
35、Realtime交互的应用场景扩展到可穿戴设备、摄影等领域。资料来源:OpenAI,国信证券经济研究所整理图32:开发者只需几行代码就可以调用Realtime API图33:开发者只需几行代码就可以构建网页端语音助手资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容图34:偏好微调允许模型学习更受欢迎的响应DAY9:o1正式版API全面上线 新微调方法Preference Fine-Tuning偏好微调允许开发者通过提供成对的响应来训练模型,其中一个响应比另一个响应更受欢迎,模型可自行学习,并减少不受欢迎的输出结果。与监督微调(提供确切的输入和输出)不同
36、,偏好微调侧重于优化模型以捕获用户偏好中的细微差别。通过微调,开发者可以利用自己的数据集对模型进行训练,从而提高模型在特定场景下的性能和准确性。在官方演示中,演示者提到Rogo AI正通过偏好微调在构建一款面向金融分析师的AI助手,偏好微调使模型能够更准确的响应准确性从75%提升至80%以上,而监督微调则无法达到准确性提升的效果。资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY10:ChatGPT通话访问模式 通话访问模式ChatGPT通话开放:目前美国用户可通过电话与ChatGPT沟通,具体号码为:1-800-242-8478,用户可将其添加为
37、手机联系人,通话会被审查以确保安全。在官方演示中,演示者通过直接拨入电话的方式接入ChatGPT,并提问在旧金山的280号洲际公路上看到的圆顶房子是什么,ChatGPT准确回复房子的名字,并进行了简短介绍,同时支持用户对问题进行进一步沟通。用户可以通过任何设备拨号连接ChatGPT,包括非智能手机、固定电话等,这意味着老年人也可以通过其老年机接入ChatGPT,并获得相应回复。WhatsApp聊天:全球范围内,用户可在WhatsApp上与ChatGPT聊天,用户可以像与联系人中的任何人一样,通过文本输入问题,即可获得基于4o-mini模型生成的回复。在官方演示中,演示者通过WhatsApp询问
38、ChatGPT意面香蒜酱的制作方法,ChatGPT可生成详细的制作方法,包括原材料、制作步骤等。同时,ChatGPT能根据用户的不同要求(如素食、特定饮食偏好等)更新食谱,并回复相应配菜建议。资料来源:OpenAI,国信证券经济研究所整理图35:使用者可将ChatGPT添加到联系人,并电话接入图36:用户可在WhatsApp中与ChatGPT直接聊天资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY11:桌面应用新功能 MacOS桌面应用更新:轻量级且资源占用少,拥有单独窗口,应用时无需在不同的应用程序、窗口之间切换。用户可通过快捷键快速调用Cha
39、tGPT,同时在对话窗口下方,用户可点击使用应用程序的选项,ChatGPT可自动提取已完成的工作进度,用户无需上传任何信息即可与ChatGPT进行交互。在官方演示中,演示者通过ChatGPT与正在运行的应用程序Warp进行协同,用户可直接向ChatGPT提问编写分析每日指令数量的代码,ChatGPT编写完成后,只需粘贴至相应应用中即可。同时,支持用户在原有生成数据的基础上进一步下达指令,例如生成可视化图表等。资料来源:OpenAI,国信证券经济研究所整理图37:使用者可通过ChatGPT与正在运行的应用协同图38:ChatGPT与Warp协同资料来源:OpenAI,国信证券经济研究所整理请务必
40、阅读正文之后的免责声明及其项下所有内容DAY12:全新o3模型亮相资料来源:OpenAI,国信证券经济研究所整理图39:o3在编程方面性能图40:o3在数学方面性能 强大的数学和编程能力编程能力:o3在编程方面相较o1大幅提升。在SWE-bench Verified基准测试中,o3的准确率达到了71.7%,比前辈o1高出20%以上。这意味着,o3在编写高质量代码方面,已经超过了大多数软件工程师。数学能力:在AIEM 2024,o3几乎拿到了满分,这是AI在AIEM数学竞赛中取得的最好成绩。此外,在GPQA Diamond博士级科学考试中,o3的准确率达到了87.7%,比o1高出近10%。这表明
41、,o3在处理复杂数学问题时,已经达到了顶尖水平。资料来源:OpenAI,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容DAY12:全新o3模型亮相资料来源:OpenAI,国信证券经济研究所整理图41:o3在ARC-AGI测试表现 推理能力里程碑式突破o3在ARC-AGI基准测试中的表现尤为突出,达到了87.5%的准确率,远超人类的85%阈值。ARC-AGI基准测试旨在评估AI系统的抽象和推理能力,要求AI识别模式并解决新问题。o3实现了AI领域第一次超越人类的成绩,完成了里程碑式的突破。请务必阅读正文之后的免责声明及其项下所有内容DAY12:全新o3模型亮相资料来源:Ope
42、nAI,国信证券经济研究所整理图42:o3 mini在数学方面性能 o3 mini模型o3 Mini 是 o3 系列中的高效推理模型,适用于任何需要数学和编码能力的人。由于成本低,o3 Mini 可能会在全球范围内开放使用。o3 Mini 支持低中高三种不同的推理时间选项,可以根据自己的使用情况自由调整模型的推理时间。编程能力:支持自适应推理时间,低中位数推理时间下代码性能优于 o1 Mini,在速度和成本方面出色。数学能力:在 AIME 2024测试中,低推理选项与 o1 Mini 和 o3 Mini 性能相当,中位数推理时间性能更好,高推理可进一步提升;延迟大幅减少,支持函数调用等功能,性
43、能优于多数模型。请务必阅读正文之后的免责声明及其项下所有内容DAY12:全新o3模型亮相 安全性OpenAI为o3引入了协商对齐(deliberative alignment)的安全评估方法。这种方法可以让模型在回答问题前明确回忆安全规范并准确执行推理,从而确保o3的行为符合OpenAI的安全政策,使其保持良好的行为规范。发布计划目前,o3还处于早期访问阶段,仅对部分安全研究人员开放。OpenAI计划在2024年1月底推出o3-mini请务必阅读正文之后的免责声明及其项下所有内容目录目录Openai 12天发布会0101风险提示 0202请务必阅读正文之后的免责声明及其项下所有内容风险提示 A
44、I应用落地不及预期、行业竞争加剧、大模型研发不及预期。请务必阅读正文之后的免责声明及其项下所有内容免责声明免责声明分析师承诺分析师承诺作者保证报告所采用的数据均来自合规渠道;分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求独立、客观、公正,结论不受任何第三方的授意或影响;作者在过去、现在或未来未就其研究报告所提供的具体建议或所表述的意见直接或间接收取任何报酬,特此声明。重要声明重要声明本报告由国信证券股份有限公司(已具备中国证监会许可的证券投资咨询业务资格)制作;报告版权归国信证券股份有限公司(以下简称“我公司”)所有。,本公司不会因接收人收到本报告而视其为客户。未经书面许可,任何机构
45、和个人不得以任何形式使用、复制或传播。任何有关本报告的摘要或节选都不代表本报告正式完整的观点,一切须以我公司向客户发布的本报告完整版本为准。本报告基于已公开的资料或信息撰写,但我公司不保证该资料及信息的完整性、准确性。本报告所载的信息、资料、建议及推测仅反映我公司于本报告公开发布当日的判断,在不同时期,我公司可能撰写并发布与本报告所载资料、建议及推测不一致的报告。我公司不保证本报告所含信息及资料处于最新状态;我公司可能随时补充、更新和修订有关信息及资料,投资者应当自行关注相关更新和修订内容。我公司或关联机构可能会持有本报告中所提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资
46、银行、财务顾问或金融产品等相关服务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中意见或建议不一致的投资决策。本报告仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本报告中的信息和意见均不构成对任何个人的投资建议。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。投资者应结合自己的投资目标和财务状况自行判断是否采用本报告所载内容和信息并自行承担风险,我公司及雇员对投资者使用本报告及其内容而造成的一切后果不承担任何法律责任。证券投资咨询业务的说明证券投资咨询业务的说明本公司具备中国证监会核准的证券投资咨询业务资格。证券投资
47、咨询,是指从事证券投资咨询业务的机构及其投资咨询人员以下列形式为证券投资人或者客户提供证券投资分析、预测或者建议等直接或者间接有偿咨询服务的活动:接受投资人或者客户委托,提供证券投资咨询服务;举办有关证券投资咨询的讲座、报告会、分析会等;在报刊上发表证券投资咨询的文章、评论、报告,以及通过电台、电视台等公众传播媒体提供证券投资咨询服务;通过电话、传真、电脑网络等电信设备系统,提供证券投资咨询服务;中国证监会认定的其他形式。发布证券研究报告是证券投资咨询业务的一种基本形式,指证券公司、证券投资咨询机构对证券及证券相关产品的价值、市场走势或者相关影响因素进行分析,形成证券估值、投资评级等投资分析意
48、见,制作证券研究报告,并向客户发布的行为。国信证券投资评级国信证券投资评级投资评级标准投资评级标准类别类别级别级别说明说明报告中投资建议所涉及的评级(如有)分为股票评级和行业评级(另有说明的除外)。评级标准为报告发布日后6到12个月内的相对市场表现,也即报告发布日后的6到12个月内公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。A股市场以沪深300指数(000300.SH)作为基准;新三板市场以三板成指(899001.CSI)为基准;香港市场以恒生指数(HSI.HI)作为基准;美国市场以标普500指数(SPX.GI)或纳斯达克指数(IXIC.GI)为基准。股票投资评级股票
49、投资评级优于大市股价表现优于市场代表性指数10%以上中性股价表现介于市场代表性指数10%之间弱于大市股价表现弱于市场代表性指数10%以上无评级股价与市场代表性指数相比无明确观点行业投资评级行业投资评级优于大市行业指数表现优于市场代表性指数10%以上中性行业指数表现介于市场代表性指数10%之间弱于大市行业指数表现弱于市场代表性指数10%以上请务必阅读正文之后的免责声明及其项下所有内容国信证券经济研究所国信证券经济研究所深圳深圳深圳市福田区福华一路125号国信金融大厦36层邮编:518046 总机:0755-82130833上海上海上海浦东民生路1199弄证大五道口广场1号楼12楼邮编:200135北京北京北京西城区金融大街兴盛街6号国信证券9层邮编:100032