课程简介
人工智能聊天机器人ChatGPT自2022年末爆火以来,在各领域获得了广泛运用,从未有一种产品,能像人工智能对话软件ChatGPT一样,在两个月的时间内,吸引了上亿的用户。
它所迅速引发的争议波及范围之广,也创造了一个纪录。一向AI技术领先的谷歌,也不得不跟随,推出ChatGPT的竞品。但是ChatGPT的缺点也比比皆是,没有行业数据的训练,有些答案不准确。没有实时性,ChatGPT 没有联网的能力,所有训练都是基于预先的数据集。这与企业做数据分析决策的及时性要求完全不符.....
本课程从基础知识开始讲起,逐步深入讲解如何利用ChatGPT来制作高质量的内容,学习如何在ChatGPT中设置对话场景,如何生成文本内容。本课程结合大量的实际案例,帮助学员更深入的了解学员ChatGPT带来的机遇与挑战。
课程收益
1. 了解ChatGPT模型的基础知识
2. 了解ChatGPT的发展现状、应用领域。
3. 了解ChatGPT的成功案例
4. 掌握如何使用ChatGPT进行数据分析和挖掘
受众人群
人工智能,大数据,架构相关人员,技术工程师、算法工程师,对ChatGPT感兴趣人员
课程周期
2天(12小时)
课程大纲
主题 | 内容 |
一、基础概述:ChatGPT原理与机制 | 1. ⼤语⾔模型:基于Transformer和预训练的GPT\Bert\XLNet 1.1. Transformer注意⼒机制的引⼊,基于成百上千亿海量数据的训练 2. 脱颖⽽出的ChatGPT:专家⽹络与⽤户反馈机制 2.1. 专家⽹络保障内容的可靠性,加⼊⽤户反馈机制RLHF实现内容的拟⼈化与多样化 3. 算⼒要求与成本:基础模型训练,数据采集、技术研发与迭代、服务部署与⾼并发访问 3.1. 基础模型训练:⽂本384块A100,400万美元的基础算⼒投⼊;加⼊多模态能⼒,成倍增加 3.2. 数据采集、技术研发与迭代:数以千亿计的数据采集、反爬⾍策略破解、数以千计的科学家/研发⼈员与专家,数千万⾄上亿美元的年投⼊ 3.3. 服务部署与⾼并发访问:百或千万级并发、服务器集群、分布式部署、负载均衡、指纹识别、⽹络安全与策略,⾄少1,000万美元/年 4. NeXT进化的⽅向:即将推出的GPT4 4.1. 增强Expert:确保内容的真实与可靠 4.2. 多模态能⼒:⽀持⽂本、⾳频、图像与视频等多种输⼊ 4.3. 增加参数:⽤较少样本执⾏更多任务 |
二、⽃⼒与⻆逐:那些争夺王座的玩家 | 1. 基础算法:OpenAI(GPT)、BigScience(BLOOM)… 1.1. Transfomer、预训练、DL、CNN相关技术开源、涉及论⽂公开 可查,不存在⽆法逾越的技术瓶颈,基础训练投⼊不⼤,且有开源框架 2. 搜索引擎:⾕歌(Bard)、微软(Bing)、百度(⽂⼼)、搜狗、360... 2.1. 作为信息搜索⼊⼝,拥有⼤量的⽤户基础,具有先天优势 3. 智能终端:Apple(Siri)、⼩⽶(⼩爱同学)、特斯拉(Autopilot)… 3.1. PC没落,⽤户⽇常使⽤的智能终端,相较基于硬件的软件应⽤,通过增强仿⼈交互能⼒,重定义⼈与设备的关系和互动⽅式,更⽅便和直接 4. 资讯平台:字节跳动(今⽇头条)… 4.1. 基于个性化推荐算法向⽤户提供资讯,在阅读的间隙,即可辅助查找信息和帮助 5. 企业服务:海康威视(⾦融)、开普云(政务)… 5.1. 掌握⾏业落地的关键数据、渠道和客户,⼀般公司难以介⼊,主动吸纳提⾼服务附加值 6. ⼈⼯智能:阿⾥云(M6)、腾讯云、京东数科、商汤、⼩冰、讯⻜、拓尔思、思必驰... 6.1. 作为⼈⼯智能的基础设施,拥有庞⼤的B端⽤户群体,通过赋能⽣态建⽴优势 |
三、信息的真实与可靠:极易被忽视的陷阱 | 1. ⽤户的辨识能⼒:绝⼤部分⽤户缺乏⾜够的理性和辨识能⼒,先天的懒惰不去做甄别 1.1. 当前使⽤ChatGPT的⽤户,依旧是以科技、投资、⾦融等领域的精英⼈⼠为主,⾜够理性、甄别能⼒强;但全⾯开放后,绝⼤部分⽤户不具备 2. 内容真实与可靠⽆法保障:部分内容失真、缺乏可靠性,AI可被⽤户“诱导” 2.1. ⽆法保障真实与可靠性的内容,会对⽤户造成舞蹈;且怀有“恶意”的⽤户能“诱导”AI作出有违公众认知的答复 3. AIGC埋下的陷阱:从信息聚合到信息加⼯导致的责任主体悄然转移 3.1. 从聚合、罗列第三⽅信息,到对这些信息进⾏加⼯(AIGC),以“唯⼀答案”的⽅式提供给⽤户——那么谁提供信息与服务,谁就要承担责任 4. 规避⻛险的建议:内容的⽣产和再组织 4.1. AIGC许可的范围:不是所有的信息或内容都适合AIGC 4.2. 交互的⽅式:不要试图通过“唯⼀答案”的形式提供给有需求的⽤户 4.3. 公众认可的信息源:增加可靠信息源的权重 4.4. ⼈类反馈机制:需要适度优化,不是所有的内容都适合AI学习和模仿 |
四、仿⼈逻辑与交互:商业化落地的难题 | 1. ⾯对的⽤户与偏好:⽼龄化、科技边缘化,从键⿏触控到语⾳ 1.1. ⽼龄化、科技边缘化的⼈群,不会使⽤智能设备或者⽂本输⼊;键⿏触控为代表的图形界⾯操作系统已经不适⽤当前的需求 2. 语⾳识别(ASR):语⾳转⽂本的准确性,零答⾮所问与对答如流的关键 2.1. ⾯对⾯聊天是⼈类千百年来最为习惯且⾃然的互动⽅式;智能语⾳识别ASR 90%的识别准确率⽆法满⾜落地场景下零答⾮所问且对答如流的要求 3. 多模态交互:构建完善的听说看触能⼒,回归⾃然的⾯对⾯聊天 3.1. 需要与硬件/传感器等物联⽹终端深度结合,使AI具备听说看触的能⼒,能够以⾯对⾯聊天的⽅式,⾃然地与⼈对话、沟通与互动 4. 仿⼈习惯与逻辑(STEP):⼀步到位,还是逐步递进 4.1. ⼤部分时候,很多⽤户并不知道⾃⼰要什么,⼀步到位给出答案不符合⼈们⽇常交流的逻辑和习惯;逐步递进的过程同样重要 5. 智能流程⾃动化(iRPA):从交流到办事,挖掘深度应⽤的价值 5.1. 需要深度结合智能流程⾃动化,让A不仅会说话还能办事,在交流的过程中,⾼度智能化地辅助⽤户完成⽇常⽣活和⼯作中的事宜 |
五、技术与壁垒:决定胜负的关键与弯道超⻋的可能性 | 1. ChatGPT算法模型:GPT/Bert/XLNet都是预训练,技术不存在⽆法逾越的瓶颈 1.1. 单纯模型训练依赖的算⼒,模型使⽤的算法原理、论⽂及数据都可以公开获取 2. 与⾏业深度结合应⽤:创造的价值决定可以获得多少客户、是否忠诚 ✔ 2.1. 与⾏业深度结合,交流与办事⼀体,降本增效的同时,为⽤户创造更多的价值 3. ⽤户、渠道与伙伴:构建⽣态,能否快速占领市场 ✔ 3.1. 完善的⽣态体系,决定了能否快速占领市场,以及渗透的程度 4. 技术产品化:商业模式,批量复制,边际成本与收益决定想象空间 ✔ 4.1. 需要既懂技术、⽤户,⼜深刻理解业务的PM,将相关的技术产品化,通过可批量复制来实现期望的商业价值 5. 弯道超⻋的可能性:ChatGPT像英特尔,将之发扬光⼤的是Microsoft和Apple 5.1. 沟通是⼈类基本的诉求,在沟通、交流的基础上,能够⾼效辅助⽤户达成期望更重要 |
六、应⽤与衍⽣:值得关注的投资机会、赛道与商业模式 | 1. 基础算法:ChatGPT、百度⽂⼼、阿⾥云⼩蜜、⼩冰、BigScience的BLOOM 1.1. ⾯向企业与开发者的API/SDK;⾯向个⼈⽤户的订阅服务(需要进⼀步加强⼯具化) 2. 算⼒与服务:NVIDIA/寒武纪/壁仞,百度智能云/阿⾥云/华为云,平⾏云(渲染) 2.1. 提供基础算⼒的芯⽚/显卡;⽀持模型与应⽤部署和访问的云服务;AIGC的深度需求 3. 技术应⽤:搜索引擎、操作系统、个⼈助⼿与企业服务 3.1. 提⾼信息获取的效率、增强沉浸式交互能⼒、陪伴和解放个⼈⽤户、⾏业深度应⽤ 4. 交互载体:智能设备与终端(AIoT,物联⽹终端)与软件应⽤(APP) 4.1. 以类ChatGPT为⼤脑,增强听说看触的多模态能⼒,与⽤户直接交互的各种软硬件载体 5. ⽣成式AI:⽂本、⾳频、图像到视频,TTS语⾳、AI绘画、虚拟数字⼈… 5.1. 提⾼各种内容⽣产的效率、提⾼互动的⽤户体验 |
七、实践与案例:⽆处不在的智能化 | 1. ⾦融科技:如何破解资产⼈⼒密集型的银⾏与⽇渐萎缩的柜台业务(⼯⾏、交⾏) 1.1. 拟态⽣命软件;未来智能银⾏;⽆⼈数字⾦融舱 2. 数字政务:从政策到服务,“以⼈为本,执政为⺠”理念的贯彻(番禺、江⻄) 2.1. 元宇宙政府⼤厅;智能社区/党建;镜像城市;数字沙盘 3. 智能汽⻋:三位⼀体,⽆接触智能汽⻋新零售⽣态的构建(⻓城汽⻋) 3.1. 智能驾驶系统;⽆⼈智能化4S⻔店;APP/⼩程序业务前置化 4. ⼯业制造:场景与数据模拟,研发的加速器(宝⻢数字⼯⼚) 4.1. 数字孪⽣;道路⾏驶与碰撞试验;协同设计 5. 上市公司调研:数字场景、沉浸式交互、可视化数据(财报与经营披露) |