
一. 前言
2022 年被认为是人工智能生成内容(AIGC)元年。作为 AIGC 在自然语言领域的代表,ChatGPT 在 2022 年年底一经推出,就掀起了一场可能涉及所有人和所有行业的“大火”,2023 年 3 月 GPT-4 的发布则进一步推动了“态势升级”。由 ChatGPT/GPT-4 引发的全球关注,令许多人回忆起 2016 年 AlphaGo战胜人类围棋世界冠军的时刻。如果说 AlphaGo 代表了 AI 在专业领域战胜人类的起点,ChatGPT/GPT-4 似乎迈出了通用人工智能的第一步。这是第三次 AI 浪潮以来所有积累产生的硕果,AI 技术到了一个即将大规模产业化的临界点。ChatGPT 将单调呆板的人机通信演进到前所未有的自然、高效、有创造力的人机协作,代表了生产力的提升。ChatGPT 有多重要?埃隆·马斯克评价:“好得吓人,我们离危险的强人工智能不远了”。黄仁勋评价:“这是 AI 界的iPhone 时刻”。比尔.盖茨表示“和个人电脑和互联网的出现一样重要。是当前最重要的创新,将改变世界”。在 ChatGPT 的基础上,GPT-4 进一步在各种专业和学术基准测试中表现出“人类水平”的性能,在事实性、可引导性和可控制方面取得了“史上最佳结果”。当然,GPT-4在不是无所不能的,仍具有与早期GPT 模型相似的局限性,如:犯常识性的错误、缺乏对新世界知识的了解、存在社会偏见、产生幻觉、推理错误等。但是我们看到其技术背后却具有一直优化、学习和进步的能力。在 ChatGPT/GPT-4 席卷全球的热潮中,人们已经深刻认识到人工智能作为经济社会发展中一项变革性技术与关键性力量,将为全球产业带来的巨大飞跃和突破式发展,深刻影响未来世界竞争格局。通信行业作为信息通信基础设施的建设者和运营者,既为 AI 的发展提供基础设施支撑,又是 AI 应用落地的领先者AIGC(GPT-4)如何赋能通信行业应用,通信行业如何落地 AIGC,这是通信业者必须要思考和回答的问题。
本白皮书通过对 AIGC 的典型代表 GPT-4 的研究,以场景化的形式对 GPT-4 如何赋能通信行业进行了分析,并针对通信行业如何构建行业 GPT 进行了初步探讨和实践。期待行业同仁围绕通信和人工智能协同创新,构建开放共享的创新生态,促进人工智能与通信产业的深度融合,加速构建下一代信息基础设施,助力经济社会数字化转型。
二. GPT-4 研究
2.1 AIGC 与 GPT-4
AIGC 是继专业生成内容(PGC)和用户生成内容(UGC)之后,利用人工智能技术自动生成内容的新型生产方式。AIGC 根据其内容模态不同可分为文本、视频、图像,音频与跨模态生成。文本方面,例如文本创作、代码生成、问答对话等;视频方面,例如视频画质增强、视频内容创作、视频风格迁移等;图像方面,例如图片编辑、图片生成、3D 图像生成等;音频方面,例如文本合成语音、语音克隆、音乐生成等;跨模态方面,如文字生成图片、文字合成视频、图像描述等,而且在不同内容模态的技术应用场景也有着各自的细分品类。ChatGPT 是 AIGC 发展的第一个丰碑。ChatGPT 是由人工智能研究公司OpenAI 在 2022 年 11 月发布的一个对话型大语言模型,是人工智能技术驱动的自然语言处理工具和应用。ChatGPT 的全称是 Chat Generative Pre-trainedTransformer,顾名思义,就是以 Transformer 为基础架构,采用预训练和生成式方式构建的面向对话的大语言模型,是 AIGC 在文本方面的典型代表。
ChatGPT 的主要用途是生成对话,它能够通过学习和理解人类的语言来进行对话,根据聊天的上下文进行自然、流畅的互动,还能完成邮件撰写、文案编写、文本翻译、代码生成等任务。ChatGPT 提供了前所未有的高效、自然的人机交互体验和极富创造力的内容生成能力,成为了 AI 时代的第一个“杀手级”应用。以 ChatGPT 为代表的生成式 AI 工具将使机器可以大规模参与知识类和创造性工作,极大提升生产力,涉及数十亿人方方面面的工作,可能产生数万亿美元的经济价值。ChatGPT 覆盖了 NLP 所有领域,其所代表的大规模预训练语言模型(LLM)或基础模型已成为工业界和学术界最为关注的研究热点,并引领近期自然语言处理(NLP)乃至人工智能领域的研究范式的转变,对人工智能的技术发展可能产生重大影响。相距 ChatGPT 发布仅仅 4 个月OpenAI 在 2023 年 3 月正式发布了多模态预训练大模型 GPT-4。GPT-4 支持图片和文本输入并生成文本输出,相比ChatGPT 增加了识图能力,并能够生成歌词、创意文本、学习用户的写作风格等,更具创造力和协作性。GPT-4 的输入限制提升至 2.5 万字,处理能力是ChatGPT 的八倍,可用于长篇内容创作、扩展对话以及文档搜索和分析等应用场景,并可以用所有流行的编程语言写代码。 GPT-4 的回答准确性大幅提高,性能优于现有的大型语言模型、以及当前最先进(SOTA,State Of The Arts)模型,虽然在许多现实场景中不太聪明,但在各种专业和学术基准上表现出了人类水平。
ChatGPT 存在一定局限,如逻辑处理能力不够强,对上下文的理解仍然有限,多轮对话可能失控,缺乏一些通识能力,可能会出现创造不存在的知识,或者主观猜测提问者的意图,对 2021 年后的世界和事件了解有限。GPT-4 相较于ChatGPT,不合规内容的响应请求降低了 82%,响应准确度提高了 40%,具备了更高的理解能力。但是 GPT-4 仍然具有与早期 GPT 模型相似的局限性,如:犯常识性的错误、缺乏对新世界知识的了解、存在社会偏见、产生幻觉、推理错误等。总的来说,ChatGPT 和 GPT-4 是 NLP 和人工智能领域划时代的标志,也昭示着人类向通用人工智能或强人工智能迈出了尝试性的一步。
GPT-4 基于 Transformer 架构演进发展,其发展历程如下:
l 2017 年 6 月,Google 发布论文《Attention is all you need》[1],首次提出 Transformer 模型,成为 GPT 发展的基础;2018 年 6 月,OpenAI 发布论文《Improving Language Understandingby Generative Pre-Training》[2](通过生成式预训练提升语言理解能力),
首次提出 GPT-1 模型 (Generative Pre-Training);
l 2019 年 2 月,OpenAI 发布论文《Language Models are UnsupervisedMultitask Learners》[3](语言模型应该是一个无监督多任务学习者),
提出 GPT-2 模型;
l 2020 年 5 月,OpenAI 发布论文《Language Models are Few-ShotLearners》[4](语言模型应是一个少量样本(few-shot)学习者),提出 GPT-3 模型;
l 2022 年 2 月底,OpenAI 发布论文《Training language models to followinstructions with human feedback》[5](使用人类反馈指令流来训练语言模型),公布 Instruction GPT 模型;
l 2022 年 11 月 30 日,OpenAI 推出 ChatGPT 模型并提供试用,自发布两个月内月活跃用户数已达 1 亿,成为史上用户数增长最快的消费者应用;
l OpenAI GPT-4 模型于 2023 年 3 月 14 日发布,并已在微软的新版搜索引擎必应(Bing)上运行
查看完整版请下载,整整131页



