10个快问快答深度解析ChatGPT

ChatGPT是当前最为火爆的AI技术,可类比于人工智能领域的iPhone,各行各业也都在快速拥抱这项技术革命,但是你真的了解ChatGPT了吗?

本文将通过10个快问快答,深度解析什么是ChatGPT?背后的技术原理是什么?可以帮我们做好哪些事情?还有哪些局限性?希望本文能帮助你在繁杂的舆论中不迷失,并开始真正利用ChatGPT来提高工作和学习效率!相信看完会有新收获!

Q1: 谁创造了ChatGPT?

ChatGPT是由OpenAI在2022年11月推出的一款AI产品。OpenAI是一家美国人工智能研究实验室,其使命是构建通用人工智能,并造福全人类。Altman是公司的CEO,微软和马斯克是这家公司的投资者。正因为其使命是造福全人类,所以注重AI平等,例如开放的ChatGPT接口即使你再有钱也有速率限制,以保证普通人也能公平的使用到。

关于openai

Q2: ChatGPT能做什么?

可以将ChatGPT类比一个“人”,任何问题都可以试着找ChatGPT给个参考回答。具体而言:可以帮助你进行内容创作(写报告,写作文,写诗,写歌等); 帮助你翻译或者润色论文;帮助你准备考试(批改你写的作文,生成相关习题等);帮助你编写代码/调试程序;帮助你整理会议纪要,制作PPT等等。ChatGPT能做的事情,取决于你如何向ChatGPT进行提问,这里的提问也称之为提示词(prompt)。所以如果对ChatGPT的结果不满意,可以尝试换个提示词写法,也可以先Google对于某个任务更好的提示词应该是什么。

chatgpt

Q3: ChatGPT是常说的神经网络吗?

是的。ChatGPT 是一种 GPT (Generative Pre-trained Transformer) 生成式预训练神经网络。该神经网络可以根据输入的文本预测下一个词可能是什么。ChatGPT与其他 GPT 模型(例如 GPT-2、GPT-3 和 GPT-4)有着相同的网络结构,但专门针对「如何根据指令回答问题」以及「如何让回答符合“人类价值”」做了优化。

GPT模型结构

Q4: ChatGPT的模型真有千亿参数吗?

没有。2018年发布的GPT-1有大约1亿参数,2019年发布的GPT-2有大约19亿参数,2020发布的GPT-3有1750亿参数。虽然拥有千亿参数量的GPT-3是ChatGPT的基础,但是ChatGPT只有约20亿参数。

模型大小对比

Q5: 研发出ChatGPT要花多少钱?

ChatGPT的基础是GPT-3,GPT-3的单次训练成本高达250万美金。2015年Openai成立开始做GPT的启动资金就高达10亿美金,2019年微软继续投资了10亿美金,2023年在ChatGPT爆火后微软又继续投资了100亿美金。而这些钱的主要用途就是GPT类大模型的研发与训练。

训练成本

Q6: 为什么ChatGPT能多轮对话?

ChatGPT的模型结构与GPT-3一致是语言模型,该模型的输入和输出均为文本,没有记忆功能,所以只能实现单轮的问答。对于多轮的对话,ChatGPT会将之前的问答进行拼接,再继续拼接当前用户的问题,共同构成模型的输入。这时模型就能参考整个之前的对话内容给出回答,从而实现“多轮”。

多轮对话

Q7: 能跟ChatGPT无限聊下去吗?

不能。由于模型的输入和输出长度是有限制的,为2048个token(最新版为4096个token),所以如果历史对话过长就会超过模型能处理的长度限制。而刚推出的GPT-4相比ChatGPT的一个重要优势就是模型输入长度的限制大幅提升到25,000个token。不过即便如此,理论上GPT-4也不能“无限”聊下去。

chatgpt vs gpt4

Q8: ChatGPT的知识来自哪里?

ChatGPT所拥有的丰富知识储备,来自于它的训练数据,以及足够大的模型参数。这些数据大致可以分为三个大的范畴:网页内容、书籍内容以及百科内容。百科和书籍不必多说,天然蕴含了大量的知识。这里网页内容包含了许多新闻、评论、观点等,并且网页还包括很多高质量的问答垂直类网站,例如知乎,这些都是ChatGPT的知识来源。但是因为训练数据收集截至到2021年,所以对于2021年之后的问题无法回答。

GPT的训练语料

Q9: ChatGPT对中文支持如何?

ChatGPT对不同语言的支持程度取决于在训练数据中相关语言的占比。ChatGPT目前支持超过90种语言,支持多语种混合输入,但是训练语料中的主流语言依然是英文(超过90%),中文的占比很小。所以如果对回答不满意,可以试着将问题转换成英文后再与ChatGPT进行交互。

GPT3的语言占比,超过90%均为英文

Q10: ChatGPT有哪些缺陷?

ChatGPT不是完美的还具有很多的缺陷,例如:1. 可能给出错误的回答,并且无法给出回答的来源,可能会一本正经胡说八道; 2. 因为数据截止到2021年,所以最新的知识无法回答;3. 只能输入输出只能是文本,而不能理解/生成图片,视频等富媒体 ;4. 对于逻辑推理,数学计算等效果较差 ;5. 对于输入的提示词(问法)很敏感,例如对于某个问题,无法回答,但是如果重新措辞,可能就会轻松回答。

当然这些问题也已经逐步在解决中,例如集成了ChatGPT的搜索引擎 new being就可以给出答案的来源并且支持从互联网上获取最新的知识;刚推出的GPT-4也已经可以支持图片的输入;同样ChatGPT的插件也可以部分解决数学计算的问题。

一本正经胡说八道

Q10+1: 国内如何用上ChatGPT ?

ChatGPT目前不支持国内以及香港地区的用户访问。即使成功访问,想真正用上ChatGPT也非常麻烦,需要国外的手机号和信用卡。所以国内有直接通过ChatGPT API搭建的镜像站点。这里推荐一直在用的“一粟创作平台”,可以在国内稳定访问ChatGPT,PC端/移动端都支持,并且在持续集成更多的AI能力,例如AI作画,ChatPDF等。具体参见:https://ai.yisukeyan.com/
可以通过邀请链接直接注册,注册后就能免费体验!

一粟创作助手


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!