5分钟了解人工智能

作者照片
编辑: 老夏

AI(人工智能)火爆之后,每天都能接收到很多关于人工智能的讯息。有各类新闻,各种创新的应用,当然也有各式各样蹭热度的跑火车小视频。今天就来给大家梳理一下关于人工智能的知识框架,也会举一些例子让大家更好的理解。

关于人工智能,大家会听到很多新鲜的词,比如:图灵测试、机器学习、算法、算力、神经网络、大语言模型、GPT、ChatGPT等等等。单独来解释每一个词,理解起来都很抽象,我们梳理一下框架,建立联系之后再解释。

人工智能,就是让机器拥有和人类类似的智能,让机器学会像人一样思考。这个概念提出的很早,1940年第一台计算机问世以来,人类就开始有了这个想法。1950年图灵同志提出了图灵测试,作为最著名的判断机器是否有人类智能的标准,不过随着科技的发展,从现在的角度看,图灵测试只能作为哲学和伦理讨论的一个参考点。进入21世纪之后的深度学习的崛起,人工智能才进入了高速发展的阶段。

我们先引入两个概念,自动化和数据库。这是人类科技树上已经非常成熟的技术。自动化很好理解,冰箱打开门,冰箱里的灯就亮了,这就是一个简单的自动化。从触发器到执行模块,不断叠加后可以实现很多目标。数据库可以想象成一个图书馆,书就是数据,都整齐的放在书架上,书架整齐的排列在不同的馆区,有一张索引表,记载着每一本书对应的位置以方便我们找到这本书。数据库还有个很好的例子就是搜索引擎,搜索引擎的网络爬虫在网络上摘抄各种数据信息,保存好索引,当你搜索的时候,他就按照你的搜索关键词,在索引中找出最相似的内容反馈给你(当然百度还会赠送你喜欢的广告)。

现在,我们有一个机器人,他是一个图书管理员。我们告诉他我们要借的书名,他通过自动化在数据库中找到这本书,然后跑过去拿给我们。自动化并不会给他思考的能力,他只能按触发器去执行命令。成熟的数据库技术和自动化技术,让这个机器图书管理员的工作非常高效。

现在我们要给这个图书管理员赋予人工智能:我们设计了算法,比如多元线性递归。我们设计了多层神经网络(MLP)以实现深度学习(Deep Learning);为了让他看懂人类文字的书籍和图片,我们设计了自然语言处理(NLP)和大语言模型(LLM);为了让他读书读的更快,我们提供了更高的算力(此处要依靠黄老板),这个训练(Training)过程就是机器学习(Machine Learning)。读完了图书馆里的书(数据Dataset)之后,这个图书管理员就是一个可以使用人类语言(NLP技术)的生成式的(Generative),预训练的(Pre-trained)人工智能模型(Transformers)。

现在他已经不再是依靠自动化和数据库运行的图书管理员,你可以通过自然语言问他某一本书的内容提要,某一类书的核心思想,更神奇的是,他可以开始写作,按照你的要求和他学习过的内容开始创作。他所生成的内容就叫做生成式人工智能产品AIGC(Artificial Intelligence Generated Content),他不仅可以生成文字,还可以生成图片,音频,视频,这就是多模态。

GPT是一个模型的名字,这个模型有不同的版本GPT-3,GPT-4。将来还会有567。这个模型是OpenAI公司开发的,这个公司的现任CEO是奥特曼(对,就叫这个名字)。ChatGPT是使用了GPT模型的一个应用,有网页版和手机APP。

同样的模型还有很多,比如Google公司的Bard模型,还有国内的百度公司的文心模型,科大讯飞的星火模型,阿里的通义千问模型。

当然还有生成图片的模型,比如NVIDIA公司的StyleGAN & StyleGAN2模型,OpenAI公司的DALL·E模型。

所有这些模型或者应用都属于人工智能的一个分支:Generated AI(生成式人工智能)。还有很多人工智能,并不使用自然语言和人类交互,比如下国际象棋的阿尔法狗,比如汽车工业的自动驾驶技术。

总结一句:人工智能(AI)里有一个领域叫做生成式人工智能(Generated AI),其中文字生成领域有一个模型:GPT,基于这个模型的应用之一:ChatGPT。

发表评论