AI是什么?

AI(人工智能)是一门研究、开发用于模拟、延伸和扩展人的智能的技术科学。

它具有以下几个关键特点:

  • 学习能力:能够从大量的数据中自动学习模式、规律和知识。通过机器学习算法,AI 可以对数据进行分析和理解,不断提升自身的性能和能力。
  • 智能表现:可以展现出类似人类智能的某些方面,比如感知、认知、决策、推理等。例如,图像识别、语音识别、自然语言处理等都是 AI 智能表现的具体体现。
  • 适应性:能够根据不同的环境和任务进行调整和适应。它可以在新的情境中运用已学到的知识和技能,以更好地完成任务。
  • 自主性:在一定程度上可以自主地进行操作和决策,而无需持续的人类干预。
  • 广泛的应用领域:涵盖了医疗、交通、金融、教育、制造业等众多行业。比如在医疗领域辅助疾病诊断,在交通领域实现自动驾驶等。

从实现方式来看,AI 包含多种技术,如机器学习(包括监督学习、无监督学习等)、深度学习(利用深度神经网络)、自然语言处理、计算机视觉、智能机器人技术等。

AI 的目标是创造出能够像人类一样思考、学习和行动的智能系统,以帮助人类解决各种复杂的问题,提高工作效率和生活质量。然而,随着 AI 的发展,也带来了一些挑战和问题,如伦理道德、数据隐私、就业结构变化等,这些都需要我们在发展和应用 AI 的过程中认真思考和应对。

AI的发展历程

人工智能的发展历程可以追溯到上世纪50年代,以下是其发展的主要阶段:

  • 起步发展期(1956年-20世纪60年代初):1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(Artificial Intelligence,简称AI)”这一概念,标志着人工智能学科的诞生。在这一阶段,人工智能取得了一些令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起了人工智能发展的第一个高潮。
  • 反思发展期(20世纪60年代-70年代初):在人工智能发展的初期,人们对其期望过高,提出了一些不切实际的研发目标。然而,由于技术限制和实际应用中的困难,这些目标未能实现,导致人工智能的发展走入低谷。
  • 应用发展期(20世纪70年代初-80年代中):20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
  • 低迷发展期(20世纪80年代中-90年代中):随着人工智能应用规模的不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
  • 稳步发展期(20世纪90年代中-2010年):由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念,这些都是这一时期的标志性事件。
  • 蓬勃发展期(2011年至今):随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。

当前,人工智能的发展现状如下:

  • 专用人工智能取得重要突破:面向特定任务的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。
  • 通用人工智能尚处于起步阶段:真正意义上完备的人工智能系统应该是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。

AI发展的重大事件

  • 1943年:沃伦·麦卡洛克(Warren McCulloch) 和 沃尔特·皮茨(Walter Pitts) 提出了神经网络的概念及MCP模型,为人工智能的发展奠定了基础。
  • 1955年:人工智能之父约翰·麦卡锡(John McCarthy) 等人提交了一份提案,第一次提出了“人工智能”的概念。
  • 1956年:达特茅斯会议召开,标志着人工智能的正式诞生。
  • 1969年:反向传播算法(BACKPROP)出现,这是一种重要的神经网络训练算法。
  • 1986年:德国联邦国防军大学的研究人员在一辆面包车上安装了摄像头和智能传感器,实现了自动驾驶。
  • 1997年:IBM 的“深蓝”超级计算机战胜国际象棋冠军 Garry Kasparov,展示了人工智能在复杂游戏中的能力。
  • 2011年:IBM 的人工智能“沃森”在智力竞赛节目“Jeopardy”中击败了人类对手,证明了人工智能在知识问答方面的能力。
  • 2012年:谷歌研究人员通过深度学习算法训练的神经网络能够识别猫科动物,展示了人工智能在图像识别领域的突破。
  • 2016年:谷歌的 AlphaGo 战胜了围棋世界冠军李世石,引起了全球对人工智能的关注。

AI的基本概念

人工神经网络(Artificial Neuron Network)

人工神经网络是一种模仿生物神经网络的结构和功能的数学模型或计算模型。通俗来讲,ANN是一个计算机系统,通过模拟生物神经网络的决策过程,把输入转化为输出。

单个神经元的决策过程:

$\hat{y}$ = $\phi$($\sum_{i=1}^{n} x_i w_i$ + b)

$x_i$ 为输入数据,而 $w_i$ 则是其对应的权重(weight)。求和之后函数为一个连续函数,激活函数(activation function) $\phi$ 则是用来对求和之后的结果做出决策。

在多层模型中,上一层的输出将作为下一层的输入传入下一层中。

机器学习、深度学习、基础模型及大语言模型

机器学习是一个广泛的领域,旨在让计算机通过数据学习和获取知识、模式以及进行预测和决策等。深度学习是机器学习的一个重要分支和延伸。深度学习则特别强调使用多层神经网络结构来进行学习。它利用大量的数据和强大的计算能力,通过自动学习特征表示来处理复杂任务。

具体关系可以从以下几点来看:

  • 深度学习是机器学习的一种先进技术,继承了机器学习的基本理念和方法。
  • 机器学习包含了多种不同的算法和技术,而深度学习在处理图像、语音、自然语言等复杂数据方面表现出强大的能力,是机器学习在这些领域的重要拓展。
  • 深度学习的发展进一步推动了机器学习的进步,拓展了其应用范围和效果。

例如,在图像识别任务中,传统机器学习可能需要人工设计特征,而深度学习可以自动从大量图像数据中学习到有效的特征表示,从而实现更准确的识别。

在基础模型出现之前,通常是一个模型只完成一种特定的任务,而基础模型则可以训练多种类型的数据,根据需求来完成各种各样的任务。

大语言模型是一种基于深度学习技术的大型语言处理模型,是基础模型的一种。

它具有以下特点:

  • 大规模数据训练:通过在海量的文本数据上进行训练,从而学习到丰富的语言知识、语义理解和语法规则。
  • 高参数量:通常包含大量的参数,这使其具有强大的表示能力和学习能力。
  • 通用语言处理能力:能够处理多种自然语言任务,如文本生成、知识问答、推理计算、阅读理解等。
  • 深度理解和生成:可以深入理解输入的文本,并生成连贯、有逻辑的自然语言文本响应。