《人工智能技术入门》一书由杨正洪编著,旨在为读者提供一个全面理解人工智能(AI)的框架,并深入探讨其核心技术。本书共有11章,涵盖了从AI概述到具体技术应用的广泛内容。
杨正洪,毕业于美国State University of New York at Stony Brook,在美国硅谷从事AI和大数据相关研发工作十余年,华中科技大学和中国地质大学客座教授,湖北省2013年海外引进人才,并拥有多项国家专利。杨正洪参与了大数据和人工智能的国家标准的制定,在2016年参与了公安部主导的“信息安全技术:大数据平台安全管理产品安全技术要求”的国家标准制定。杨正洪是中关村海外智库专家顾问和住建部中规院专家顾问,曾担任在美上市公司CTO、北京某国企CIO和上海某国企高级副总裁等职。多年从事人工智能与大数据技术的实践,出版了《智慧城市》《大数据技术入门》等多本畅销书。
以下是对每个章节内容的详细总结:
第1章:人工智能概述
本章介绍了人工智能的基本概念和发展历程,从古希腊神话中的机器人梦想到现代的人工智能研究。作者指出,虽然强人工智能仍然是一个长远的目标,但当前的研究和应用主要集中在弱人工智能上。作者强调了AI在现代社会各个领域的广泛应用,并提出了对未来发展的展望。
第2章:AI产业与应用场景
本章讨论了AI产业的发展现状及其对经济和社会的影响。作者通过列举如无人驾驶汽车、人脸识别等实际案例,展示了AI如何推动不同行业变革。同时,作者也指出了中国在政策支持下的AI产业发展潜力,并提到了AI可能带来的经济效益。
人工智能产业分为三层:基础层、技术层和应用层。其中,基础层包括芯片、大数据、网络等多项基础设施,为人工智能产业奠定硬件和数据基础。技术层包括计算机视觉、语音语义识别、机器学习等,多数人工智能技术公司以一项或多项技术细分领域为切入点。而最终人工智能技术能否落地且产生巨大的商业价值,还需要应用层中多场景的应用。目前,人工智能技术应用到多个行业中,包括金融、安防、智能家居、医疗、机器人、自动驾驶等。应用层市场空间大,参与的企业多,这些企业发展垂直应用,解决行业痛点,实现场景落地。
第3章至第6章:核心技术(机器学习、特征工程、模型、算法)
这部分内容集中讲解了机器学习的基础理论和技术细节,包括监督学习、非监督学习、回归分析等常见方法;接着深入探讨了特征工程的重要性及实践技巧;最后介绍了多种经典算法及其应用场景。作者特别强调了数据清洗、预处理以及选择合适的模型对于构建高效AI系统的关键作用。
这是最简单的线性回归(Linear Regression)模型。因为只有一个自变量x,所以叫作一元线性回归。y与x之间的关系就是这个任务中我们所用的模型。对于模型的概念,可以这样理解,它刻画了因变量y和自变量x之间的客观关系,即y与x之间存在这样一种形式的客观规律在约束。具体来说,y约等于某个数乘以x,再加上另一个数。使用这个模型,就意味着我们认定样本数据服从这样一个规律。换句话说,模型是对处理变量关系的某种假设。在机器学习中,a1叫作权重(Weight),a0叫作偏差(Bias),x是一个特征(Feature),而y是预测的标签。训练一个模型就是从训练数据中确定权重和偏差的最佳值。箭头部分表示了预测值(或推测值)和真实值之间的差距,这叫误差(Loss)。如果这个模型很完美,那么误差应该接近0。训练的目标是找到让误差最小的权重和偏差。
左图用一条直线分割平面,模型过于简单,对直线右侧的红色标签数据(叉叉)刻画较差,属于欠拟合(Underfitting);而右图则用了比较复杂的模型,对样本集的数据全部照顾,属于过度拟合(Overfitting)。过度拟合是参数过多,对训练集的匹配度太高、太准确,以至于在后面的预测过程中可能会导致预测值非常偏离,预测非常不准确。中间的图是合适的拟合。
“狼来了”模型的4种情况:
肿瘤模型的4种情况:
准确率(Accuracy)是我们最常见的评价指标,Accuracy=(TP+TN)/所有样本数,这个很容易理解,就是被分对的样本数除以所有的样本数。通常来说,准确率越高,分类器越好。
精确率(Precision)指标尝试回答以下问题:在被识别为正类别的样本中,确实为正类别的比例是多少?以前面的狼来了例子为例,这个参数的意思是我们是否说“狼来了”太多了。在小男孩说“狼来了”的情况中,有多少次是对的?他说“狼来了”的精确率如何?
召回率:在所有正类别样本中,被正确识别为正类别的比例是多少?以前面的“狼来了”为例,这个参数的意思是我们错过了多少“狼来了”。召回率指标则是指在所有试图进入村庄的狼中,我们发现了多少头?
第7章:深度学习
本章专门介绍深度学习这一当前最热门的技术方向,解释了神经网络的工作原理,并讲述了TensorFlow等流行框架的使用方法。作者认为,随着计算能力提升和大数据积累,深度学习已经成为实现复杂任务的有效手段之一。
第8章、第9章:TensorFlow
介绍了 TensorFlow的具体使用。
第10章:神经网络
探讨了不同类型神经网络结构及其优化策略,如卷积神经网络(CNN)用于图像处理、循环神经网络(RNN)适用于序列数据分析等。作者还提及了对抗生成网络(GAN)等前沿课题。