人工智能启蒙(4)

人工智能启蒙(4)
作者: 编者:林达华//顾建军
出版社: 商务印书馆
原售价: 21.50
折扣价: 18.30
折扣购买: 人工智能启蒙(4)
ISBN: 9787100177597

作者简介

林达华,商汤科技联合创始人;香港中文大学信息工程系教授;香港中文大学-商汤科技联合实验室主任。林教授在2004年于中国科学技术大学获得学士学位,在2006年于香港中文大学获得信息工程硕士学位,在2012年于美国麻省理工学院获得计算机科学博士学位。他在2012年到2014年于芝加哥丰田科技研究院任研究助理教授,在2014年8月到香港中文大学任教。林教授在计算机视觉,概率推断,与深度学习方面有广泛的研究经历,并在多个课题上取得突出成绩。他在CVPR/ICCV/ECCV/NIPS/PAMI等计算机视觉与机器学习顶级会议与期刊发表70多篇论文。他在贝叶斯非参建模方面的开创性工作于2010年获得机器学习领域最权威国际会议NIPS的最佳学生论文奖。他分别在2009年与2011年获得计算机视觉最高学术会议ICCV的杰出评审员奖。他曾指导香港中文大学的研究团队参加ImageNet和ActivityNet竞赛,获得多个冠军。此外,他也担任CVPR,ECCV,BMVC,ACMMultimedia等主要国际会议的领域主席(AreaChair)。 顾建军,南京师范大学教育科学学院院长、教育科学研究院院长、博士生导师。国务院学位委员会学科评议组(教育学)成员, 高中通用技术课程标准修订组组长, 课程中心K12技术与工程教育南京师大基地负责人,国际技术与工程教育组织中国中心主任,中国教育装备协会副理事长,中国职业安全教育研究会理事长,世界创客教育联盟执行主席。

内容简介

第十一节 有趣的表情包 1了解表情图片的制作原理及过程; 2学会通过图像扭曲等方法制作出个性 表情包。 学习目标 ▲图11-1有趣的表情包 111图像扭曲 制作表情包有很多不同的方法,其中一种是通过对原图进行局部扭曲得到的。通过对图像不同部位的扭曲操作,可以实现不同的表情效果,进而得到一张张特殊表情的图片。将一组风格类似的表情图片组合在一起,就形成了一个表情包。 与图像风格转换和人脸的解码不同,这种直接依靠扭曲得到的表情包是对图像直接进行操作。这也是生成新图像的一种重要方式,制作一张个性表情图片所采用的技术通常包含图像的扭曲和关键点检测。 图11-2贝塞尔曲线扭曲图像扭曲是一种数字化处理图像的过程,分为全局扭曲和局部扭曲。全局扭曲指对图像中所有像素进行扭曲变换,如图11-2所示,图中是使用贝塞尔曲线对图像进行扭曲操作后得到的效果。 图11-3局部扭曲局部扭曲则只作用于图像的局部,像捏橡皮泥一样,把一个点捏动一定距离。局部扭曲的三个控制变量分别是:起点、位移、影响半径。如图11-3所示,只对小女孩面部的部分区域做了局部扭曲: 112制作我的个性动态表情包 对人脸进行合理的局部扭曲可以改变人的面部表情,从而形成表情包。制作表情包的第一步需要获取人脸的各个关键点。对人脸进行关键点检测即提取面部轮廓和五官的关键点,如图11-4所示,通常包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓等。这些关键点都是人工标定的人脸中特殊的一些位置,可以通过神经网络训练得到。 ▲图11-4人的面部关键点 做一做 1登录实验平台,输入一张自己的图片或者网上下载的图片,编写程序获取人脸关键点。 2以人脸中的某个关键点为起点进行局部扭曲,是不是就可以制作一些表情图片呢?编写程序尝试对图像进行局部扭曲,观察表情的变化。 实现表情静止到动态的过程其实是由多张照片连续播放产生的,肉眼认为自然的表情变化主要是靠人眼的视觉残留效应。如图11-5所示,在一幅画还没有消失前播放下一幅画,就会给人造成一种流畅的视觉变化效果,从而让人认为是连续的动作。 ▲图11-5简单动画生成示意图 为了制作动态表情包,首先找到对表情影响最大的四个人脸关键点:左右眉心和两个嘴角,如图11-4中的右图所示。以这四个点分别作为起点进行局部扭曲,并且控制扭曲的两个参数:位移和影响半径,就能够在一定程度内控制面部表情。而将一点点扭曲直至目标参数的中间过程中的所有图片组合在一起,就能形成一个动态的表情包了。 做一做 登录实验平台,尝试修改左右眉心和两个嘴角的扭曲参数,制作个性动态表情包。 想一想 如果输入的是一张卡通图片,无法检测面部关键点,如何选择进行局部扭曲的起点呢? 评一评 我知道制作动态表情包的步骤。☆☆☆☆☆ 我能够利用实验平台制作一款属于自己的个性动态表情包。☆☆☆☆☆ ★全球领先的人工智能平台、全球最具价值的 AI 创新企业——商汤科技,联手知名教育专家和小学优秀教师共同编写 ★面向小学生深入浅出,完善人工智能教育体系 ★商汤科技以最前沿的AI 技术赋能,深入浅出地设计AI教学项目制课程,让孩子们及早与人工智能这一前沿领域亲密接触,真切了解 AI 在世纪生活和工作中的应用和发展 ★帮助孩子建立对 AI 的科学认知,初步掌握AI技术原理和基本能力,理解AI给未来所带来的机遇和挑战 ★图文并茂、深入浅出、生动有趣。内容包括AI识图的应用,计算机是怎么识别物体的,有趣的目标检 书中为孩子们讲述:无处不在的人工智能 ★计算机生成的图像与真实世界的图像 在技术水平蓬勃发展的背景下,计算机能够根据一些具体的要求生成一幅图画作品,其生成的图像主题突出,足够以假乱真。计算机像人一样具备了绘画的能力,那么它是如何进行绘画的呢? ★计算机文本生成在生活中的应用 日常生活中,有许多地方运用了计算机的数据生成。比如,机器翻译是计算机智能生成文本在生活中的一类应用,随着人工智能算法的引入机器翻译的质量也越来越高, 可以轻松快速地实现任意两种语言的互译。比如,智能客服中的对话实际上也是计算机文本生成在生活中的一个应用。 ★大海捞针的随机生成 真实的生活往往因为不确定性而精彩,但是对于计算机的数据生成而言,完全的随机生成往往是不可取的。因为完全的随机就好像身处沙漠,在沙漠中漫无目的地行走,很难找到沙漠的出口。而运用人工智能的智能数据生成,就仿佛是在沙漠中拥有了前人行走的经验指导,能够顺着经验前行,同时根据实际情况形成新的经验, 有目的地得到想要的结果。书中通过有趣的实验分析,可以了解到计算机是如何通过随机方法生成单词和句子的。 ★计算机智能生成句子 计算机生成一个合理准确的句子需要考虑上下文的关系? 因此一个完整的句子通常不是一次性生成的,计算机生成句子的过程和游戏中一样,每次只生成一个单词? 并把单词放入序列中,根据序列中现有的单词 (记忆中的情况) 在词库中搜索潜在的下一个单词? 并继续把新生成的单词放入序列中,根据序列 (记忆中的情况) 在词库中搜索下一个单词,这是一个不断判断、 搜索和生成单词的循环过程。 ★贴鼻子游戏的启示 你玩过贴鼻子游戏吗? 不少人肯定玩过。蒙着眼睛将手中的纸鼻子贴到黑板上画着的人脸模型上。为什么机器能够准确、 迅速地判断鼻子位置不合理的情况? 猜一猜人工智能是如何判断鼻子位置是否合理的呢? ★奇妙的特征空间 人工智能通过学习各种类别图片的数据集,就能从中提取到体现各类事物差异的特点并记录为一串数字。根据某张图片对应的特征数字串可以更进一步给出图片所属的类别,这就是图像分类的过程。人脸识别的原理也是类似的,在特征空间中同一个人不同角度、 不同表情的脸部照片在空间中的分布位置更加接近;不是同一人的脸部照片在空间中的分布位置相对较远,也就是说在特征空间中分布相近的图片数据更可能是同一个人。如果让人工智能学习一个很大的人脸数据集,就可以形成一个理想的人脸特征空间。基于此特征空间,就可以完成如人脸签到、 人脸支付、 人脸解锁等一系列人脸识别的实际应用。 ★从特征空间到现实世界 看,这是用电脑画的人脸图片,是不是和照片上的很像。 其实,这是电脑利用人工智能自动画出的图像。怎么实现的呢?训练好的人脸解码器就像是一个专业的 “肖像画家”,通过一定的数字编码来了解人脸关键信息,如肤色、 脸型、 五官等? 并根据数字编码中提供的 关键信息就可以生成一张对应的人脸。