自然语言处理与计算语言学

自然语言处理与计算语言学
作者: [法] 格夫·斯里尼瓦萨-德西坎(Bhargav Sriniva
出版社: 人民邮电
原售价: 59.00
折扣价: 41.30
折扣购买: 自然语言处理与计算语言学
ISBN: 9787115540249

作者简介

Bhargav Srinivasa-Desikan 是就职于法国INRIA公司(位于里尔)的一名研究人员。作为MODAL(数据分析与机器建模)小组的一员,致力于度量学习、预测聚合和数据可视化等研究领域。同时,他也是Python开源社区的一名活跃贡献者,在2016年度Google的夏季编程赛上,他通过Gensim实现了动态主题模型。Bhargav是欧洲和亚洲PyCons和PyDatas的常客,并使用Python进行文本分析教学。他也是Python机器学习软件包pycobra的维护者,还在Machine Learning Research杂志上发表过相关文章。

内容简介

1.Python开源社区供稿人撰写,基于Python语言 2.计算语言学领域为数不多的作品之一 3.文本分析实用指南 4.技术实用性强,侧重于技术细节的实现 5.平衡了理论与实战案例之间的关系,可以在掌握理论知识的同时,运行自己的自然语言处理项目 6.提供源码下载 使用Python和开源工具可以方便地进行现代文本分析,因此,在这个文本数据时代有必要掌握现代文本分析的方法。 本书介绍了如何使用自然语言处理和计算语言学算法对所拥有的数据进行推理并获得洞察力。这些算法以统计机器学习和人工智能技术为基础。现在,使用了这些算法的工具唾手可得,并可在Python、Gensim和spaCy等工具中使用。 本书从数据清理开始介绍,然后介绍了计算语言学的相关概念。在掌握了这些内容之后,接下来就可以使用真实的语言和文本,并借助Python来探索统计NLP和深度学习的更复杂领域。你将学到如何使用合适的工具来标注、解析和建模文本,并掌握相应框架工具的使用知识,还将知道何时选为主题模型选择Gensim这样的工具,以及何时使用Keras进行深度学习。 本书很好地平衡了理论与实战案例之间的关系,因此你可以在掌握理论知识的同时,执运行自己的自然语言处理项目。你将发现Python这一自然语言处理工具所具有的丰富的生态系统,并将进入现代文本分析的有趣世界。 本书内容: 文本分析为什么在当今时代如此重要; 理解NLP术语并了解各种Python工具与数据集; 如何预处理以及清理文本数据; 将文本数据转换为矢量空间表示; 使用spaCy处理文本; 针对计算语言学训练自己的NLP模型; 借助于Gensim和scikit-learn,针对文本使用统计学习和主题建模算法; 借助于Keras,使用各种深度学习技术进行文本分析。