专栏名称: 算法与数据结构
算法与数据结构知识、资源分享
目录
相关文章推荐
九章算法  ·  K.O大厂“原题”的《OOD面向对象圣经》, ... ·  3 天前  
九章算法  ·  Meta AI是给的真多,想冲了…… ·  4 天前  
九章算法  ·  1年了,TikTok CEO周受资发力了! ·  5 天前  
算法爱好者  ·  IT巨头老板主张“每周 70 ... ·  6 天前  
九章算法  ·  今日开播!FAANG面试官划2025年上岸考 ... ·  6 天前  
51好读  ›  专栏  ›  算法与数据结构

为什么说自然语言处理是AI皇冠上的明珠

算法与数据结构  · 公众号  · 算法  · 2017-12-05 09:00

正文

如果一台计算机能够欺骗人类,让人相信它是人类,那么该计算机就应当被认为是智能的。

——阿兰·图灵

机器能跟我们人类交流吗,能像我们人类一样理解文本吗,这是大家对人工智能最初的幻想。如今,它已成为人工智能的核心领域——自然语言处理(简称:NLP)。自然语言处理是一门融语言学计算机科学、人工智能于一体的科学,解决的是“让机器可以理解自然语言”——这一到目前为止都还只是人类独有的特权,因此,被誉为人工智能皇冠上的明珠。

如今,这门学科受到了国家政府、各大企业的普遍关注。国务院《新一代人工智能发展规划》,明确指出建立新一代人工智能关键共性技术体系,自然语言处理技术作为八大共性技术之一,被重点强调和扶持。

无处不在的自然语言处理

我们每天都在使用或受益于“自然语言处理”的技术,举个例子,微软小冰是中国微博上的一款将对话带入我们日常生活的聊天机器人。百万年轻中国用户通过小冰交换信息,与他人分手、丢了工作或感觉沮丧时,人们经常会和小冰聊天。到目前,小冰已经累积了上亿用户,平均聊天的回数23轮,平时聊天时长大概是25分钟左右。自然语言处理技术更广泛使用,可见下面的案例:

机器翻译

去年秋天,谷歌翻译推出了一个全新升级的人工智能翻译引擎。这样一来,曾以产出语言生硬但又可用的翻译而闻名的谷歌翻译,已开始产出语言流畅、精确度高的翻译文本。对未经专业翻译训练的人来说,这种文本输出几乎与人工翻译并未有区别。我们将上面这段文字输入到谷歌翻译中(中译英),输出的英文句子,让人惊叹!

图一 谷歌翻译示意图

垃圾邮件检测

在自动垃圾邮件检测等一些应用中,分类只有两个:垃圾邮件和非垃圾邮件。在其它情况下,分类器可以有多个分类,比如按主题组织新闻报道或按领域组织学术论文。而要是一篇博客文章谈论的是体育和娱乐又会怎样?一个分类器如何在多个选项之间选择正确的分类?那依赖于具体应用:它可以简单地选择最有可能的选项,但有时候为一个文本分配多个分类是有意义的。

图二 邮件自动分类

问答系统

从2011年Siri诞生,到Google Now,再到Cortana和Alexa,作为语音助手,其实它们本质上都是问答系统。这几个都是面向公开领域的问答系统,在我们的日常生活中帮忙定闹钟、打电话、导航、搜索问题,偶尔还能讲讲笑话,也正让我们的生活越来越方便。

图三 苹果Siri示意图

尤其是2010年后,深度学习应用于自然语言处理领域,一系列的产品功能逐渐走进我们的生活。各大企业也在纷纷布局相关产业,重金招揽相关领域人才。我国在语言文字信息处理方面就诞生了三家上市公司,从上市的顺序来说,最早是汉王,做模式识别,后来科大讯飞做语音识别,然后是拓而思的信息检索和文本挖掘。

图四 知名招聘网站岗位图

作为人工智能的一大热门研究领域,如何从基础开始入门,并学习到最新的技术呢?自然语言处理领域知名青年学者、国际顶级会议作者周教授,推出自然语言处理基础与算法实践》、《基于深度学习的自然语言处理》两门在线直播课程(基础课+提高课),课程优秀学员可直接推荐至百度、搜狗、今日头条等知名企业实习就业。

课程讲师

周老师,教授、硕士生导师,中科院自动化所博士,主要从事自然语言处理以及深度学习等方面的研究工作。在相关领域国际期刊以及国际顶级学术会议ACL等发表论文20余篇,先后两次获得国际会议最佳论文奖。目前承担国家自然科学基金、973子课题等10余项。

课程特色

1. 顶级会议作者主讲,洞悉技术前沿;

2. 理论结合实践,基础搭配强化课程;

3. 课上在线直播答疑,课下微信群答疑;

4. 优秀学员推荐名企实习就业

5. 课程PPT、数据集和源程序,均向学员公开

课程目录

Part I:基础课程(10学时)

1. 句法分析与语义分析(2学时)    

    1.1  依存句法分析

    1.2  语义角色标注    

    1.3  相关数据集、工具介绍

2. 观点挖掘与情感分析(2学时)

    2.1  句子级情感分析   

    2.2  文档级情感分析    

    2.3  跨语言情感分析   

    2.4  跨领域情感分析   

    2.5  相关数据集、工具介绍

3. 信息抽取:part 1(2学时)   

    3.1  命名实体识别与抽取   

    3.2  实体消歧   

    3.3  相关数据集、工具介绍

4. 信息抽取:part 2 (2学时)  

    4.1  实体关系抽取   

    4.2  事件抽取   

    4.3  相关数据集、工具介绍

5. 问答系统(2学时)  

    5.1  检索式问答  

    5.2  社区问答  

    5.3  知识库问答 

    5.4  相关数据集、工具介绍

Part II:基于深度学习的NLP实战(24学时)

6. 基于深度学习的词法分析(4学时)  

    6.1 基于深度学习的中文分词

    6.2 基于深度学习的词性标注

    6.3 基于深度学习的命名实体识别

    6.4 代码模块演示、常用工具和公共数据集

7. 基于深度学习的句法与语义分析(4学时)

    7.1 基于图的依存句法分析

    7.2 基于转移的依存句法分析

    7.3 浅层语义角色标注

    7.4 代码模块演示、常用工具和公共数据集

8. 基于深度学习的情感分析(4学时)  

    8.1 基于深度学习的情感词典构建

    8.2 基于深度学习的句子级情感分析

    8.3 基于深度学习的文档级情感分析

    8.4 基于深度学习的跨语言情感分析

    8.5 代码模块演示、常用工具和公共数据集

9. 基于深度学习的信息抽取:Part 1(4学时)

    9.1 基于深度学习的实体关系抽取

    9.2 基于深度学习的实体消歧

    9.3 代表性系统模块演示、常用工具和公共数据集

10. 基于深度学习的信息抽取:Part 2(4学时)

    10.1 基于深度学习的事件抽取

    10.2 基于深度学习的知识库表示

    10.3 基于深度学习的知识库补全

    10.4 代码模块演示、常用工具和公共数据集

11. 基于深度学习的问答系统(4学时)

    11.1 基于深度学习的社区问答

    11.2 基于深度学习的复杂问句解析

    11.3 基于深度学习的知识库问答

    11.4 代码模块演示、常用工具和公共数据集

报名

前100名可领取 150元优惠券 ,1月6日正式开课,每周六、周日晚 19点到 21 点在线直播授课,一年内可以无限次在线回放。


请添加工作人员「深蓝学院助教报名