作者按:人类进入数字时代后,在生产和生活过程中积累了海量数据。过程数据的分析和利用,对人类在信息社会动态持续地认知、适应、改造生产和生活环境,具有重要意义。过程的分析方法包括模型驱动和数据驱动两类。传统的研究方法主要是模型驱动的过程建模方法,通过反复验证建立过程的抽象及简化表示,其局限性在于:模型选择需要较高的专家经验和领域知识,使得建模方法过于细分、通用性欠强,不易适应信息社会的开放环境和不断涌现的新现象,不利于工程应用。人类生产生活中产生并积累的过程大数据,使得数据驱动的过程分析成为可能。将深度学习引入到过程分析,实现过程的端对端学习,降低应用门槛,提高使用效率,有可能带来过程分析的新突破。本文根据本人2017年5月22日在全球人工智能技术大会深度学习论坛、及5月23日“ACM
SIGMM走进企业(IBM)”上的报告整理而成,分享对深度过程学习的若干初浅思考,首先汇报提出“深度过程学习”概念的初衷,然后汇报关于深度过程学习研究路径的初步思考,最后结合社交媒体分析和计算机视觉等实例,汇报课题组在点过程深度学习、基于点过程的计算机视觉方面的若干初步成果。
一、深度过程学习的基本概念
所谓深度过程学习,就是用深度学习技术对过程数据进行分析。过程是一个很宽泛的词。我们所指的过程对应的英文是Process,其含义是事物发展所经过的程序或阶段。过程是一个很宽泛的词。我们所指的过程对应的英文是Process,其含义是事物发展所经过的程序或阶段。它可以是生活和生产过程中的一系列行为,比如在不同网店上网购过程、在工业生产中的采购物流过程。它也可以是自然过程中的一系列变化,比如地震和台风传播的过程。人文主义者还对过程赋予了深刻的哲理。比如,卡尔.罗吉斯曾经说过:“Life
is a process, not a state ofbeing. It is a direction, not a
destination.”套用当下的流行语:“生命在于过程,不只是眼前的苟且,还有诗和远方”。
人类进入数字时代后,人类的生产和生活过程广泛在互联网和物联网中开展,积累了海量数据,数据蕴含了过程的规律。过程大数据的分析和利用,对人类动态、持续地认知、适应、改造生产和生活环境,具有重要意义。
过程数据按产生的时间性质可以分为同步和异步两种模式。语音、视频、气象等序列数据通过统一时钟等时间间隔采用得到,称之为同步序列。而神经脉冲、地震、交易等序列数据是由事件随机触发记录而成的,这样的数据之间在时间上是不等间隔的,称之为异步序列。比如,在脑科学中,神经元之间以异步的脉冲(Spike)传递神经信号。2014年IBM发布了类脑芯片
TrueNorth,集成了100万个“脉冲神经元”,能力相当于一台超级计算机,功耗却只有65毫瓦,主要是因为它采用Spike
NN结构,用类脑的异步脉冲来驱动电路,而非传统电路的同步时钟。从产生的机理来看,在物联网中大量传感器不断采集环境的各种信息,诸如温度、湿度等,这样数据的生成往往是单向的。另一方面,一些更复杂数据在过程演进中不断形成,是双向交互的,例如围棋棋谱、运动控制轨迹等。
原文链接:
https://mp.weixin.qq.com/s/bu1SNpsp03Uy23Z5vYnIFA