正文
远望智库技术预警中心 邓艾琳 潘乐天
数据分析预测是国防部署和战略发展不可或缺的环节。
基于海量数据的搜集、筛选和梳理,大
数据预测将有利于对战备、后勤、人力、情报等进行更具洞察力和前瞻性的决策。
高度准确的预测不再遥不可及
数据预测旨在探寻海量事件背后的因果逻辑关系,从而对未来的事件进行预测。这实现了从仅仅叙述事件发生的后果,到对未来事件进行前瞻性预测的质变。
对传统分析而言,数据资源是彼此相对孤立的。而先进的分析能够连接数据的孤岛,全面把握事件之间的逻辑关系。更重要的是,前瞻性预测能够把握具体行动带来的全局性影响,判断事件的成败。
高度准确的预测不再是遥不可及
的,目前已“渗透”到国防各个部门。数据科学的突破,使得当下的数据分析已经具有以下特点:
1、突破技术壁垒;
2、入门门槛低;
3、性价比高。
与传统数据分析方法相比,一方面时长被大大压缩。从前需要几天,几个星期或几个月的过程,现在缩短到以小时、分钟、秒甚至毫秒计量。
在大数据的背景下,我们现在可以同时使用所有的数据,而不是只选择子集。
数据预测在私营企业如谷歌、亚马逊和脸谱网的应用已经十分广泛。
博思艾伦认为,在某种程度上,数据预测能够引领国防组织进入先知先觉的境界。高级预测分析和数据科学能帮助国防部门和组织实现数据预测的转型。
预测分析法的演变和突破
数据分析包括它是什么,它的作用,和它能做你却没有让它做的事情。
预测分析超越简单的纯叙述性的诊断分析。
一、分析传统方法劣势
纯叙述性诊断分析只能帮助国防组织确定当下的局势——人员装备情况、当下的武器装备情况,或者敌军正在变动的人员、资源或金融资产。
尽管目的同样是预测未来,但本质上,这还是一种提供后见之明的方法,没有解释为什么会发生这样的事情。
虽然许多国防组织采用诊断法,但它们通常仅限于做较低层面数据分析。
数据科学的进步使国防组织能够向高级诊断分析过渡,最终实现预测分析。
大数据时代来临之前开发的方法已经不适合当下。那时很多问题解决的前提是数据需有效和准确的存储,如分析寻找恐怖分子的资金和武器。如果分析师找不到联系,他们必须扔掉定制的数据结构,以新的假设、新的数据和新一轮的数据标准化为起点,重新开始。
这个过程使得分析师很难得到完整的事件全貌。有时他们找到的某个数据链或事件,极有可能不是最重要的,而且有成百上千的数据集需要筛选。他们常常别无选择,只能剔除大部分数据,选择他们认为对调查最重要的信息。这就使得数据分析的准确性有所降低。
二、高级诊断分析实现
首次突破
虽然描述性和低级诊断分析提供了重要信息给国防组织,但分析往往不能回答指挥官的关键问题,如,“什么是潜在的原因,在这里行动的影响?是什么结果?”
高级诊断可以回答这些问题,映射出复杂的数据连接方式。诊断还会显示哪些因素对单个事件影响最大,影响适中,影响最小。
预测分析里,我们可以“玩转整个数据库”。这些高级分析依赖于计算机模型来创建和思考任何可能的场景。分析并不能真正预测未来。它们只提供了在一次行动过后对事件展开方式的回顾,这是以过去事件展开的数据为基础进行类比得出的。
通过预测分析,我们可以从全新的角度考察问题。如果我减少基地民用飞机技工的数量,将如何影响后期维护?如果我切断一个恐怖组织在某国的资金流动,他们会想什么办法在什么其他国家集团设法弥补?如果我改变了维修周期对有些船会发生什么吗?
三、一个决定可能存在连锁反应
通过这种类型的“如果分析”,我们可以看到一个决定可能存在的连锁反应。
预测分析在评估风险方面特别有用,例如在进行战术决策时,或决定是否进行削减或投资。预测分析可以评估风险,并将其表示为数学概率。在平衡优先级和考虑权衡时,这为指挥官提供了强大的信息。
防务分析师可以插入他们正在寻找的某种结果,并询问分析人员其发生的可能,甚至可以通过预测分析得知如何计划取得重大科学突破,配置实验室学科专业最佳组合等。
四、辅佐人类的判断
下一个阶段是说明性分析。这个分析能为组织的目标需求和其局限性定量。在规范化分析后,数据科学家会与领域专家密切合作,建立组织的信息库,并推荐符合企业和组织的个性化建议。
智能手机“地图”应用的基础模型是街道和各种交通流,而映射给你的蓝色路线是经过定性分析后建议的最佳路径。
当然,无论是建议性质的分析还是预测性的,都不会替人做决定,分析只是一种工具,我们得到的结果只是事件发生的概率。决策者仍需要用经验、知识等来评估分析,更高层次的分析能提高决策质量和准确性。大数据背景下,机器实现其最大化利用,辅佐于人类的判断。
预测分析成功的原因
国防组织之所以能实现分析转型,是因为他们具备数据和分析能力的强大背景,而组织分析能成功将依赖于以下三个原因。
一、科技层面可行
1、传统方法技术壁垒难以利用和分析海量数据。
分析师分析数据之前必须首先建立严格的数据结构,然后格式化信息以适应结构。经常花费大量的时间只是为了调整数据结构,为分析做准备。对于每一条新的查询线,数据结构都是在繁琐的迭代过程中被分解和重建的。
而现今,我们实现了通过测试假设来查询数据,让数据“自己说话”来揭示模式。
是什么让数据预测从“数据写模式”走向“数据读模式”?
“数据写模式”下,我们必须首先决定如何进行分析,不仅仅定义了检查数据的选择,也限制了通过数据得出的问题。也就是说,在开始使用数据之前,我们已经大大限制了数据分析的能力。
“数据读模式”下,在进行分析之前,数据源中的每一块数据(如名称、照片、文档或新闻提要)都是用元数据标识的。数据的结构不再被限制,同时,不同的标签可以使我们找到特定的信息。我们可以以几乎无限的关键词尽可能准确的描述数据。
因为数据抽象层连接的所有数据都可以通过标记,不再需要时间密集的提取/转换/下载(ETL)框架。
2、数据抽象层的一个优点是它可以轻松地读取所有形式的数据,包括非结构化的,如照片和文本。
非结构化数据往往被排除在传统数据分析之外,因为他难以格式化。
3、机器学习的进步有助于对数据中的模式和相互关系进行搜索。例如:如果数据分析发现一个名字的不同形式,它会把不同的拼写机械地放在同一个人身上。但机器学习可以分析其地址与家庭关系,学习得到一个更丰富的关系网,形象地说,机器学习是允许数据之间相互“交流”的。
4、开放源代码和开放体系结构。传统的方法通常依赖于专有软件和体系构建。这一方面限制了系统灵活性,另一方面可能导致供应商高额垄断利益链条。新方法使用自由式开源软件(FOSS)和开放的架构,没有供应商垄断。
二、
预测分析实用性
首先,大多数的国防组织已经奠定了必要的分析转型基础。第二,先进的分析不是计算机科学家或其他专家在某个小角落里的专属领域。数据科学最引人注目的突破之一是,即使是没有专业计算机专门知识的人也可以自己使用复杂的分析方法来提高效率,洞察数据变化,做前瞻性决策。这样的因素使高级分析的门槛相对较低,因而实用性高。
同时,随着高级分析的出现,分析师和其他主题专家具有直接访问数据、探索数据的能力,可以提出直观的问题,寻找关键的模式和相互关系。
1、新的探寻数据工具——分析师和其他主题专家可以使用下拉菜单定制模块,以获得更为个性化的问题和答案。它们也可以创建不同的版本。
2、将可视化构建到分析组织——分析不仅进行查询,帮助他们理解和关注结果。这使得分析师能够更容易地理解信息,构建更好、更直观的查询,
3、数据输出安全性——数据的标记能帮助人们识别和定位,其安全性也同样能被标记,完全符合国防组织的政策。
三、
成本低,性价比高
先进的分析方法将大部分工作交给计算机,尤其是重复性和计算密集型任务。这大大降低了劳动力成本,同时加快工作进度。分析师无需费力地重建数据结构。
降低基础设施成本:传统的方法中,组织结构通常必须扩大自己的基础设施为他们添加的数据存储,设想一个合并两个数据源的电子表格,一个有100个字段的原始数据源,另一个是50个新数据源。为了把这两个来源结合起来,我们必须增加50个。有了数据抽象层,就不会浪费空间,从而可以存储其不断增长的数据。
国防组织可以通过预测和其他先进的分析能够有效地指导他们的预算决策,提高运营效率和投资回报率,实现更大的成本节约。此外,预测分析还可以通过帮助组织实现目标投资来节省成本。
最大挑战是打通数据孤岛
高水平的诊断和预测分析有能力绘制出复杂的关系的关键因素,然后说明什么具体的行动指挥官可以提高效率,降低成本,并支持作战人员。
国防部门面临的问题并非缺乏大量或是准确的数据,他们面临的挑战是将数据形成一个整体。像数据抽象化层的新方法,有可能使组织的整合和利用所有可用的数据。这些不仅仅是结构化数据,还有非结构化的笔记、视频、照片资料。通过预测分析,指挥官们可以开始观测他们可能采取的行动的可能影响。
一、前瞻性预测在计划准备阶段的重大作用
没有一个人, 甚至是一组决策者,可以充分考虑成百上千个变量之间复杂的相互关系。对于高级诊断,分析师和决策者可以快速建模,使得数据孤岛中孤立信息的复杂关系实现可视化。通过预测性的分析,我们可以看到改变了任何一个或一个以上会发生什么。因此,这种分析可以呈现最真实的场景。这使得决策者需要花更多的时间来评估权衡,而不是编译大量的数组。
这种远见可以帮助分析师和决策者梳理出复杂的权衡。例如,当船舶进入岸边修理设施,许多船员可能会被分配到的任务与他们的核心技能不相关。当船返回大海几个月或几年以后,有多少水手的核心技能退化,如何准确捕捉其真实的境况?其他的因素,如团队凝聚力,又将发生什么样的变化?预测分析能够权衡取舍后得出最佳的方案,找到最合适和理想的画面。
预测分析也同样能够显示具体投资的变化和成本削减带来的影响。这能够系统而全面的向决策者展示如何在不影响实际效益的前提下,最大程度的节省资本,实现利润的最大化。
二、前瞻性预测在计划后期阶段的重要作用
海量而分散的数据很难被集中利用形成整体。通过利用数据抽象层等新的数据处理方法,预测分析可以用来回答广泛的计划后期问题。某种变化如何影响维修中心规划和执行?维修特定类型的复杂设备和系统时,什么样的技能集和培训是最关键的?
在进行集成和分析数据时,如预测分析规划和执行,如在公共和私人造船厂的维修。指挥官需要预先知道哪些维护保养的工作需要在船上做,要多久,多少技师,以及其他各行业需要的人才,还有这要花多少钱。以前的设备供应/系统维护的数据可以对这些问题提供有价值的答案。然而,传统方法提取信息劳动强度相当大,通常作为指挥员只有有限的能力来回顾过去的数据对新的可行性方案。他们常常不得不依靠传闻的信息来获取。
数据分析现在可能会更进一步。通过汇集信息、预测分析,概率分析给指挥官特定船舶需要的所有可能性提供信息,如提供每一种修理方案可能需要的每种成本及后勤维修细节,包括需要什么样的人、什么技能、完成什么工作。如果指挥官关心这向工作会因为耗时太久而影响船舶运行,新的预测也可以迅速给出所需时间最短的新方案。
三、在人力管理方面的重要作用
先进的分析在人力资源管理和规划上同样具有重要的意义。现如今,管理层人员主要依赖于他们已经知道的技术理论——在招聘和挽留人才时,或在防止性骚扰的发生时。但是高级的预测分析能带来一些他们并不知道的东西——人与人之间的相互关系和事件背后的潜在影响因素,他们往往才是在人力资源管理时具有重大影响大的部分。
优化体系结构——
指挥官往往最多通过职业能力和能力测试评估与技术能力(或人/工作适合)相关的保留。这些信息可以在关系数据库中。
然而,根据军队人力管理专家的说法,招聘时往往具有领导力、文化适应力以及许多难以衡量的“软”因素,是最重要的。高级诊断分析可以查看所有这些因素,同时也可以揭示一些意外的模式。通过分析这些模式以及它们与个人招募信息的关系,预测分析可能为招聘人员提供了新的思路、装配最优秀的队伍
在网络安全操作中
——
预测分析可以从了解特定组织的威胁的性质开始。通过汇集大量的数据,分析可以创建一个的潜在攻击者和他们的攻击模式,在哪里他们可能攻击,国防组织有哪些漏洞,以及潜在攻击者能够利用漏洞进行攻击的程度。同时,可以看到对面的国防社区在网络安全人员,配合技能,能力和经验。
处理复杂的劳动力管理问题——
预测分析对于帮助指挥官解决超出传统数据分析范围的复杂问题特别有价值。例如,往往对于传统数据分析而言,识别具有更高的侵犯发生风险的军事单位具有很高的难度。
高级分析可以寻找许多潜在因素。例如,部队及其领导人的人口构成——性别、年龄、多样性、经验等——或特派团的性质,从而给出结论
这种分析方法也可以用于解决其他困难的劳动力管理的问题,如预防自杀、解决工作场所的歧视投诉和暴力问题等。
军事情报分析
——
预测分析使军事情报分析员能够快速地通过大量不同的数据进行排序,找到隐藏的模式和连接。通过先进的分析,所有的数据都安全地汇集在一起,供分析用。代替基于假设的方法,分析可以让数据本身说话。
随后的模式可以用来指导行动。例如,预测分析帮助美国的军事车队避开在阿富汗的路边炸弹和自杀袭击者。如果采用老方法,情报分析员选择最好的护航路线,但没有时间分析所有数据。他们只能挑选他们认为最有价值的数据集。大部分数据必须被搁置起来,尤其是非结构化数据,如手机抖动和视频图像。
然而,使用新的分析方法,分析人员能够利用所有的数据,实现结构化和非结构化的可视化。这使他们有能力预测一个城镇的哪一个路段,甚至哪条道路和交叉路口的攻击概率最大。