大数据文摘作品,转载具体要求见文末
编译团队|寒小阳 owen
我们收集、处理、分析和使用大量数据的能力对社会的各个方面都产生了深远的影响。这种转变导致了新兴学科数据科学的出现。诸多领域对数据科学的兴趣呈现爆炸式的增长,包括社会科学、自然科学和物理学等领域,涉及空前的规模和多样性的数据,通过集聚大量的操作和行为的信息来产生新的服务或收入来源的产业以及需要利用数据更好地造福社会的政府、社会服务和非营利机构。
这一新兴学科依赖于数学和统计建模,计算思维和方法,数据表示和管理和被研究领域专业知识的新的融合。虽然计算领域已经提供了许多支持数据科学的应用原则、工具和技术和诸多案例,计算机科学界也有机会作出新的研究进一步推动该领域的发展。此外,学界也有义务制定数据科学应用的发展指导方针。
包括统计,数学,社会科学,自然科学和计算机科学等在内的多个领域为数据科学的诞生奠定了一套强大的基础。事实上,传统的计算机科学研究的各个方面都在数据科学的发展中起到了作用。放眼未来,数据科学也将引领全新的计算研究。
以上的研究课题,以及许多其他的研究课题,都需要对系统、计算和机器智能方面的基础研究。
此外,像在许多其他领域的同行那样,计算研究人员日益成为科学数据的用户,正如许多计算机科学的分支那样(包括计算机体系结构、网络、软件工程、视觉、机器人、教育和用户建模),日益数据驱动化。保障价值和重复性方面我们需要借鉴之前的经验方法,包括适当的数据管理、严格的系统建模、测量和分析,以及对结果的呈现和解读的完整方法。训练所有的计算研究人员掌握基本数据科学技能已经正变得越来越重要。
让我们把眼光放得更远,数据科学为工业界、学术界和政府之间的理论和应用研究的创造性合作提供了新的机会。除了赞助研究,行业合作伙伴还可以提供有价值的见解,诸如在实际问题、数据获取,验证理论在规模数据或自然数据应用的能力以及以互补的方式寻求解决方案方面。学术界,反过来,可以提供创新的解决方案和软件,新的算法和替代方法的原则性分析。学术界也可以培养训练有素的数据科学骨干,满足行业的需求,并帮助合作伙伴探索尖端研究。这些合作伙伴关系也将有助于揭示数据科学的政策问题,相关的偏见,数据隐私,知识产权,使用适当性和监管问题。开放数据的提议和开源软件运动特别适合于数据科学,并将帮助使得其实现商业化和发挥影响。总之,工业,学术和政府数据科学的合作将有助于推动相互协作的新的模型。
最后,虽然数据科学提供了通过提高数据利用率以提高科学研究和决策许多新的机会,这些使用也带来了新的挑战。产生的数据语境及其使用的应用程序对数据科学的准确、公平和伦理要求也十分重要。这些数据科学的相关工作需要在计算机科学的亚领域间以及和计算机科学的多学科之间的合作。无论是学科内的和跨学科的技能都需要互相学习和支持。数据的产生和收集变得无处不在,数据所有权的概念也在发展,许多法律和政策问题将需要在此境况下被重新的考量。
为了了解如何符合伦理和负责任的使用和共享数据,计算机科学家需要协同领域的科学家、政策制定者和伦理学家以理解相关的风险和假设。例如,当回答有关个人和社会的问题(例如,在教育,经济政策和治安)时了解数据科学背后的社会科学是很重要的。这些重要的问题包括隐私,公平和透明度。为了更好地参与和服务于数据科学相关的新兴政策的探讨,数据科学计算研究人员需要开发能够兼顾道德、公平和责任的新的方法。
总之,计算研究界迎来了一个在定义和塑造新兴的数据科学领域的独特机遇。与统计人员,数学家,社会科学家,数据分析师和结构科学家和学科专家一道,计算机科学家可以发展新的基础理论,算法原则以及建立数据科学基石的系统。计算研究协也将致力于支持计算专业人员和其他人员为数据科学研究道德和责任的发展作出贡献。
关于转载
如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:[email protected]。
回复“志愿者”了解如何加入我们
史上导致数百万美元损失的10大计算机漏洞