Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。
开源调查
“开源调查”作为一个公开的数据项目,是由 Github 和其他来自学术界、工业界以及广大开源社区的合作者共同发起的。
概述
通过与来自学术界、工业界以及社区的研究人员合作,Github 设计了一项调查,旨在收集关于开源软件开发实践和社区情况的高质量的特色数据。
我们通过对 Github.com 上的 3800 多个开源库中的 5500 个随机样本,以及来自其它平台上的 500 多个非随机样本进行收集整理,生成了一个数据集。该数据集全面涵盖了使用、构建和维护开源软件的开发人员的工作态度、经验和背景等要素。
思考
2017年的调查问卷准备了50多道问题,涉及面广泛。下面,我们将重点介绍一些对于社区来说最具可行性的重要见解。
下面这部分的描述数据只包含 Github.com 开源库上的随机样本。我们(对统计结果)进行了取整,可能导致占比汇总结果不为 100%。
文档质量十分重要,是一个社区兼容性和易用性的重要途径,却常被开发者忽视。
负能量虽不常见但是不容忽视,直接影响项目(参与者)积极性。
开源项目全球共享,但是贡献者却没有充分地站在用户的角度思考。
使用和参与开源项目常常在工作过程中进行。
开源是软件首选。
文档质量十分重要,却常被忽视。
文档是新手的入门指南,它能帮助你如何使用项目,回馈项目,了解相应规定条款,以及社区行为准则。所以说改善文档质量也是对开源的一种贡献。
93% 的被调查者表示文档不完整或者更新不及时是普遍存在的问题,同时有 60% 的项目贡献者表示自己很少或者从不整理文档。所以当你遇到了有问题的文档,希望你能帮助修正它,然后向项目维护人员发起一个 Pull Request。(# 译者注,Pull Request 是 Git 的一个功能,你复制了别人的项目,并对其做出修改,然后发起一个 Pull Request 给作者,让他看到你的修改,如果他愿意就可以直接更新到项目里。)
许多人参与到开源项目的工作中,因此项目使用条款的可靠度就变得至关重要。显然,项目版权协议不管对用户还是贡献者来说都是最重要的一种文档:64% 的人觉得版权协议是决定是否使用该项目的重要依据,67% 的人觉得这是决定自己是否要参与该项目的决定因素。
文档能帮助我们构建更具兼容性的社区。那些能清晰解构项目流程的文档,比如项目指南和代码标准,则更被开源界的非主流群体所重视,比如妹纸。
差不多有四分之一的开源社区的用户英文读写水平不太理想。在讨论项目的时候,尽量使用清晰易懂的语言,这样能帮助那些母语不是英语用户的或者阅读能力有限的开发者更好的沟通。
负能量虽不常见但是不容忽视,直接影响项目(参与者)积极性。
开源项目的参与者遍布全球,相互之间存在分歧也很正常。尽管不会导致严重的问题,但是开源项目的开放性却在无形中强化了负能量的传播效果。
因此,负能量的波及范围实际上远远不至那些亲历者。树立正能量,及时控制负面影响,能有效保护项目参与者的积极性,保证合作质量。
有 18% 的被调查者表示自己在参与开源项目的过程中与其他用户的发生过矛盾,而有 50% 的被调查者表示对其他人发生的矛盾冲突耳闻目睹。我们不知道为什么这两个数值相差这么大,到底是因为那些不愉快的经历导致当事人已经离开了开源项目,还是因为所谓“坏事传千里”才导致这么多人知道。但不管是哪一种原因,都能说明这些负能量的确造成了严重的连锁反应和间接影响。所以快速、得体、公开的问题处理机制就变得十分必要,它能给广大潜在的贡献者释放一个信号,那就是,绝不容忍这种不好的非主流行为出现。
目前,(我们统计中)最常见的不良行为是粗鲁无礼(45% 的受访者遭遇过,16% 亲历过),其次的就是人身攻击(20% 遭遇,5% 亲历),再有就是偏见成见(11% 遭遇,3% 亲历)。更严重的情况,比如性骚扰、跟踪或者被人肉也分别有不足 5% 的人遭遇和 2% 的人亲历过(累计遭遇比例为 14%, 经历比例为 3%)。
负能量对项目健康度有实实在在的影响。 21% 的遭遇或者亲历者表示他们会因此终止该项目,8% 的人会转到私有项目上。
应对骚扰行为最有效的方法就是为用户配置相应的工具,随时随地可以自主处理遇到的麻烦。有报道称,直接屏蔽(不好的)用户比第三方的手段(比如维护人员、ISPs托管服务,甚至还包括法律手段)效果更好。我们要给大家提供能够保护自己的有效工具。
开源项目的贡献者没有充分地站在用户的角度思考
开源项目为全球用户提供了技术基础。从某种角度来说,项目贡献者做到了充分照顾用户的多样性问题,但是更多的情况下,这两者之间依然存在鸿沟。
提升项目的开放性才能汇聚更多的力量,提供一套完整的技术需求分析和实用案例,能促进其在技术领域有更好的表现。
开源项目中的性别失衡仍然很严重:被调查者中男性占 95%,女性只占 3%,其他 1% 。女性表示她们和男性一样都对以后继续参与开源项目很感兴趣(68% 比 73%),但是她们不一定真的会那么做(45% 比 61%)。
在其他方面表现更明显: 1% 的被调查者属于性别不明(# 译者注,transgender 指性征与性别不相符的人。)(包括开源中 9% 的女性),7% 是女同,男同,双性恋,无性恋以及其他少数性取向。 26% 是移民(来自世界各地的移民)还有 16% 是所在国家的少数民族。
与男性相比,女性更容易遭受语言暴力(25% 比 15%)、偏见成见(12% 比 2%)以及性骚扰(6% 比 3%)。理所当然的,女性则更愿意向熟悉的人(22% 比 6%)直接求助(29% 比 13%),而不是在公共论坛里向陌生人求助。跟陌生人合作是开源的最大特点:让我们努力营造一个关系融洽的社区氛围。
有一半的贡献者表示,他们在开源工作中的经验对自己现在的角色地位发挥了一定的甚至重要的助推作用。开源工作帮助他们提升了在业界的影响力。提高贡献者的代表性能帮助建立一个更具代表性的技术部门。
开源的使用和贡献大都发生在工作当中
开源被广泛使用在专业环境当中。很大一部分参与调查的公司职员是在工作中使用并贡献了开源,同时有很多人把自己的开源工作视为获得当前职位的重要基础。
然而,有很多人说自己公司的官方政策和知识产权协议中没有明确哪些是允许的(被开源),或者是在什么条件下才是被允许的。企业给参与开源的员工进行补贴,能够释放一个明确的政策信号,以此鼓励大家更加积极而持续的参与其中,从而对开源发挥了关键的作用。
有 70% 的被调查者是全职或者兼职的,另有 85% 的人也在软件开发过程中以各种方式(比如,软件开发者、设计师或者开发领域其他角色)在本职岗位上或多或少的对开源做着自己的贡献。
几乎所有的雇员(94%)都在他们的专业领域使用过开源(81% 的人经常使用),65% 的反馈者是把反馈开源作为自己工作的一部分。
大部分人说自己的老板能够接受并且鼓励使用开源应用(82%)或者在自己的代码中引用开源代码库(84%),但是也有一些人表示老板对使用开源态度含糊(应用:13%,引用:11%)。
近一半人表示老板的知识产权政策允许他们可以自主开源(47%),还有 12% 可以在获得批准后开源。然而,28% 的人说他们的知识产权政策(在对待开源上)不清不楚,还有 9% 的人表示自己并不清楚知识产权政策的相关规定。
开源已经成为软件首选
在选择新软件时,安全性十分重要,大部分的用户认为开源的才是安全的,至少平均来说,比闭源的商业软件要好一些。当讨论到稳定性和用户体验的时候,开源似乎就没那么有优势了。尽管如此,还是有很多人致力于开源,并随时准备使用开源备选。
开源的优势在于安全性:这也是使用软件时特别要参考的特性之一(86% 的人认为这一点十分重要或者极其重要)。安全性也是唯一一个让大部分用户都觉得开源软件明显优于商业软件的方面。(58%)
当然,用户在选择软件的时候也很关心稳定性和用户体验(分别有 88% 和 75% 的人认为这一点特别重要),但是在这些方面就没有多少人觉得开源有优势了:只有 36% 的人认为开源在用户体验上做的更好,30% 的人认为开源在稳定性上更好一些。
尽管有上述顾虑,用户们还是更喜欢开源。72% 的人表示在选择新的工具时会首选开源。
数据
开源调查是一个公开的数据项目。你可以下载数据自己来研究。
这些数据和问卷都是在 CC0-1.0(知识共享协议)标准下发布的。有关隐私、引用和商标的重要信息,请参阅存储库。
关于调查
目的
在当今的信息化社会里,开源几乎为我们的社会和经济的各个方面提供着支持。开源社区的可持续发展是其技术和服务赖以生存的条件。因此,关心那些搭建、维护和使用开源项目的人们,就显得非常重要。
我们围绕深入了解热开源社区等相关主题设计这个调查旨在为提供高质量的数据,并摸索一些研究方向。
设计
这项调查是与来自学术界、工业界和开源社区的研究人员和相关参与者共同设计的,根据设计原则,聚集科学的严谨性、受访者的隐私和开源/数据的价值。我们专注于选择那些能够提供可操作的见解和开辟新的研究途径的主题,包括:
关于消费和贡献的行为和偏好
网络空间隐私的态度和做法
寻求并提供技术帮助
消极的经历,及其后果
使用和贡献开源的雇主政策
开放源码参与者的人口统计,以及他们的技术历史
我们还尽可能的从其他研究中调整了部分问题,以便与其他人群进行比较。在 GitHub.com 网站上,受访者按照流量和资格活动中进行随机抽取,然后邀请他们通过对话框完成调查。我们还从 GitHub 以外的开源社区中收集了一个小样本,通过邮件列表或者类似的渠道发出邀请。调查问卷被英语、西班牙语、汉语、日语和俄语进行填写。主题、调查问卷、翻译、设计和抽样计划都被发布在公共的 GitHub 库中,供大家查阅和反馈。在提供下载的数据中包含了更多关于方法论的详细信息。
鸣谢
这项调查是由 GitHub 策划的,它提供了来自研究和开源社区的宝贵意见。我们特别感谢:Anna Filippova(卡内基梅隆大学),Andrea Forte (德雷克塞尔大学),Edward Galvez(维基媒体基金会), Rebecca Weiss(Mozilla基金会),和 Laura Dabbish (卡内基梅隆大学)等人在,问题研究和问卷设计等方面做出的贡献。感谢那些响应离线取样的社区成员协助翻译并帮助改进相关问题,以及所有问卷调查的参与者。
英文原文:http://opensourcesurvey.org/2017/
译者:WDatou