您的位置: 首页 >互联网 >

维基百科已经在互联网上最大的通用参考资源上实现了大规模

2019-06-06 17:03:53 编辑: 来源:
导读 维基百科已经在互联网上最大的通用参考资源上实现了大规模,开放的协作。但是,与许多协作式写作项目一样,制作内容可能是一个有争议的主题

维基百科已经在互联网上最大的通用参考资源上实现了大规模,开放的协作。但是,与许多协作式写作项目一样,制作内容可能是一个有争议的主题。

通常,多个维基百科编辑会对文章或政策的某些更改意见不一致。正式解决此类争议的主要方式之一是征求意见(RfC)流程。争吵的编辑将在一个论坛上宣传他们的讨论,其他维基百科编辑将会在这个论坛上发表意见,一位中立的编辑将做出最终决定。

理想情况下,这应解决所有问题。但麻省理工学院研究人员进行的一项新研究发现,虚弱的因素 - 例如过度争吵和措辞不合理 - 导致大约三分之一的RfC未得到解决。

在这项研究中,研究人员编制并分析了有史以来第一次全面的RfC对话数据集,这些数据集是在8年时间内完成的,并对经常关闭RfC的编辑进行了访谈,以了解为什么他们找不到解决方案。他们还开发了一种机器学习模型,利用该数据集来预测RfC何时可能过时。而且,他们推荐的数字工具可以使审议和解决更加有效。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士候选人Amy X. Zhang表示:“令人惊讶的是,有三分之一的讨论没有结束。”该论文的共同作者正在提交论文。本周的计算机支持的合作工作和社会计算ACM会议。“在维基百科上,每个人都是志愿者。人们正在投入工作,他们有兴趣...编辑可能正在等待某人关闭,以便他们可以回到编辑。我们知道,通过讨论,阅读工作并且解决一个大的审议很难,特别是来回和争议。[我们希望]帮助那个人做那项工作。“

该论文的共同作者是:第一作者Jane Im,密歇根大学信息学院的研究生; 维基媒体基金会的Christopher J. Schilling; 和David Karger,计算机科学教授和CSAIL研究员。

(不)找到封闭

维基百科提供了几个解决编辑纠纷的渠道,其中包括两位编辑解决他们的问题,将想法投入社区的简单多数投票,或将辩论带到一个主持人小组。之前的一些维基百科研究已经深入研究了这些渠道以及贡献者之间来回的“编辑战争”。“但是RfC很有意思,因为投票心态要少得多,”张说。“通过其他流程,在一天结束时,你会投票,看看会发生什么。[RfC参与者]有时会投票,但更多的是找到共识。重要的是在讨论中实际发生了什么。”

要提交RfC,编辑会根据文章基本“对话”页面中未解决的内容争议起草模板提案,并邀请更广泛的社群发表评论。提案的范围广泛,从对名人背景信息的微小分歧到维基百科政策的变化。任何编辑都可以发起RfC,任何编辑 - 通常是更有经验的编辑 - 他们没有参与讨论并且被认为是中立的,可能会结束讨论。30天后,机器人会自动删除RfC模板,无论是否有分辨率。由于参与者的压倒性协议,RfC可以通过近距离的正式结束,非正式地结束,或者保持陈旧,意味着在没有解决的情况下删除。

在他们的研究中,研究人员编制了一个数据库,该数据库包括2011年至2017年英语维基百科的约7,000次RfC对话,其中包括结束语,作者帐户信息和一般回复结构。他们还对维基百科最常见的10个关闭者进行了访谈,以便在解决争议时更好地了解他们的动机和注意事项。

分析数据集后,研究人员发现大约57%的RfC正式关闭。在剩余的43%中,78%(或大约2,300)在没有非正式解决方案的情况下仍处于陈旧状态 - 或者在研究的所有RfC中约占33%。结合数据集分析和访谈,研究人员随后充实了解决失败的主要原因。主要问题包括初步论点不清晰,发起人不清楚问题或撰写故意偏见的提案; 在讨论过程中过度争吵导致更复杂,更长,更具争议性的线索,难以全面审查; 并且简单地缺乏第三方编辑的兴趣,因为主题可能过于深奥,以及其他因素。

有用的工具

然后,该团队开发了一种机器学习模型,通过分析文本,维基百科页面和编辑器帐户信息的60多个特征来预测给定的RfC是关闭(正式还是非正式)还是过时。在讨论开始后的一周内,该模型可以准确地预测失败或成功率达到75%。他们发现,预测的一些更具信息性的特征包括讨论的长度,参与者和回复的数量,文章的修订次数,主题的受欢迎程度和兴趣,讨论参与者的经验以及粗俗程度,否定性和评论中的一般侵略性。

有一天,RfC发起人可以使用该模型来监控正在展开的讨论。“我们认为编辑们知道如何针对他们的干预措施可能是有用的,”张说。“他们可以将[RfC]发布到更多[维基百科论坛]或邀请更多人,如果它看起来有可能无法解决。”

研究人员建议维基百科可以开发工具来帮助关闭者组织冗长的讨论,在一个线程中标记有说服力的论点和意见变化,并鼓励合作关闭RfC。

将来,模型和提议的工具可能会用于涉及大规模讨论和审议的其他社区平台。张指向在线城市和社区规划论坛,公民在这些论坛上对提案进行权衡。“人们正在讨论[提案]并对其进行投票,因此这些工具可以帮助社区更好地理解讨论......并且[也]对提案的实施者也有用。”

张,我和其他研究人员现在已经为各级专家编辑建立了一个外部网站,可以相互学习,更轻松地监控和结束讨论。“更接近的工作非常艰难,”张说,“所以人们缺乏关闭这些讨论的人,尤其是困难,更长,更重要的讨论。这可能有助于减少进入的障碍[让编辑成为闭门者] ]并帮助他们合作关闭RfCs。“

“虽然令人惊讶的是,这些讨论中有三分之一从未得到解决,但更重要的是讨论未能完成的重要原因,最有趣的结论来自于定性分析,”教授罗伯特·克劳特说。卡内基梅隆大学人机交互的荣誉。“研究中的一些研究结果超越了维基百科,可以应用于其他环境中的许多讨论。” 他补充说,可以做更多的工作来提高机器学习模型的准确性,以便为维基百科提供更多可操作的见解。

该研究揭示了一些RfC流程如何“偏离既定规范,导致效率低下和偏见,”维基媒体基金会研究主任Dario Taraborelli说。“结果表明,参与者的经验和讨论的长度可以很好地预测RfC的及时关闭。这为如何使新移民和代表性不足的成员更容易获得与治理相关的讨论的问题带来了新的实证证据。组“。


免责声明:本文由用户上传,如有侵权请联系删除!

最新文章

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ   备案号:

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。

邮箱:toplearningteam#gmail.com (请将#换成@)