专栏名称: 国际新闻界
新闻传播学科唯一的国家社科基金首批资助期刊、全国中文核心期刊、全国新闻核心期刊、中文社会科学引文索引(CSSCI)来源期刊。
目录
相关文章推荐
弗雷赛斯  ·  大势所趋!更多期刊将支持“一稿多投”! ·  1 周前  
弗雷赛斯  ·  SCI查重,你可能已经被坑了... ·  1 周前  
51好读  ›  专栏  ›  国际新闻界

人作为计算机的“他者”:验证码人机互动中的能力主义陷阱

国际新闻界  · 公众号  · 科研  · 2024-11-15 14:58

正文

本刊官方网站:

http://cjjc.ruc.edu.cn/

摘要

验证码(又称逆向图灵测试)似乎成为当前互联网用户注册、登录和执行某些操作的必要程序。尽管已有批评者指出验证码设计给特殊人群带来的识别和输入等障碍,当前却鲜有研究从技术哲学的角度解构这种验证机制的技术本体论。验证码技术展示了一类人机互动的关系倒转情境:计算机从作为“他者”的技术,摇身变为对人提问的考官,甚至开始界定和拷问人的本质,人则从“主体”蜕变为技术的“他者”。本文引入技术哲学和技术现象学相关理论,讨论逆向图灵测试如何介入并影响了人对于“人是什么”这一问题的回答与实践。文章分析了“我验故我在”人机互动隐含的身体观和能力主义(ableism)预设,以现实案例揭示逆向图灵测试的发展如何进一步将人制造为技术的“他者”,扩大了能力主义隐含的否定辩证法(negative dialectics),最后通过展示“缺陷”和“连接”的技术方案,讨论去能力主义(dis-ableism)的可能性。


作者简介

谢卓潇,南京大学新闻传播学院助理教授。


蔡聪(通讯作者),中国社会科学院大学传播系博士生。


基金项目

本文系国家社科基金青年项目“移动性视角下视障者的无障碍传播现状及其对策研究”(项目编号:22CXW010)和“2024年中国社会科学院大学研创基金:脆弱群体数字生计的协同演进与环境协商(项目编号:2024-KY-142)”项目的阶段性成果。




“完成验证码来证明你是人而非机器”是大多数上网者需要应对的日常。具有视力、听力或智力障碍的网民时常因无法辨识及完成验证而被机器告知:“我的算法认为你不是人类”,使得被剥夺尊严和被歧视的感受如影随形(Nakamura, 2019),面对机器越来越有难度的询问,普通人对验证码的抱怨也越来越多,网络中“奇葩验证码”的戏谑讨论不绝于耳。相反,ChatGPT等人工智能不仅作为考官随时可能质疑网络使用者的主体性,还可以动用其他的人工助手来破解机器自身暂时难以解答的题目,譬如冒充视障者向他人求助(方晓,2023),在验证与被验证的两端考验着人类的存在。


本文认为,验证码技术的产生、发展与使用体验过程中,人机互动经历了多番博弈,这种较量背后暗含着技术等级划分和能力歧视。视障者等存在身体“缺陷”的群体在其中的遭遇,则揭示出验证码技术背后人类共同面临的“能力”悖论。本文从验证码这种最为日常的人机互动实践出发,讨论“我验故我在”的验证机制所隐含的身体观和设计者对人类独特能力的想象,进而省思人机关系设定背后的技术哲学问题。


我验故我在?从质询“人性”到

生产“新人类”话语


验证码(CAPTCHA)是Completely Automated Public Turing test to tell Computers and Humans Apart(全自动区分计算机和人类的图灵测试)的缩写,指一种区分用户是计算机与人的公共全自动程序,目的是防止使用自动化脚本、机器暴力破解密码、刷票、论坛灌水等被视为恶意的行为。与人向机器提问来判断其心智的图灵测试过程相反,验证码通过机器向使用者提问,从而分辨出答题者是人还是机器,因此又称逆向图灵测试。


20世纪90年代,对于非法用户注册等行为,许多大型的基础服务(meta-services)不堪其扰,雅虎邮箱为了阻止垃圾邮件,与密码学专家路易斯·冯·安(Luis Von Ahn)合作,首次引入图形化验证码。他指出,验证码的内核就是创造一种AI密码学:“容易被人类解答,并且让机器无法解答”的最佳程序(Von Ahn,Blum,Hopper & Langford,2003)。这也成为网络人机攻防战的底层逻辑。


随着智能化趋势加速,逆向图灵测试的设计者和使用者陷入了实践悖论:第一,CAPTCHA提出的问题要容易被人类解答,并且让机器无法解答。第二,人希望机器在能力上发展到接近人类,甚至超越人类,但验证码填写时却相反。第三,人与机器的区分基于健全人身体“能力”为操作前提,不具备“健全人”的视觉、听觉和智识的人,很容易被排除在人和机器二分的想象之外,而事实是越来越多“健全人”无法通过验证码的考验。简言之,验证码的设计显示了设计者对机器不能做什么与只有人类能做什么(人的独特能力)的想象。前两者属于技术导向的矛盾,科技领域一直在力图调和。第三个悖论则更为隐性,却是在崇尚技术进步的时代所有自许为人者面对的恐惧和危机:人无时无刻不处于被机器非人化判定的风险之中。


(一)智能化的人机互动介入“人性”省思


验证码在呈现方式上虽与一般意义上的人机交互形式不同(例如生成式的人工智能、聊天机器人),然而程序设置计算机“向人提问—获得反馈—作出判断”的模式实际上具有人机互动的基本特征。随着计算机智能化发展关于人机互动中“人与非人”的区分、人与“非人”的人工生命(artificial life)之间交往协作的讨论日益普遍。学者们意识到,当前人机互动中人工智能通过大语言模型的海量数据学习,愈加接近普通人的言行和思考模式,塑造了新的“常人”(刘海龙,连晓东,2023),机器模拟的人类心智能力带来了非人化的恐惧,和对人性价值的省思(杜骏飞,2023;彭兰,2023)。语言系统的混合使得机器像人一样说话,人像机器一样说话,则更进一步使人类深陷自我认识的危机(王沐之,胡翼青,2023)。


人与机器的能力差异问题随着智能技术的发展愈加受到关注,人机交互则提供了更多理解机器“智能”的方式和省思“人性”的情境(胡泳,2024;彭兰, 2024),本文关注的验证码也是其中之一。在人工智能的研究派系中,图灵测试基于符号主义理念,认为如果机器模拟的人类语言不能被人类所察觉,那么就可以认为这个机器表现出了等同于人类心智的能力(Turing,1950)。当前人工智能主流学界基本沿袭了近代西方的理性主义哲学(如霍布斯、笛卡尔、莱布尼茨等)对人类心智活动的基本假设,认为人类或机器的智能从原子化、形式化、逻辑化的抽象层次上看可以类比(王颖吉,2018)。然而,在《计算机不能做什么》(What Computers Still Can't Do)一书中,休伯特·德雷福斯(Hubert Dreyfus)(1979/1986:214-233)批判了图灵追寻者的人工智能构想,以及背后对人性的预设。他认为,早期的符号主义人工智能一派是西方理性形而上学遗产在当代科技领域的运用(王颖吉,2018)。此类哲学观隐含了身心二元的预设,因为根据确定的规则和形式逻辑加以符号化操作和模仿人类心智的人工智能模型忽略了躯体在智能行为中的作用。


本文结合更广泛的技术社会语境来认识验证码这一日常化的计算机程序背后的 技术思想。尽管已有批评者讨论了验证码给特殊人群带来的识别和输入等障碍,当前却鲜有研究解构这种以机器向人类提问来确认用户是真人还是计算机的验证机制的技术本体论。因此,本文从验证码的案例出发,思考人机互动过程如何影响或者介入了人对于“人是什么”这个问题的回答与实践。


(二)人机互动中的技术“他者”与“自我”对照


人机互动情境中设问与回答“人是什么”,经常需要通过不断制造技术“他者”,从而框定“人性”。整体而言,人工智能技术发展引发的当前人类社会对“他者”和“自我”审视都日益显著(彭兰,2024)。不同的是,人机关系的权力天平出现了大幅度的摇摆。智能机器从早期的“低人一等”的“他者”俨然变成接近乃至僭越人类的存在。


彭兰(2024)认为,人机交流过程中,智能机器是人类自我认知的“镜子”,映照自我的同时,人工智能差异的、建构的和从属的“他者”性也深刻影响了当前的社会运转。整体而言,当前思考人机交互的社会影响更多集中在人类对机器的审视,以及人类面对机器时的自我反观。对于人类来说,技术的“他者”性显而易见——无论它们对人类来说是俯首称臣还是居高临下,但人类作为技术他者的情境和体验却隐而不张。在网络环境中,尽管有些群体处于被绝对他者化的位置——例如面对验证码的视障者,但更多人面对“请问你是人吗?”这样的质问时似乎并无此感受。


在残障批判研究中,残障者作为社会和科技领域的“他者”,在技术应用过程中残障身体时常遭遇“他者化”与非人化对待的案例比比皆是(Mills,2011;Guberman & Haimson,2023)。例如,在诊疗和技术修复自闭症的方案里,自闭症谱系者与外界的交流方式被简单粗暴地类比为人机界面互动,因而被视为“机器人”(Guberman & Haimson,2023)。纵观计算机技术领域的发展历程,残障常常以三种对象化的观念出现:被视为需要干预的问题(a problem to fix)、思想(或实际)实验的资源(a resource to extract)、技术排斥或伤害的事后思考(an afterthought to excuse)(Wu,2021)。可以发现,这三种情境或多或少都指向着某种将残障人他者化的关系类型,背后设定了有关残障人(缺乏能力的身体)与健全人(有能力的身体)、技术(技术功能正常运转)之间“我们”与“他们”的实质的分野。正是因为残障者在健全社会中的“他者性”过于常见(葛忠明,2015),当残障者被排斥为他者时,非残障者很难将这些“他者”的情况带入到自身,更容易视之为另类情况的叠加。在思考验证码人机关系时,这种观念就有可能阻碍了作为整体的人类理解自身和机器的“它异”关系(伊德,1990/2012:102-105),对于人机互动时自己也成为一般化“他者”的状态视若无睹。


针对图灵等符号主义人工智能以及背后身心观,批判观点表明,心智的形式化和符号化操作智能模型忽略了身体存在和感知所构成的“人性”和“智能”。彼得斯认为,身体始终存在于交流之中(Peters,1999)。德雷福斯的现象学批判强调了躯体在智能行为中的作用,例如,躯体化的信息加工、躯体技能的习得性。援引海德格尔和梅洛庞蒂思想,他指出:“关于人及其智能行为能力的新概念,实际上是一种对人为满足他的需要所做的技能性、躯体性的活动如何生成人类世界的分析”(德雷福斯,1979/1986:289)。在这个意义上可以说,计算机技术的智能化发展中——无论它有可能是彰显还是隐匿身体,最终其技术本体论仍需关涉某种对身体存在和躯体能力的想象性维度。


本文借由验证码一般化场景的体验和残障者的实践,反思逆向图灵测试人机互动背后的理性主义身心观念,以及伴随而来的对“技术他者”的身体和心灵的否定,审视特定人机互动过程对身体和心灵能力的安排和预设。研究具体围绕三个问题展开分析:


RQ1:在各类人机互动场景中,验证码体现出何种身体/能力的技术设定?


RQ2:人机交互体验中的验证码如何折射人与机器的关系变化,人类经由验证码制造了什么样的“自我”与“他者”认识?


RQ3:针对验证码人机互动的技术关系反思能为我们带来什么样的新技术想象与路径变革?


研究方法


本研究从技术现象学视角出发,关注人类经验技术的范围和各种形式,以及以技术为中介带来的“人—技术”关系变化(伊德,1990/2012;伊德,2008)。更具体来说,研究受到“后现象学”视角的启发,强调结合经验主义和实用主义采用具体的(经验的)方法来研究多样化的技术(伊德,2008:30)。基于这一视角,本文分析验证码这一技术物具体的构成、与人类的身体知觉互动和它们在生活世界中衍生的人—技术关系,并进一步讨论验证码可能带来的人机互动感受和技术关系的变化。在这个意义上,本文以现象学阐释为主,同时结合批判残障研究的观点来讨论所阐释的研究材料。


本文使用的分析材料包括网络公布的验证码技术专利、论坛中的验证码讨论和设计分享、验证码研究文献,以及验证码的各类用户体验报告。笔者浏览腾讯云和阿里云服务主页,以及阿里安全、顶象论坛和36氪等网站,结合计算机最新的验证码研究综述,梳理了有关验证码类型学和主流网站的验证码服务的发展历程。两位研究者结合自身的网络使用体验(一位是残障者,另一位是非残障者),通过访谈和网络资料整理,归纳验证码变革过程中的残障用户和非残障用户的体验变化。研究搜集了视障社群内部不同时期有关验证码障碍的多次讨论,对残障技术论坛(争渡识图和天坦读屏)两名视障开发人员进行了访谈,还向不同的网友征集验证码的使用反馈,获得大量的验证码失败的截图。随后为了交叉检验,笔者在社交媒体小红书上检索和筛选了19篇发帖,内容涵盖国内外知名网站的验证码。研究者对所获得的材料进行归类与核心内容摘编,选择其中的典型案例作为分析材料。


人机交互体验中的验证码:

技术“他者”的产生与扩大化


验证码的设计初衷是为了排除机器干扰,用简单易操作的方式维持普通用户环境秩序。然而,验证码在文字、图片、游戏、数学验证等内容设置与发展过程中,认知能力的要求越来越高,成为逆向图灵测试人类存在的隐含必要条件。验证码中“我思故我在”是如何日益变得复杂的呢?本节将还原验证码的技术演进过程中的人机交互体验,及其演变的逻辑,进而讨论“他者化”体验是如何变得日益普遍的。


(一)白名单上的“他者”


图片类的测试是出现最早、应用最广泛的一类验证码。2000年初国内多家网站引入验证码时,首先陷入困境的是视障人士。中重度视障者使用电脑需要通过屏幕朗读软件作为中介,而早期的屏幕朗读软件只能朗读出系统中添加了无障碍标签的文本信息,因此以图片形式或者图形化界面为基础的验证码成为其接入互联网的屏障。


国内视障人群集体反映验证码问题始于与腾讯的互动。2004年腾讯推出QQ“在线时长等级服务”,引发了“挂太阳”热潮。QQ账号此后频繁遭到自动化程序的暴力破解,腾讯验证码因此产生(腾讯技术工程官方号,2011)。当时以电话拨号上网为主,电脑每重启一次设备就会更换一个IP,机器便判定为异地登录,要求输入验证码。随着电脑、屏幕朗读软件在视障群体中的普及,QQ验证码的问题越发突显。2006年,中国盲人创业网倡议解决视障用户的验证码问题,随后国内几大盲人网站也跟进发出《倡议书》,号召视障人共同签名反对验证码。经多次沟通协商,2007年7月腾讯推出“白名单计划”,盲人网友可以向腾讯申请加入“白名单”。腾讯通过后台人工处理让“白名单”内的用户不再有填写验证码的要求(中国盲人协会,2007)。这一举措暂时解决了部分视障QQ用户的需求,但实际上白名单的做法将视障者面对图片验证时的问题归结于个人“无能”,用保护的名义将视障者等非“健全能力”的用户加以区隔,而不是修改视觉验证策略让“技术他者”自主融入。


QQ的问题用白名单暂时解决,但验证问题在更广阔的互联网世界中依然层出不穷。随着互联网深度嵌入视障群体生活,视障人将其在物理空间中的人工辅助策略迁移至互联网空间。在日常生活中,视障者会寻求身边的人帮看验证码,或组合全屏截图技术与即时通讯功能将验证码截图发给在线的好友。然而,验证码的输入时效隐含着效率能力想象,超时便会要求重新填写。如若无法及时得到好友回复,当次截图便宣告失败,这限制了视障者的熟人关系求助策略的有效性。利用QQ的即时通讯属性,有视障者将人工求助的关系范畴拓展至半熟人关系,建立起视障者和非视障者共同的QQ群,通常被称为“某某验证馆”,笔者之一曾加入过类似的QQ群。视障者在遭遇图形验证码时屏幕截图发到QQ群,因为群中人数众多,还兼有聊天功能,几乎可以马上得到响应。然而,聊天群求助也存在弊端,在群聊信息密集的时候,截屏求助的图片也会被遗漏。


此外,拥有技术资本的视障者开辟了另一种把陌生关系的视障者和非视障者聚集起来的路径,即隔离的客户端。帮帮听图与争渡识图是曾经占据市场的两款主要软件。它们由视障用户和志愿者两个客户端共同构成。在视障者用户端,通过快捷键完成截图,发送图片,收到回复,将收到的文本粘贴到对应的文本框中即可。志愿者端则是等待图片任务的界面,收到验证码截图之后,将肉眼识别的信息填入并发送回去。同为视障的争渡识图开发者称:“我们还做了一些技术优化,让它截图可以尽量围绕光标所在的焦点,这样可以截取到验证码的图片,又不会像截全屏一样泄露用户的隐私”。在客户端的界面中,争渡识图还专门加入了当前志愿者在线人数和累积验证码识别数。这一方面帮助视障者判断当下能否及时得到回应,另一方面也是对志愿者的情感激励。同样由视障者开发的帮帮听图则由中国残疾人联合会和中国盲人协会共同购买版权,在盲人群体中推广,为其提供验证码服务。


在这一阶段,尽管也有非视障者因为扭曲的字符需要反复填写验证码这类的负面体验,但更多时候人们是以视障人帮助者的角色,强化视障者作为技术他者的想象。


(二)从技术“例外”到普遍“他者”


随着黑客与网站验证的攻防战加剧,验证码填写给越来越多人带来上网障碍。在提升难度的验证码面前,更多人有了技术“他者”的体验,铁路12306网站一段时期的“奇葩验证码”便是典型一例。它最早引起网友讨论和媒体报道,甚至被网友恶搞出“在白百何、王珞丹中选出谁是白百何”等迷因。讨论文章指出,12306等网站加大验证码难度的出发点在于“让人类都难以识别,这样机器学习就会非常困难”。这一做法在打击黄牛刷票方面取得了一定的效果,同时也“极大地伤害了用户体验”。


上述验证码的争议实情如今难以查证,但它触及现实体验却相当真实:当人们 置身于“春运抢票”这一场景中,无法通过机器判定的人就成为了情境化的技术他者。在这一刻,白名单之外也出现了“他者”,残障与非残障者填写验证码受挫后被网络平台排斥的愤怒产生了共鸣。然而,这种共情时刻并不常见,直至近几年网络平台账号安全问题升级,验证码带来的障碍体验才愈加突显。


根据论坛讨论和用户社交媒体发帖,我们将各类验证码反馈的问题总结为以下情况:第一,感官(以视觉和听觉为主)能力差异导致验证码信息读取障碍;第二,验证码题项或内容暗含的社会文化差异(语言、社会生活、流行观念、理论知识等)导致理解障碍、无法选出答案;第三,对人机交互设置(时效、视窗操作、旋转)理解或操作障碍;第四,验证码设计与人机交互界面的设置冲突导致信息读取障碍,这在视障者中尤为突出。


一方面,为了呼应国家环境和信息无障碍的法律政策要求,许多网站的确努力尝试在出题或交互设计层面来改良验证码。另一方面,网站为了限制脚本机器人和黄牛等非法用户,仍在刻意提高验证码内容答题难度。


如今,各类网民与各大平台不断升级的验证码斗智斗勇的故事仍在书写。随着人工智能生成内容(AIGC)参与到验证码的生成过程,AI一秒钟内生成数万张不重复图片的“能力”,使机器造验证码来识别人的“敌托邦”成为现实。这些人类读不懂,机器却能理解甚至能破解的验证码带来的人机交互体验,让使用者频频使用“拼命”“离谱”“极度痛苦”等词语来形容,却又无法在日常登录时绕过。


图1:腾讯的AIGC验证码


图2:某网站验证码


至此,本文认为,验证码技术发展带来的人机交互体验始终持续制造着个体化、情境化的技术“他者”。面对验证码,残障人(尤其是视障者)最早成为技术“他者”,这些人对于机器和技术设计者是绝对的“他者”,或被排除,或被保护。随着验证技术迭代,许多非残障人不愉快的人机交互体验也说明,技术“他者”正在不断产生与扩大。“我验故我在”的困境从技术“例外”到普遍技术“他者”的忧虑意味着,人们开始被迫从人类整体性这个意义上思考人面对人工智能时差异的、建构的和从属的“他者”性。进而,验证码也可能转变残障人与非残障人之间相互审视的角度和技术关系。


网络生态中的验证码:

技术迭代促使人机关系倒转


随着验证码机制在全球各地的网络服务中全面推广,这也带来了与之伴生的验证码破解技术的发展,以及二者的纠缠。


(一)验证码技术的产业化、黑产化与剥削


验证码以内置代码或者第三方云端服务的形式嵌入到网页和应用程序中。目前计算机领域的研究将大量精力投入到验证码的升级和攻防战中。中国以腾讯云、阿里云为代表的互联网科技公司也自主开发了相关的文字、图片和滑块验证码。总体上看,验证码仅存在表征层面的地域差异,例如语言文字、图片、视频和游戏内容设计上的文化差异。验证码的技术逻辑,即验证码的生成和对抗很大程度仍潜在地导向一种技术普同主义。原因在于基础代码的复制和流通由微软、雅虎、谷歌、阿里、腾讯等多家大型互联网科技公司主导。


验证码技术迭代的基础在于理解验证码的安全性和破解的技术路线,例如对象分割攻击、目标识别攻击、随机猜测、人机协同攻击(Guerar,Verderame,Migliardi,Palmieri & Merlo,2021;Xu,Liu & Li,2020)。在验证码攻防战中,最先进的计算机视觉、光学字符识别、声纹识别都变成了机器假装人的手段。机器暂时无法通过测试的复杂语义理解等,由打码平台或黑客雇佣的其他人力来协助完成。


验证码与破解验证的技术迭代在此消彼长中,对越来越多使用者树立了高墙。然而至2021年,文字、图像和声音这三大验证码模式被机器攻破殆尽(Guerar,Verderame,Migliardi,Palmieri & Merlo,2021)。虽然不同公司的验证码项目破解率有显著差异,我们依然可以看到机器的迭代远超人类。据一份2023年的计算机研究报告指出,总体上机器人在解决验证码方面的表现优于人类,而人类社会内部通过验证码的时间也受到年龄、设备类型、教育水平和互联网使用模式等人口统计因素影响(Searles,Nakatsuka,Ozturk,Paverd,Tsudik & Enkoji,2023)。


不少科学家断言传统验证码已经失效,纷纷提出了新的验证码技术发展方向。例如,复旦大学计算机学院肖仰华认为,考验机器语言认知能力的智能验证码是未来技术发展的趋势,逆向图灵测试需要进一步加大难度,基于“语言认知”能力来进行人机区分(雷锋网,2017)。与图灵测试一脉相承,上述发展理念基本上可以概括为“道高一尺,魔高一丈”,它追求和确信人面向的特定智识所具有的独特性和优越性,体现了康德、笛卡尔以降的主体论的信念。这样的主导思路推动了验证码20余年来的更新迭代,同时这一攻防战的技术进步路线也不自觉地拼凑并不断强化了某种视觉、听觉乃至认知和智识上的完人想象。


(二)人机关系倒转:人作为整体的技术“他者”


随着验证码技术的复杂化,破解验证码的需求也不断增多,他们不仅来自网络黑客、非法营销和批量注册的运营者,亦有普通网络使用者。验证码人工打码平台一方面从网络黑客和普通弱势群体处获益,另一方面依赖零工经济招徕低廉的数据工人,剥削他们的认知劳动。打码平台会建立一个任务平台,任务发布者是灰色产业链经营者,他们将获取到的验证码信息封装成任务提交到打码平台,打码平台则作为中间的任务调度者,将任务分配给标注者(专门从事验证码打码的劳动者),完成后将标注结果返回平台,由其使用标注结果去请求数据页面。标注结果打码平台也会存储一份,下次遇到相同的验证码则直接从数据库中提取答案。如果验证码平台的验证图片长久不更新,就会有被拖库的风险,也就是所有验证图片都会被标注,此时就无需人工标注,直接转变成机器打码(小象,2022)。


在验证码攻防过程中,人类和机器劳动力等级划分逐渐产生。一些没有正式工作的人、边缘的劳动者被雇佣作验证码破解平台数据标注员,承担了其中的廉价认知劳动,变成了机器的“低端”助手。


平台中的人工打码作为机器的补充劳力价格低廉,面对提升的技术门槛,劳动者也随时可能被取代。如今图片验证码几乎都可以通过OCR技术来识别,这部分的人力工作数量大大减少。为了对抗验证码平台,一些打码平台引入了机器学习和神经网络等人工智能技术,以此来智能识别图片中的验证码要素,提高自动识别的准确率乃至完成互动操作。普遍来说,人工智能的升级迭代存在一条线性的路径,即从感知智能到认知智能再到决策智能(高文,2019)。验证码技术攻防升级也遵循了这一路径,从简单图形的视觉感知、OCR字符识别,到考察图片中更为复杂的信息的认知,再到互动式验证码的操作,一方面完成验证码均暗含了健全完整的身体在场,另一方面对身体的能力的要求也在不断增加。随着验证码的技术难度增加,这使得面对验证码产生挫败感与排斥感受的人群不断扩大。反过来,这种线性的升级路径恰在生产从决策到认知到感知能力歧视的等级链条,不断打击和定义着网络时代的“技术无能者”。同时伴随验证码生产和破解的产业化而来的还有一些无意义的劳动(bullshit work)(格雷伯,2018/2022:1)和无意义的技术(bullshit technics),验证码消耗了许多普通人不必要的网络时间、注意力劳动,以及黑色和灰色产业链中的底层数据劳动。


重思人机交互的身体观:

从技术能力主义到

去能力主义(Dis-ableism)


当前的验证码发展出的“我验故我在”实质上是“我思故我在”思想的复杂版本和具体实践,即对于机器来说,它就是个破解和对应运算符(形式符号)的过程,但对人类来说不断迭代的验证码就是要让人类要利用人类会思考、会比较、会游戏的思维,即理解和思考的能力。然而,这一所谓的人类能力的基础也在人工智能的飞速发展中摇摇欲坠。验证码迭代不自觉地成为技术能力主义(Whittaker et al.,2019)的观念代理。


(一)技术能力主义的否定辩证法


残障研究领域很早就开始反思社会中存在的能力主义(ableism)隐含的身体观和衍生的主体观念。能力主义将拥有某些能力等同于正常,缺乏某种能力的身体和主体则视作非正常,进而区分并贬低了“失能/残疾”(disability)主体(Ho,2008)。当今社会普遍追求诸如健康、美丽和生产力等特质的信念实际上折射了能力主义的思维(Griffin,Peters & Smith,2007)。本文中能力主义的排斥性表现为验证码读写能力变相成为上网者的准入资格证,无法通过验证码的人被视为非正常,失去享有某些网络服务的资格。


现代社会中,能力的内涵愈加复杂,社会生活的各方面都成为理解个体能力、展现能力的舞台,反之,某一方面的能力缺乏都有可能带来对一个人的主体性的否定。Reynolds认为,能力主义是一种否定辩证法(negative dialectics),这种哲学存在的基础包括对身体的评判、身体相关的价值绑定,以及形成一系列有关个体能力的信条和规范。社会中一切有关人类能力的意义建构,同时也彰显了对非人和无能的认定(Reynolds,2019)。在验证码的沿革历程中,技术要求又进一步划定了理想的计算机、网络技术参与者的范围,似乎缺乏图文识别或认知能力的人是不具备使用某一技术资格的。


能力主义一旦被放大,否定辩证法带来的问题便更为凸显。当一个盲人被告知无法通过图片验证码就不能成为网站用户时;一个肢残人无法使用鼠标完成滑块或点击验证码;一个儿童由于身高问题无法通过刷脸机器;一个老年人由于视觉、听觉或者肢体方面的障碍无法完成验证码交互,身体能力的缺陷或者非标准化就意味着这个时刻他/她是处于被机器非人化的判定中。技术使得能力的要求越来越高,能力的范围越来越广,能力的表现越来越多,在任何一个时刻的“失能”很有可能就会造成主体性的丧失,技术能力主义变相地变成了完美主义和正常化的绝佳说辞(Whittaker et al.,2019)。


诚然,在本文写作过程中,我们所呈现出来的案例大多源自残障者的日常体验,但它并非是一种特殊化的经验。换言之,所谓“残疾”与“健全”,彼此之间并无一个不可动摇的界限,之所以出现前文述及在验证码发展初期仿佛视障者被技术与健全人双重他者化的感受,或者说这似乎只是一个残障人面临的特殊议题,源自于能力主义的根深蒂固及其等级化的运作机制。Harpur(2019:14)结合残障社群内部不同类别的残障者之间的歧视现象(Deal,2003),尤其是精神障碍者在劳动力市场上相较于肢体、感官障碍者遭受的更深的排斥,提出能力主义的等级(hierarchy of ableism)的概念。文章指出,能力歧视并非是健全与残疾的简单二分,而是人们将不同能力的想象置于一个等级阶梯之上,当人们反对所谓能力歧视时,可能并未触及这种用能力来否定人性的底层逻辑,只是在挪动区分有无能力的界限。由此,我们要提醒的是,技术能力主义的命题根本在于,技术失能被视为非正常状态,当其“能力”不断超过人类之时,越来越多的人也就成为了等级阶梯下位的失能之人和技术他者。


(二)去技术能力主义的可能性


本文认为,验证码体现出的技术能力主义的人机交互偏见背后的问题可以从两个层面来思考:第一,当业界努力开发各种形式的验证码来验证使用者是否为真人之时,或许犯了一个本体论的错误,认为验证码某种程度上一定能体现关于人的本质特征的某个方面,而人也确实存在某种可表征的本质特征。这种先验主义的预设使得设计者一直在开发和寻找某个无可超越的本质,却发现没有一个技术面向是计算机完全无法企及的,人所谓的固有特征和尊严反而受到威胁与动摇。第二,验证码设计者以技术能力主义的视角来认知人类自我,其所定义的验证码中体现的人的本质和某些特质天然也带有“缺陷”,因为设计者对人与世界本身的想象存在局限,折射出其认为的非人存在的设计,机器会将之复制并再生产,终有一部分用户会被其设计的验证码排斥。


验证码探测背后主要的目的是考察是否是人在“交流”,这一问题的制造者还是人类本身,本文无意从根源上对验证码进行批判,而是透过对这一人机互动关系的省思超越固有的“我验故我在”的局限,寻求更为多元的方向。因此,验证码和验证码相关的人机交互不应该用于定义人、限制人,陷入在固有验证码技术发展趋势之中,而要回归到人的现实情境和行为特征。本节将引入两个不同的验证码路径,思考验证码去技术能力主义的可能性,还原人之尊严的技术想象。


1.“缺陷”作为思路


斯蒂格勒(1994/2012:82-134)认为,技术是由于人的缺陷而产生,作为人的“义肢”而得到发展的,那回归“缺陷”何妨成为一种新的验证路径。事实上这种思路已在滑块验证码中有所应用。滑块验证码属于基于行为的互动式验证码,完成滑块的重点不在于时间长短,而是主要对比滑动轨迹与原先设定路径的关系。滑块验证不仅需要用户完成指定的滑动任务,如完成拼图,拉满滑块条,同时利用人类行为轨迹的不稳定性来识别真人:人类在拖动光标滑动时轨迹相对脚本机器人来说是非匀速的,接近目标方框时速度会放慢。


当然,此种设计并非完美。首先,滑块验证在应用不久之后也遭到破解,机器同样模仿了人体解锁的抖动轨迹,精巧地骗过了验证程序。其次,滑动验证模式从使用体验来说,对视障者和肢体障碍的人并不友好。然而,这个例子值得讨论之处在于,它利用了人类相对于能力主义所崇尚之“标准”效率与“审美”等而言的“缺点”,而非强调人类相较机器来说的能力优势。发现差异和将人类的缺陷视为差异,可能也是验证码的另一种逻辑。


早期计算机在情境理解和记忆方面尚未得到发展,如今基于神经网络和大语言模型之下的智能计算机似乎已经克服了这一点。相较普通人,ChatGPT的知识面和基本语言能力毫不逊色。然而人的缺陷却可以很容易把人和智能计算机区别开来:人会偷懒,会拒绝回答“愚蠢”的问题,而ChatGPT总是尝试给出完整、全面和较少疏漏的答案。也就是说,人与技术(本文主要指智能计算机)本来就不是竞争关系,而是为了解放和补充。基于技术能力主义来开发逆向图灵测试,设计者对人与机器的核心差异的挖掘只会越来越难,这与人类开发计算机的原初愿景是相悖的。如果人对机器的设计是要求它们趋向某种完美,那么对人的验证码就可以从反面表现,即在人机互动过程中展现不完美。


因此,以缺陷、差异和多样作为一种方法去拓展更多的人机交互想象,呈现出包容性,是本文认为可以突破的第一层面。然而,差异和多样性的范畴最终也是有限度的,且随着多样性的增加,人们可能落入相对主义的极端,一方面使技术难以施行,另一方面机器只需任意反自我标准便可将之攻破。这一思路尚未超越“能或不能”的二元对立想象,下文将引向第二层讨论:作为联结的人。


2.联结作为方法


除了能与不能的维度,人的身体和存在也意味着多节点的网络联结,而机器往往是单点的存在。从联结出发可以打开“去能力主义”的更深层想象。在验证码尚未全面普及之时,密码狗(pass dog)等物理插件曾是重要的注册身份识别验证方式。当前密码狗的识别思路进一步地从物质世界的联结转向虚拟世界的联结。它不再使用外置硬件,而是将其他应用视为插件。基于行为和传感器的验证码背后的设计原理(也称无感验证),也应和了类似的理念。在互联网的世界,每个人都扮演着节点,与形形色色的人、物和服务产生连接。一个人用了哪些设备接入网络,跨过哪些平台,与谁互动,都构成了这个人网络化的自我。无感验证码通过收集用户环境信息(窗口浏览时间、鼠标轨迹和网页缓存)区别真人和脚本机器人。区块链技术也是分布式身体的代表,参与者作为节点加入系统,网络中每个节点既是数据的提供者也是数据的使用者,互为彼此身份和存在的确认者。


分布式的身体观和主体构成与图灵测试暗含的先验本体论不同。实践存在认为,身体是在展演/促成中,被中介的存在。人类并非存在于且于其自身(exist in and of themselves)。所谓存在,并没有终极、赤裸裸的原真存在,或是任何终极真理与密码,有的只是浮现于异质实践形构中的某种人。一方面,人随着不同脉络的实践促成,而展开成形,另一方面,非人或者其他人类,也是形构人存在中介的一部分(林文源,2014:32-50)。在行动者网络理论看来,人之所以为人,并非我思故我在,而是我联结故我在(I am what I am attached to)(Latour,2006;Muecke,2012)。


我们是否有可能提出新的方法,从图灵测试的“我思故我在”,迈向“我联结故我在”的人机互动和真人验证?或许可以拭目以待。


结论


当今社会普遍相信,AI可以帮助我们认识心灵——它是什么、它怎么工作。因而无论是否赞同AI能真正产生类人的心智,科学家都在努力推进AI的演进。然而,在验证码的产生和演变的过程中,人们并不一定都意识到,机器主导的一系列逆图灵测试对于人是什么、人的身心运作观念会产生强烈动摇。


本文立足于德雷福斯(1979/1986)、伊德(1990/2012)和彼得-保罗·维贝克(Peter-Paul Verbeek)(2011/2016)等人的技术现象学批判,同时结合批判残障研究(Campbell,2009;Goodley,2010;Whittaker et al.,2019)探讨日常生活中机器智能的一个侧面及其相关的“我验故我在”问题。研究回到验证码人机互动的过程、形式设定和技术关系本身,分析验证码人机互动中的能力主义陷阱,揭示人作为计算机的“他者”这一背景性的问题。笔者呈现了人机交互体验中验证码的主导模式是如何形成的,这一过程如何从制造白名单上的“他者”,到使人作为整体的技术“他者”,进而带来人机关系倒转的负面影响。显然,20世纪70年代以来德雷福斯(1979/1986)对人工智能的现象学批判和伊德(1990/2012)指出的人—技术“它异”关系的基本问题依旧回响。维贝克认为,技术物的形成过程中有很大的潜力参与到伦理道德的改良,人们的社会实践与非人实体融合可以产生新的混合实体,催生超越人类的意向性形式。其中包括两个方向:道德化地设计调节技术(将人融入非人)和以有计划的方式道德地使用调节技术(共同形塑非人在人中的作用)(维贝克,2011/2016:65)。


由此,验证码现象的技术伦理问题呼之欲出。本文认为,许多研究结果都暗示目前的验证码思路很难堵截脚本机器人,复杂化的验证码反而成为许多普通的残障和非残障人使用网络的拦路虎,不断制造出各类技术“他者”,带来新的不公平问题。我们完全同意,验证码对于保障网络安全所具有的价值,目前取消验证码程序目前是不现实的。然而需要强调的是,我们必须更加审慎地考量验证码人机互动中的能力主义陷阱,对此加以避免。文中论及的身体/能力偏见不是特定针对谁之偏见,而是产生自技术能力主义对人的独特能力的追求和无条件信奉,反过来使得有缺陷的、不完美的人被认为是有错的,被这一信念下的技术趋势的误伤的结果。验证码能力主义追逐的是正常化乃至全能化的身体能力,最后导致机器碾压所有人,人又求助机器和其他人,无意义的认知劳动、衍生的黑色产业越来越多。因此,应该改变验证码思路,重新理解人的网络化存在以及人机互动的导向。无论图灵测试还是逆向图灵测试,人类与机器的智能竞争或许并不是必须的。在验证码的案例中,本文提倡去能力主义(Dis-Ableism)路径,人机交互过程中引入缺陷、差异与分布式的身体观或许就是新的验证思路,推动新的关系形态和技术伦理。


最后需要指出,本文存在的局限是,将人机交互作为焦点分析验证码的问题,不免又落入人与机器二元对立关系的叙述逻辑。在残疾(crip)的体验中,技术世界中残障人与非人行动者的关系早已是半机械化和混合化的(例如,使用通信和适应性设备、植入物和移植物)。人类和非人类(有感知的生物和机器)之间的关联网络一直改变着实践的界限,并越来越突破界限(Campbell,2009)。本文虽触及残障群体的日常生活实践,但残障批判的理论延伸仍有遗憾,希望未来研究从对“我验”的思考转向“我在”的更多元探寻,将残疾(crip)作为一种方法,使之成为重塑人机互动关系的先锋,带来超越二者对立的想象,为人机互动关系研究与实践打开新的维度与可能。


本文系简写版,参考文献从略,原文刊载于《国际新闻界》2024年第8期。

本期执编/程羽


订阅信息


全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!


您也可通过下方二维码或网址https://weidian.com/?userid=1185747182,进入国际新闻界微店,购买当期杂志和过刊。


您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。



点击↓阅读原文

进入官网下载原文