我们用符号分割话语,逗号代表停顿,句号代表结束,破折号表示拖长音,省略号意味着语句的暂时中断。
没有符号能代表口吃者经历的卡壳
。
卡壳时,口吃者清楚自己想说什么,却怎么也说不出来。越努力想把话憋出来,呼吸越不顺畅,气息越不够。气息越不够,越难把话说出来。前进不了,后退不了,时间仿佛在无限延荡。
句号不合适,话没说完。省略号不足够,太短暂了。卡壳有时会持续一两分钟,有时十几分钟甚至更长。于是,
口吃者联合起来,站在一起为自己创造符号
。当一种行为有了专属符号,代表它有意义。而赋予自己行为意义的前提,是能战胜心中的恐惧。
这是一个关于口吃的故事,也是一个关于如何接纳自我的故事,后者是我们每个人都需要面对的人生课题。
上高中时,宾佳在一本杂志的背面看到有卖矫正口吃的书。她去邮局寄钱,买回来一本书和三盘磁带,那还是没有快递的年代。拿到书她做的第一件事,是给书包上封皮。
宾佳从五六岁开始说话不流畅,原因被归结到外婆家院外的结巴身上,据说她在那儿待了一下午,就“学会”了。她会拖长音,会重复,会卡壳。父母坚定地认为宾佳的说话方式是错的,相信能通过打骂把口吃赶走。
宾佳也相信错的是自己,于是她极力掩藏自己的口吃。家庭聚会轮到她发言,她会假装去厕所。卡壳了,她会假装在思考接下来要说的话,将卡壳伪装成省略号。
她发言简短,不说长句子,不主动与人交流。她会换词
,将自己发不好的“w”开头的词换一种说法。和其他口吃者一样,
宾佳会在脑海里预演自己失败的场景
,专业名词称之为“彩排”(Rehearsal)。在脑海里一遍一遍彩排说话场景,口吃者能发现自己在哪个词上容易卡住、哪个句子讲了好多遍还不流畅,并把它们替换掉。“
关于如何隐藏口吃,每个口吃者都有一本属于自己的‘宝典
’。”宾佳说。
家长经常会对口吃的孩子说“你能不能想好了再说?”,认为口吃是思维混乱的结果,这是对口吃的常见误解之一,甚至有人会认为口吃是智力低下的表现。
口吃者不是不知道自己想说什么,恰恰相反,他们清楚地知道自己要说什么
,深刻地了解自己发出每一个音节、每一个字时的状态,并基于此来制定自己的说话策略,隐藏口吃。
每个人都知道自己的名字,而自我介绍对很多口吃者而言都是一道难关。“口吃者中一个比较普遍的现象是,在表述个人信息时会有明显困难。”言语治疗师杨阳说。直接说出自己名字的时候会卡壳,因此口吃者经常会在名字前面加几个词,比如“我叫xx”、“我的名字是xx”。
宾佳靠“宝典”大学毕业工作,成为重庆某重点高中的英语老师。她选择了一份需要说话的工作,选择透露了她的性格。在讲台上,宾佳几乎不口吃。她会换词,比如将“water”换成“something to drink”,与此同时,
她觉得自己在扮演“讲话流利的老师”这样一个角色
(不少口吃者在表演时都不口吃,比如妮可·基德曼、艾米丽·布朗特等,背诵一段话和即兴说话依靠的大脑区域不同)。宾佳一对一讲话时容易口吃,因此她从不给家长打电话,学生认为她是最好的班主任。
在某些语境下,宾佳的故事会被当成正面典型来歌颂,她“战胜”了口吃。她的故事也是许多“痊愈”口吃者的故事。全世界成人口吃发生率在1%左右,换算下来,国内口吃者约有1400万。
一百个人里就有一个口吃者
,也就是说我们每个人生活中都应该遇到过口吃者。
可请你回想一下,你发现过他们吗?
近年来越来越多残障群体站出来为自己的权益呼喊,让外界看到了他们的身影。口吃和自闭症谱系障碍的发病率接近,可在现实生活里,谱系障碍者比口吃者常见得多。打手语的听障者,用盲杖的视障者,坐轮椅的肢体残障者,行为异常的精神和智力残障者,每一种障碍类型都有其标志性的形象,
被划归为言语残障的口吃却很难在我们的脑海里唤起一个明确的形象
。
口吃者可以申请残疾证|《中华人民共和国残疾评定表》
因此,宾佳第一次在美国参加口吃协会(National Stuttering Association)举办的年会时,才会那么惊讶。会场里有接近一千名口吃者,有年轻人,有老年人,有蓝领工人,有白领精英。在国内生活了三十二年,当老师教了一茬又一茬学生,她只记得高中隔壁班有一个男生说话不流畅,那是她知道的唯一一个口吃者。在年会现场,宾佳甚至生出一个诙谐的想法:美国人是不是有问题?不会有什么基因突变导致口吃的比例极高吧?
落地美国后,宾佳在搜索引擎里输入的第一个词是“stuttering”(口吃)。出国前她做过调查,知道美国的言语病理学历史悠久、发展完善,从幼儿园到高中,每一所公立学校里都有专门的言语治疗师。她以为在美国可以找到治愈口吃的方法。
宾佳在美国去过大型综合性医院里的语言门诊,去过大学里面的语言诊所,参加过三次语言集中治疗(Intensive program)项目。然而,所有她去过的地方,言语治疗师跟她讲的第一句话都是“
口吃是不能够被治愈的
”。
约有5%的儿童会口吃,其中高达80%左右的孩子能恢复到进行流畅交流的程度。剩下的20%左右口吃会持续到成年阶段,并伴随终生。“根据目前的学术研究成果,
孩子是否接受治疗,不会影响他将来是否口吃
。也就是说,接受治疗不会提高口吃的治愈率,”已经成为密歇根州州立大学言语语言病理学在读博士的宾佳解释说,“能自然恢复的孩子本身就能恢复,如果接受言语治疗,他恢复的时间会更短。对于会持续口吃的孩子,接不接受治疗他们都会继续口吃。我们之所以推崇言语治疗,是
因为言语治疗会帮助孩子学会如何应对口吃的负面影响
。”
口吃本质上是一个生物学问题,口吃者大脑的神经连接、语言和运动系统的整合方式,以及多巴胺等关键神经递质的活性上,均和说话流畅者存在差异。因此,和自闭症谱系障碍一样,
口吃也被视为神经多样性的一种表现
。套用对谱系障碍者的描述,口吃者“生来如此”。
浪漫化残障不可取,但不能否认的是,浪漫化的表达更容易在大众文化中流行起来。口吃的孩子该被称为什么?ChatgGPT给出的答案是“河流的孩子”。|《我说话像河流》
宾佳很快明白自己在国内没遇到其他口吃者不是因为基因,国内口吃群体数量同样庞大,只是大部分能隐藏的口吃者,都和曾经的她一样,
选择了隐藏
。
相信读到这里,仍有不少读者会认为隐藏是明智之举。无论口吃与否,我们每个人都会尽可能隐藏自己不被社会接受或认可的地方——隐藏土气的口音,隐藏奇异的想法,隐藏内向的性格,隐藏特殊的癖好——这是人之常情。承认自己的不一样是很难的。能把自己隐藏起来,像普通人一样生活,为什么要主动往自己身上贴标签?
去美国前,宾佳翻出她藏在柜子最里面的口吃矫正教材。怕出国后秘密被家人发现,她趁天黑偷偷出门扔掉了磁带。包着封皮的书,仍藏在柜子的最里面。
在口吃者互助会上分享自己的故事,宾佳卡壳了。和在国内不一样,没有人嘲笑她,没有人移开目光,周围人继续看着宾佳的眼睛。“我非常非常不自在。我觉得我都这么挣扎了,都这么痛苦了,你们为什么还要看着我?”轮到其他人分享自己的故事,
每个人都在口吃,他们没有努力让自己说话变得流畅,他们认为口吃才是口吃者说话的正常状态
。
口吃社群会用一个词来指代向周围人坦白自己口吃的行为——
口吃出柜
。
口吃是可以隐藏,口吃者可以说“我的名字是XX”,可以提前感知到口吃的到来并娴熟更换表达方式,可每当此时,口吃者的心跳会加快,血压会跟着上升,这也都是口吃的表现。口吃者脑子里总有一根弦在绷紧,时刻警惕口吃的到来。
日常的每一次沟通,对口吃者来说都是一次压力事件
。特别是自我介绍、餐厅点单、打电话、公开发言等场景,更是高压力事件。据言语治疗师杨阳介绍,对于口吃者而言,难的是在正确的时机把该说的话说出来。说出第一个字,总是最难的。一位口吃者跟我分享他如何评判影视作品里的结巴演得够不够好:“在一句话中间卡壳的,都是演得不好的。演得好的,知道在第一个字上卡壳。”
吴少玫发“ka”这个音时会遇到困难。为了不把最爱的咖啡说成“CaCaCaCappuccino”,多年来她都只喝“Latte”(拿铁)。每次上台公开演讲,几乎每一句话吴少玫都要练习几百次。为了发出一个音,她得控制好自己的声带,得将舌头放在该放的位置,用10%的脑力警惕口吃。这好比别人上台阶能直接抬脚,她不得不去琢磨脚上的哪一块肌肉该怎么用力、大脚趾该怎么放。因此,即便口吃者能像普通人一样说话,和非口吃者相比,他们每次说话都要耗费更多的心力和体力。
我接触到的每位口吃者都会提到同一种情绪——恐惧
。恐惧口吃的到来,恐惧隐藏的秘密被发现,恐惧秘密曝光后周围人的反应,恐惧在乎的人终于发现了自己不堪的真面目……当那天没来,恐惧一直笼罩于生活之上;当那天来了,长期积累的情绪压力如山崩一样爆发。
艾米丽·布朗特曾在演讲里说,与口吃共存的感受就像身体里住着一个“不付房租的冒牌货”。| Variety
宾佳有一份大众眼里的好工作,有家庭,却仍在三十二岁那年选择出国留学,因为
口吃控制了她的生活
。每天一睁眼,她就在想怎么才能把一天熬过去。恐惧口吃被当众揭穿,开家长会前一个礼拜她会担心得睡不着觉。对口吃的担忧超过对学生的关心,她自认是名不合格的教育者。每当口吃,她的头脑里就会响起爸妈训斥的声音“你怎么又说不出来了?”“你怎么这么没用?”。在家里说话卡壳,前婆婆会告诉她“你一个做老师的人,千万不能当众说不出话来,要把自己弄好”。女儿出生后,家人会刻意不让女儿听到她的口吃,一旦女儿说话结巴了一下,家人如临大敌。和讲方言比,宾佳讲普通话口吃的概率更低,她害怕和女儿讲方言。
本科毕业之前,没有同学知道龚嵘口吃。论文答辩时,他当场卡住。努力想把话憋出来,整个身体不由地跟着用力,龚嵘面部抽搐、眨眼、吐舌头,而话语却仍卡在喉咙里。(口吃时经常会伴有身体动作,这被称为伴随动作。)研究生论文答辩,往事重演,二十多分钟他几乎没有说出一句话来。去法国、英国等地求学,龚嵘接受过正规的言语治疗,参加过互助会,每次面试、每次会议、每次公开报告都会给他带来极大的心理负担。口吃不分语言,如果一个人说母语口吃,他很可能说任何一门外语都口吃。龚嵘决定向周围人坦白自己的口吃身份,因为“
不想一直活在恐惧和焦虑下
”。
就算愿意为沟通多付出心力和体力,就算能忍受日复一日的恐惧和焦虑,但为了隐藏口吃,口吃者频繁换词换句子,有时说的话对方听不懂,有时说的话扭曲了自己想表达的意思。沟通是为了交流信息,但是
对口吃者而言,隐藏口吃的需求排在交流前面。
把口吃隐藏起来,有时等同于把自己隐藏起来
。
“我心里想的和我说出来的话永远对不上,”宾佳说,“我很难用我的声音去表达真实的自己。无法表达自己,就无法和周围的人建立亲密的、信任的关系。”她和前夫在一起十年,两人讨论口吃的次数不超过三次。
不接纳口吃,但口吃又是身体无法分割的一部分;竭尽全力控制住话语,却注定会被口吃击溃。
对口吃的憎恨,逐渐演变成对自我的憎恨
。哪怕一位口吃者能流畅地说话,一直隐藏带来的焦虑恐惧、失控与失望带来的内心痛苦、不得不换词造成的词不达意、无法与他人深度交流导致的孤独、害怕暴露而放弃属于自己的机会等等,都是口吃的一部分。
对于口吃的最大误解,在于将口吃事件等同于口吃
,误以为能通过技巧或某些方法做到说话流畅,像曾经的宾佳那样,就不是口吃了。
口吃不仅仅包括可以观察到的口吃行为,还包括口吃者对口吃产生的负面反应
。在世界卫生组织的《国际功能、残疾和健康分类》框架下,口吃不单纯局限于语言流畅性障碍本身,还包括口吃对个体的功能、社会互动、环境以及心理健康等多个维度的影响。语言学家皮特·豪威尔(Peter Y. Howell)认为口吃事件之于口吃就像冰山的一角,露出来的部分只占口吃经历的5%。
世界卫生组织《国际功能、残疾和健康分类》(The International Classification of Functioning, Disability and Health,ICF)框架下功能导向的语言干预策略个案示意图|《基于ICF的儿童语言康复体系构建》
听口吃者描述口吃,
仿佛口吃是一只时刻在周身徘徊、蓄势待发的野兽
,口吃者一旦掉以轻心,就会血肉淋漓。一个场景在我脑海里挥之不去:《少年Pi的奇幻漂流》里的少年时刻担心同乘一艘船的老虎会把自己吃掉。同名小说对恐惧的描述同样适用于口吃者:“(真正的恐惧)像坏疽一样在你的记忆中筑了巢:它想要让一切都腐烂,甚至包括谈论它的语言。因此你必须非常努力地把它表达出来。你必须非常努力地让语言的光辉照耀它。因为如果你不这么做……那么你就使自己容易受到恐惧的进一步打击,因为你从不曾真正与打败你的对手交战。”
决定暴露自己的口吃后,龚嵘经历了“阵痛期”,无论是思想还是身体器官都不适应口吃的到来。不再换句换词躲避口吃,努力挤出某个字后,他身心俱疲。适应了半年多,他讲话时才真正放松下来,把原来令他紧张、想要回避的场合都当成练习说话的机会。不再掩饰口吃后,他才发现“这个东西也没有自己想的那么严重,旁人觉得口吃不是什么大问题”。换句话说,
最看重口吃的是口吃者自己。不再被恐惧遮蔽双眼,才能看清口吃的真面目
。
杨阳第一次向周围人坦白自己是口吃者,是因为看到了同类。她从小到大都掩饰得很好,周围的朋友没人知道她是口吃。渴望能“治”好自己,杨阳大学学的专业是“听力言语康复学”。大二上专业课,她才真正了解口吃。老师请来一位口吃者到课堂进行分享,那位口吃者没办法说出一句完整的话,每句话都包含大量不自然的重复。光是听他讲话,都要耗费更多的精力,何况当事人。杨阳受到极大的冲击,她想象不出对方二十多年的人生是怎么过来的,更想象不出他为什么愿意到课堂来和学生公开分享自己的口吃。
分享结束后老师让同学发表个人感想,杨阳站起来说:“其实我是有口吃的。我一直认为这个秘密我会带到坟墓里去,一辈子不会让人知道,但是
今天我突然觉得我讲出来也没关系,或者说我希望你们知道这件事情
。”
她不记得老师和同学的反应,当众说出一辈子的秘密,她根本没有余力去观察别人的反应。她记得当时的感觉:“就像你憋了一口痰,憋到不行了,突然咳出来的那种感觉。终于舒坦了。”
去日本继续攻读言语治疗,她特意到医院开了口吃诊断,在入学面试前提前告知校方,说明如果面试中出现说话不流畅的情况,是因为口吃,不是因为她准备不周,也不是因为她紧张或心理素质差。面试了两所大学,一所给她延长了面试时间,一所为她更改了面试顺序。在打工的地方和领班坦白,由于口吃,给顾客打电话的工作她做不到,领班为她调整了工作内容。“
每个人其实都有不擅长的事情,大家就互相托举一下
。”杨阳说。工作里她总需要做大量的准备工作并预备好替代方案,但还是有人会因为口吃怀疑她的工作能力;也有的来访者看重她,认为她真正了解口吃者的感受。她加入日本的口吃社群,积极参与倡导口吃权益的活动,比如“点餐需要花时间的咖啡馆(注文に時間がかかるカフェ)”等。
“点餐需要花时间的咖啡馆”是日本各地举办的一日限定咖啡馆活动,旨在为口吃的年轻人提供参与服务业的机会,并让不了解口吃的人理解口吃。| machi-meguri.com
作为人工智能科学家在脸书(Facebook)工作时,吴少玫第一次向直属上司透露自己的口吃,上司给出的反馈是“你没有,你是紧张”。和几位同事分享,同事也说“你没事,你已经好了”、“没有人可以听出来”。“可我心里知道,我在开会的时候真的吞进去很多话,
我有很多话想说,实际上我都没有说出口
。”
在脸书公司内部的口吃小组里,没人会说“你没有口吃”,小组成员会分享如何在生活中与口吃更好地共处的建议。非口吃社群的朋友也是出于一片好心,可有的东西只有同类才懂。
吴少玫曾在三四年间多次向脸书的人力资源提出申请,希望公司的医保能承担言语治疗的费用。每次她都感到羞耻,每次她都觉得自己在要求一个很过分的东西。在公司的口吃小组分享这件事,小组成员集体发起请愿。第二年起,公司的医保承担员工及其子女的言语治疗费用。几个月的时间,大家一起改变了整个系统。
吴少玫真实地感受到社群的力量
。从此之后,她才算能真正正视口吃。
口吃出柜后,吴少玫口吃时心率仍会从六七十蹿升到一百六,口吃带来的生理性反应还在。虽然认知已经改变,身体都还记得。不过,她已经不会花精力去懊恼“我怎么又口吃了”,而是更加关注对方的反应,更专注于交流。因为口吃,参加会议的10分钟发言里她只能讲完5张PPT;没有口吃,她能讲12张。沟通效率看似降低了,但是“
人与人交流的最终目标并不是要输出多少内容或者讲多少个字,而是和对方产生一种连接或者共鸣
。通过口吃,我可以向对方展示真实的我是谁、我和别人不一样的地方,让大家可以看到我、相信我。我觉得这其实挺珍贵的,特别是在现在这个时代。”吴少玫说。
和第一次见面的人提到自己有口吃,她会得到两类反馈:一类和她前老板、同事一样,说“你没有”;另一类会说“没关系”。前一类听起来就像她在骗人,后一类像是她在为自己的口吃道歉。两种反馈都不理想,因此她会在“我有口吃”后面加一句“有时候我说话会有一些较长的停顿,请你不要打断”。她将此类对话当成教育的机会,能让更多人了解什么是与口吃者对话的恰当方式。
2023年,吴少玫(右二)在佛罗里达参加美国口吃协会年会。| 受访者提供
2022年吴少玫创立AImpower.org,致力于为弱势群体研究和搭建技术,希望通过自己的努力带来某种结构性的改变。她认为:“如果没有结构性的改变,我最好的状态就是我能完全隐藏口吃,认识的人都以为我没有口吃。可那样对我来说是一种成就吗?
我扮演了一个别人,是成就吗?
”
有的痛苦只有同社群的人能明白,有的压抑则只有在同一种文化里浸淫过来的人才懂。2019年在伦敦的口吃互助会上,龚嵘认识了同为中国人的乔治(化名)。两人一拍即合,两个话筒,两个耳机,列好问题,互相采访,播客“口吃说”的第一期节目诞生了。龚嵘到现在还记得当时问的最后一个问题:“如果从明天起你不再口吃了,你会做什么?”
除了被当成笑料“包袱”,中文媒体上鲜有对口吃的讨论。
龚嵘坚定选择了依靠声音而非文字的传播形式,渴望让更多人听到口吃者真实的声音
。之后,乔治拉来了已经身在美国的宾佳。除了人物访谈,“口吃说”开始做“口吃三人行”系列,三个人分享讲述口吃者点单、约会、面试等的经验。
宾佳有时会想,从小到大,如果有一个人和她说过“口吃不是你的错”,她的人生会不会不一样。可就是没有这么一个人,同样,大多数“吃友”的人生里也没有这么一个人。于是,当美国口吃互助会的成员介绍她和一位来自中国的口吃女性认识时,她欣然接受。
Tracy Wang当时正面临毕业,虽然论文出色,却仍因口吃而一再错失工作机会。她和宾佳打了一个小时的电话,打完电话躲进被窝里哭了一个小时。宾佳是她在美国遇到的第一个有口吃的华人。在人生的低谷期,一个从未谋面的陌生人耐心地听她结结巴巴讲话,真切地给她带来了希望。后来,Tracy成了播客的嘉宾;再后来,她加入“口吃说”,成为核心成员。
宾佳(右上)和Tracy(下)在播客中采访吴少玫(左上)。| 口吃说Stammer Talk
就这样,“口吃说”的社群慢慢壮大,不单是海外的华人,国内的言语治疗师、口吃研究者以及许许多多口吃者加入到社群中来。当社群足够庞大,“口吃说”开始举办线上互助会,每两周一次,身处世界各地的华人都可以用母语来讲述自己的经历,宣泄日常无法同他人分享的情绪。发展到现在,“口吃说”已经成为国内最具影响力的口吃社群之一,两个微信群里有接近七百名成员。龚嵘说:“我们自己是口吃者,我们就是在为自己发声。只不过
有了社群,大家联合起来的话,声音会更大一些,会让更多人听到
。”
的确有人听到了他们的声音,意料之外的机会即将降临。
2022年,清华大学科学博物馆和麻省理工学院策划一个关于残障与科技的线上展览时,邀请“口吃说”帮忙,希望了解口吃者在使用AI产品时可能遇到的困难。
龚嵘知道智能语音助手听不懂口吃者的话,同时,作为在奥地利一家语音识别公司工作的研发人员,他也知道症结所在:市面上的语音识别系统使用的都是讲话流利者的数据,没有考虑到口吃者语音的独特性。口吃者可能将“帮我看一下时间”说成“帮我看一下时时时间”/“帮我看一下sh——sh——时间”/“帮我看一下(长时间卡壳)时间”,这些语音重复、语音延迟或拖音、卡壳,
都会成为系统里一个异常输入
。
我们想不到明确的形象代表口吃者,找不到合适的符号在文字里标记一次口吃,
在0与1的世界里,同样没有符号来代表口吃事件
。为展览收集素材,再一次提醒了龚嵘这个现实。
2022年底,在微信群里又聊到这个话题,龚嵘和数据科学家Tracy一拍即合,决定利用现有的口吃社群收集口吃者的语音数据,制作口吃语音数据库。
吴少玫曾是“口吃说”人物访谈系列的受访嘉宾,也曾在脸书和Instagram参与推动过包含无障碍产品、人工智能促进包容和种族公平性在内的多个“技术向善”项目。听到龚嵘的计划,她认为逻辑上跑得通,但担心项目的门槛太高。根据她在脸书的工作经验,收集语音数据每小时的预算要2000美元(其中大部分是运营成本,支付给参与者的报酬在每小时几十美金左右),收集特殊群体的语音数据预算还要更高。
按照最初的计划收集100位口吃者的数据,项目至少花费20万美元
。不确信项目会成功,她依然愿意提供咨询帮助,尝试总归是好的。
在社群里发布两次招募帖,总共募集到70位参与者。没有达到预期目标,但这并没有阻止龚嵘和Tracy前进的脚步。语音数据收集环节由两部分组成,半小时由龚嵘或Tracy对参与者进行围绕个人口吃经历的采访,半小时请参与者读语音指令。两人平日工作繁忙,对话只能在周末等业余时间进行。70次对话,10个月完成录制。
70名参与者中46名男性、24名女性,包括学生、老师、公务员、律师、销售、外卖骑手、修车技工、网红经纪人等。参与数据收集时,口吃者一开始也会习惯性地隐藏口吃。读语音指令时刻意用尽可能流畅的方式读出来,访谈时通过换词、换句子或者用最简单的一两句话来回答问题,避免口吃的出现。这会导致语音数据库的意义大打折扣。
创建口吃语音数据库是为了让更多人注意到口吃者独特的说话方式,而贡献数据的许多口吃者在做的是竭尽全力抹掉自己的独特
。
每当此时,龚嵘和Tracy会主动口吃,以此来鼓励对方用最真实的说话方式,展现口吃。有的参与者会不习惯。从小到大接触到的所有环境对他们的期待、他们对自己的期待都是“你应该流畅地说话”,第一次听到对口吃的鼓励,不习惯是自然的。而当社群的核心成员主动展露自己的口吃,听到他们磕磕巴巴地说话,受到鼓舞也是自然的。一次次采访做下来,Tracy觉得“虽然不少口吃者给别人的感觉是性格内向或不善言辞,但给他们相应的鼓励和空间,每个人都有很多话想要分享,每个人都渴望有一个平台能够诉说自己的故事”。
说出一个句子要花更多的时间,单看逐字稿信息含量不如隐藏口吃时来得多,但是
当口吃者用自己最自然的方式讲话,表达的是最真实的自己
。表达,不单能通过语言,还可以依靠身体。每一个气息憋在喉咙里的时刻,每一次用力到让音节支离破碎的时刻,都在传递信息。
吴少玫估计,如果项目放在大公司里操作,采访者只会按模版问诸如“你喜欢什么音乐”等无关痛痒的问题。说话流畅的采访者不会意识到参与者在刻意隐藏口吃,参与者也只是“拿钱办事”,让说什么就说什么,数据收集过程机械而疏离。
龚嵘和Tracy的语音数据是“真心换真心”收集来的
,聊的都是同为口吃者的挣扎,是伙伴间的抱团取暖。
2024年在希腊科斯岛参加语音技术会议,左一吴少玫,右二龚嵘。丨受访者供图
说话流畅的数据采集者同样不了解的是,一个人的口吃程度不是恒定的。
吴少玫一对一讲话或者在家里和孩子说话,十句里顶多口吃一两次,可在公开场合讲话,她讲一句话可能会口吃七八次。这是口吃不同于其他残障的地方。视障、听障、肢体残障等虽然会给当事人的生活造成诸多不便,但在一段时间内,障碍的状态大多起伏不大。而口吃在某些场景下不会对吴少玫的生活造成不便,
在另一些场景下会让她处于几乎失语的状态,极大限制了她的社会交往能力,在这些场景下,口吃是一种典型的残障
。龚嵘上过的口吃矫正班都是他自己要求去的,因为他在家人面前说话不口吃,父母不了解公共场合下讲话给他带来的苦恼。一般来说,人在紧张的状态下容易口吃,反之亦然。当发现参与者过于放松或者过于紧张时,龚嵘和Tracy会有意识地帮助参与者调节状态,尽量让他们呈现出日常的说话状态。
半小时的采访结束后,请参与者录制语音指令时,文本同样针对口吃群体进行了调整。为数据做免费标注的北京希尔贝壳(AISHELL)先给出了一版成熟的语音模版,包括指令词、和语音助手简单的交互沟通(比如“你好,米雅,这首歌循环六遍”)以及稍长一些25个字以上的文本等。然而,越长的句子,口吃者表达的难度越高,停顿和重复会比短句子多得多。因此,在龚嵘的建议下,语音指令文本里删掉了25个字以上的长文本。
“没有我们的参与,不要替我们做决定(Nothing about us, without us)”这句国际障碍者权益运动的重要口号同样适用于此。每一种障碍都代表一种独特的存在方式,其独特性非当事人无法彻底参透。
吴少玫曾认为科技是中性的,即便科技导致善果或恶果都是因为其使用者,而非科技本身。在工作中接触到残障群体,她发现自己错了。
每一种科技都镶嵌了某种价值观
,压抑排挤了某些族群。看得见是“正常的”,说话流畅是“正常的”。吴少玫曾在某一档播客节目里提到自己不点“Cappuccino”的故事,节目把她前面的“CaCaCa”都剪掉了。
近几年人工智能被塑造得无所不能,特别是在沟通领域。即时翻译让沟通不受语种的限制;为听障人士研发的智能眼镜能实时将语音转化成字幕,让沟通不受声音的限制。然而,在吴少玫看来,
科技产品让沟通的阈值变窄了
。日常生活里,我们每个人说话都会犯错,会发错音、夹杂语气词或者语序混乱。无论对方犯错程度深浅,多数人会耐心等对方说完,努力去理解、通过上下文语境去猜测对方的意思,人和人之间对话有犯错的空间。然而,直到近几年,市面上AI学习的素材一般都是发音标准、语序正确的新闻播放、广播节目,
这令沟通中犯错的空间变小了
。拨打人工智能客服对每个人来说可能都是糟心的体验,对口吃者更是如此。口吃者还没说出话来,人工智能客服会直接将他的停顿识别成句号,结束对话。这时,人工智能没有让生活变得轻松,反而增添了障碍。
有的公司会研发针对方言的语言模型,但在时间上都有滞后,都是先满足大多数人的需求,再去考虑少数群体。“这不是一个值得吹嘘的事情,或者是在做行善积德的大好事。他们在一开始设计产品的时候忽略了部分人,可以说他们的产品一开始是有bug的,”吴少玫认为,“研发针对方言或者其他少数群体的模型,
不是在锦上添花,只是在修bug
。”
即便是针对残障群体设计的无障碍科技产品,其目标大多是为了“修复”——眼睛看不见,让科技产品充当你的眼睛;耳朵听不到,让科技产品帮你听;哪种能力达不到平均水平,科技产品帮你达到。有的语音模型会自动将不流畅的语音转化成流畅的语音,以便让机器听懂。吴少玫说:“这等于把作为一个人类语音的资格都给抹掉了,就像在说你的语音不达标,你没有在我们考虑的范围内,你说的话必须要修复一下才能听懂。”
而“口吃说”的语音数据库展现了28,310起口吃事件,在逐字稿里保留了口吃的痕迹,没有将语句变得平滑。
其创建目的不是为了“修复”口吃者的声音,而是为了彰显口吃者的独特
。
在为收集来的语音数据做标注时,数据标注员需要能区分出五种口吃事件(stuttering event),包括字的重复(word-level repetition,[ ])、音节的重复(sound repetition,/r)、卡壳(blocks,/b)、拖音(prolongation,/p)和插入语(interjection,/i)。重复和拖音相对容易判断,可谁都有一下子想不到某个词卡壳的时候,要区分这种卡壳和因口吃而发生的卡壳,其中的微妙差别只有口吃者才知晓。龚嵘解释说,口吃者在努力发一个音时,肌肉的紧张、痉挛会造成一些细微的声音。这些声音未经训练的说话流畅者容易忽略,但口吃者一听就懂。
OpenAI的语音模型Whisper对口吃语音的转录结果,左边是口吃者的语音文本,右边是转录结果。不但创建了开源口吃语音数据库,龚嵘、吴少玫等人还积极撰写论文,在学术领域内发声。|Towards Fair and Inclusive Speech Recognition for Stuttering: Community-led Chinese Stuttered Speech Dataset Creation and Benchmarking
Meta的语音模型Wav2Vec对口吃语音的转录结果,左边是口吃者的语音文本,右边是转录结果|Towards Fair and Inclusive Speech Recognition for Stuttering: Community-led Chinese Stuttered Speech Dataset Creation and Benchmarking
历时一年多的公益项目AS-70数据库是第一个开源中文口吃语音数据库,也是目前唯一一个非欧美语系的口吃语音数据库。
在大公司需要20万美元预算的项目,“口吃说”社群做下来项目花费为8400元
。(“口吃说”付给每位参与者120元的报酬,希尔贝壳公司送给每位参与者一个背包。另外,希尔贝壳为“口吃说”免费提供数据标注等服务,总共为项目花费十余万元。)
那些卡壳的时刻,那些时间仿佛无限延荡下去的时刻,终于有了代表符号,有了意义
,哪怕只是在这有效时长48.8小时的开源数据库里。
让残障群体向主流人群靠拢还是尊重每个群体的独特性,是残障领域常谈常新的话题。普通孩子能自然而然学会的生活技能,自闭症谱系障碍的孩子做不到,该一遍一遍重复强化让谱系障碍的孩子记住,还是尊重孩子独特的成长节律?只有8%的聋人能看懂新闻里的手语,手语翻译打的是听人制定的手语,不符合聋人的思维方式和表达习惯,该让聋人学习听人制定的手语,向听人靠拢,还是尊重聋人群体的独特性?