前沿:确定大型语言模型在自动感知分析中的有效性
本文探讨了大型语言模型(LLMs)代替人类参与市场研究的潜力。这类LLMs可以根据给定提示生成文本。我们认为,对于某些产品类别,感知分析是这种自动化市场研究的一个特别有前景的用例。我们提出的新方法生成的结果与人类调查生成的结果非常接近:人类与LLM生成的数据集之间的一致率超过75%。此外,这适用于基于品牌相似性度量和产品属性评级的感知分析。论文证明了对于某些类别,这种全自动或半自动的市场研究新方法将通过显著加速过程并可能降低成本,提高市场研究的效率。进一步的结果还表明,随着应用于大型语言模型的训练语料库不断扩大,基于LLM的市场研究将能够回答更多基于人口统计变量或情境变化的细致问题,这在使用人类受访者时可能成本过高或不可行。
Frontiers: Determining the Validity of Large Language Models for Automated Perceptual Analysis
Peiyao Li, Noah Castelo, Zsolt Katona, and Miklos Sarvary
Marketing Science 2024 43:2, 254-266
前沿:一种简单的前向差分法
双重差分法(DID)是市场营销和更广泛的社会科学中用于从准实验数据回答因果问题的最广泛使用的工具。由于准实验中的处理分配不是随机的,因此正确选择对照单元对于估计因果效应至关重要。DID要求在没有处理的情况下,处理单元的结果应与对照单元的平均结果保持平行。然而,当对处理组和对照组的分配不是随机的时候,这种DID平行趋势的假设很可能会被违反。我们提出了一种简单的前向差分法(Forward DID),该方法使用前向选择算法灵活地选择相关对照单元的子集。Forward DID具有几个优势。首先,它可以广泛应用,即使在DID过于严格的情况下也适用。其次,Forward DID可以容纳任意数量的对照单元。第三,没有过拟合的担忧,因为Forward DID在识别对照单元的子集后只需要估计一个参数。第四,与考虑所有可能对照单元子集的算法相比,Forward DID具有计算上的优势。最后,我们建立了一致性和推断理论,适用于静态和非静态数据。我们通过模拟和应用到店铺开业的案例来演示Forward DID方法的实用性,并与其他方法进行比较。
Frontiers: A Simple Forward Difference-in-Differences Method
Marketing Science 2024 43:2, 267-279
前沿:缩减厌恶:何时以及为何产品缩小被视为比等值价格上涨更不公平
全球消费者一直在努力应对生活成本的上涨。尽管许多公司已经(直接)提高了他们的价格,但其他一些公司则采取了产品缩减的做法——减少产品的大小或数量而不改变其价格。在这项研究中,我调查了消费者对产品缩减与等效价格上涨(即保持单位产品价格不变)的公平性信念。五项预先注册的实验表明,虽然绝大多数人认为响应成本增加的价格上涨是公平的,但这一模式在产品缩减时被削弱甚至逆转。因此,认为产品缩减不公平的消费者比例高于认为等效价格上涨不公平的比例。这种现象被称为“缩减厌恶”,主要由消费者认为产品缩减(相对于价格上涨)是一种欺骗性做法所驱动。重要的是,我提供了两个关键调节因素现象的实证证据:(1)产品变更的透明度和(2)公司成本的增加(与否)的存在。
Frontiers: Shrinkflation Aversion: When and Why Product Size Decreases Are Seen as More Unfair than Equivalent Price Increases
Marketing Science 2024 43:2, 280-288
动态定价与有机废物禁令:研究杂货零售商减少食品浪费的激励
我分析了两种解决超市零售食品浪费过多的潜在方案的福利影响:动态定价和有机废物填埋禁令。我使用了一个结构经济模型,该模型包括来自一家杂货连锁店手工面包类别的销售、易腐性和边际成本数据。我的分析表明,与有机废物禁令相比,动态定价在帕累托优势方面占优:动态定价使浪费减少了21%,同时使连锁店的毛利润和消费者剩余分别增加了3%和0.3%。相比之下,通过将处理成本增加十倍来模拟的有机废物禁令,只减少了4%的浪费,并降低了利润和消费者剩余。因此,如果监管机构希望减少杂货店的浪费,他们应该鼓励连锁店采用动态定价,而不是实施有机废物禁令。
Dynamic Pricing and Organic Waste Bans: A Study of Grocery Retailers’ Incentives to Reduce Food Waste
Marketing Science 2024 43:2, 289-316
在线零售市场中平台操控与赞助广告
在这篇论文中,我们研究了一个在线零售市场平台操纵卖家产品对消费者的吸引力(例如,通过虚假销售、虚假评论或不诚实的推荐)以及卖家的排名位置的动机。我们设计了一个在线零售市场模型,该模型中的平台操纵卖家产品的吸引力和卖家的自然排序,而卖家则决定产品价格并为平台上的赞助广告空间竞标。我们发现,平台可能会操纵较差的卖家产品使其看起来更具吸引力,以加剧卖家之间为广告位竞标的竞争,并且还可能操纵优秀卖家的自然位置,以补偿或惩罚优秀卖家。我们展示了公共政策,例如仅限制第三方卖家的虚假销售和虚假评论,如果忽视了平台操纵的动机,可能不一定能根除平台上的操纵行为。
Platform Manipulation in Online Retail Marketplace with Sponsored Advertising
Fei Long and Yunchuan Liu
Marketing Science 2024 43:2, 317-345
业主直售平台与中介定价:来自自然实验的证据
中介代理在连接各个市场的卖家和买家方面发挥着关键作用。然而,数字平台的出现提供了更经济的直接交易渠道,挑战了代理商的主导地位。在这项研究中,我们考察了业主直售(FSBO)平台对房地产代理的挂牌价格的影响。通过在中国进行的一项自然实验,我们发现FSBO平台的引入导致挂牌价格下降了2.8%,这一比例与代理商通常收取的佣金率相当。FSBO平台提供的成本优势似乎是价格下降的主要驱动力,而非挂牌选择偏差。此外,挂牌价格的降低也影响到了房产的最终销售价格。这些发现对于中介竞争规制的政策具有重要意义。
For-Sale-by-Owner Platforms and Intermediation Pricing: Evidence from a Natural Experiment
Marketing Science 2024 43:2, 346-359
广告作为电商搜索列表排名的信息来源
搜索引擎和电商平台在向用户展示新产品时面临着一个重大难题:由于信息问题,新产品通常没有足够的销量或其他用户互动,使得平台无法可靠地评估产品质量。本文评估了广告在向平台提供新产品质量信息以解决这一“冷启动”问题并提升高质量有机列表中的作用。通过在中国一家大型电商平台京东(JD.com)实施的大规模实验,我们展示了使用广告倾向信息对新产品进行排名对平台和消费者都有益处。我们的发现展示了广告如何通过其揭示的信息来改善电子商务中消费者和平台的结果的新途径,这些信息可以被平台用来改进搜索排名算法。
Advertising as Information for Ranking E-Commerce Search Listings
Joonhyuk Yang, Navdeep S. Sahni, Harikesh S. Nair, and Xi Xiong
Marketing Science 2024 43:2, 360-377
结合观察数据和实验数据使用不完美工具提高效率
随机对照试验能够产生实验变异,可信地识别因果效应,但往往受到规模限制;而观察数据集规模较大,但常常违背所需的识别假设。为了提高估计效率,我提出了一种利用不完美工具的方法——这些预处理协变量满足相关性条件,但可能违反排他性限制。我展示了这些不完美工具如何用来推导矩限制,这些限制结合实验数据,可以提高估计效率。我概述了实施这一策略的估计器,并展示了我的方法可以将方差减少多达50%;因此,只需一半的实验样本就能达到相同的统计精度。我将我的方法应用于Expedia的搜索列表数据集,研究搜索排名对点击的因果效应,并展示该方法可以显著提高精确度。
Combining Observational and Experimental Data to Improve Efficiency Using Imperfect Instruments
Marketing Science 2024 43:2, 378-391
言行一致:鼓励捐赠者分享慈善信息的实地实验
在网上或个人对话中分享慈善活动可以提高人们对公益事业的意识,并增强筹款工作。然而,在决定是否告诉他人他们的慈善捐赠时,捐赠者可能会更关注可能对其声誉的风险(例如,显得自夸、不真诚),而不是慈善事业可能获得的口碑效应。在一项大型的预注册实地实验中,我们测试了一个旨在通过重新引导捐赠者认为分享慈善活动意味着做更多好事的捐赠后干预措施,以鼓励口碑传播;77,485名捐赠者收到了控制或治疗信息,要求他们通过社交媒体、短信或电子邮件分享链接到该事业。与组织的标准征求(“请分享您的捐赠……”)相比,我们的干预强调了分享对事业的后果(“您的捐赠可以启动一个连锁反应……”)。这一简短信息将点击率提高了5.1%,通过口碑招募至少一次后续捐赠的可能性提高了12.4%。探索性后续分析表明,这些效果在大额捐赠者中最为显著;捐赠者捐赠的越多,对干预的响应就越积极。虽然许多实地实验旨在直接增加捐赠,我们测试的干预旨在增强值得支持的事业的口碑。我们讨论了在慈善领域及其他领域鼓励分享的方法。
Put Your Mouth Where Your Money Is: A Field Experiment Encouraging Donors to Share About Charity
Ike Silver and Deborah A. Small
Marketing Science 2024 43:2, 392-406
基于Cookie的广告效果评估未能测量的内容
再营销广告是一种流行的数字广告形式,通过算法向曾访问广告商网站的用户投放广告。我们实证研究了在数据来源于按cookie级别随机化的实地实验时,估计个体级广告反应的挑战。此类实验在业内很常见。我们研究了cookie级别随机化在个体级别的表现及其在衡量再营销广告效果中的作用。我们发现,基于cookie的分析评估再营销广告效果存在缺陷。由于存在同时拥有处理组和对照组cookie的个体——这些个体更加活跃并且消费更多,cookie随机化破裂了。由于我们揭示的cookie传播效应,个体被分配到处理组和对照组并非随机。结合第一方数据的个体级分析提供了一个关于再营销广告影响的更完整画面。我们检测到了基于cookie的分析未能捕捉到的线下销售增加。虽然许多市场营销者对未来无cookie的世界感到担忧,我们展示了基于cookie的分析可能会导致误导。通过同意获取的个体数据,在保护身份的同时,更为准确,且能克服许多基于cookie的分析的问题。
What Cookie-Based Advertising Effectiveness Fails to Measure
Min Tian, Paul R. Hoban, and Neeraj Arora
Marketing Science 2024 43:2, 407-418
无限测试:用AI测试您的电子邮件
测试电子邮件营销的有效性是一个活跃的研究领域,因为电子邮件仍然是客户获取和保留的重要渠道。电子邮件打开率是衡量活动效果的关键指标。学者们识别了影响打开率的三个预测因素:收件人特征、标题特征和发送时间。行业青睐的A/B测试有三个缺点:它需要几小时时间,会耗尽用于主要活动的名单资源,并且由于样本大小和效能要求,限制了可测试的电子邮件版本数量。这些限制持续激励研究人员构建和改进打开率预测模型。尽管这些模型缩短了测试时间,但市场营销领域开发的模型仅使用收件人过去的打开率作为预测因素。相比之下,计算机科学领域的模型通常只使用电子邮件标题特征作为预测因素。因此,当前模型的打开率预测误差较高。作者们解决了这两个文献流的局限性,使用了所有三个预测因素和机器学习来构建基于他们的通用情感检测器(UED)的电子邮件打开率预测器(EMOP)。他们在四个品牌的数据上测试了EMOP,并设定了最先进的预测结果。实验验证显示,EMOP能从一组专业生成的标题中挑选出最佳标题。此外,截至2023年1月5日,UED在2018年SemEval的任务1 E-c竞赛中排名第二。
Unlimited Testing: Let’s Test Your Emails with AI
Nguyen Nguyen, Joseph Johnson, and Michael Tsiros
Marketing Science 2024 43:2, 419-439
数据泄露后:测量行为变化
随着数据的数量和价值的增加,数据泄露和客户隐私侵犯的严重性也在增加。尽管公司通常会公开他们事后的保护措施,但关于重大数据泄露后用户行为的后效应鲜为人知;他们是改变与公司的互动,还是继续“照常营业”,或者做一些更微妙的改变?我们在一个严重数据泄露的婚外情交友网站的背景下探讨这些问题。对于大规模且广为人知的数据泄露测量“治疗效应”的一个挑战是缺乏明显的对照组。为解决这一问题,我们提出了时间因果推断(TCI);将在特定时间窗口加入的用户组与之前加入的相应(对照)用户组进行匹配,帮助考虑个体和时间网站行为的“使用轨迹”。在创建对照组之后,我们将因果森林(Athey等,2019年)改编为时间因果森林(TCF)。TCF允许洞察平均和个体层面的治疗(数据泄露)效应,以及与之相关的人口统计学和基于使用的协变量。我们的分析显示,在网站上搜索和发送消息的可能性减少,删除照片的可能性显著增加,后者是避免进一步个人识别的主要方式。此外,这些效应在多种因果推断方法中都相当稳健,无论是否使用TCI或因果森林。有趣的是,这些最初的负面反应并没有持续;在公告后的第三周,有迹象显示“生活恢复正常”。尽管情境特定,我们的分析表明管理和政策必需考虑以帮助保护客户的隐私。
When the Data Are Out: Measuring Behavioral Changes Following a Data Breach
Dana Turjeman and Fred M. Feinberg
Marketing Science 2024 43:2, 440-461