因为疫情,小学提前放假。
我们家小朋友非非这两天直接进入寒假放羊状态。
周末有些时间,我就拉着非非一起做个调研小游戏。
大胆假设
我指着家里堆满一墙的书问非非:“你说这些书的定价都跟哪些因素有关?”
非非以前从没考虑过这问题。他是急性子,立即说:“书的内容好坏。”
“哦,内容好的书就贵,内容差的书就便宜?”
“对!”非非特别肯定。
面对要调研的问题,非非的确得了“大胆假设”派的真传。他这第一个假设似乎确实和书价有关,只不过关联性很难量化,还要考虑营销因素影响。比如,书商定价时,都恨不得把质量低劣的书统统包装成大受追捧的畅销书,定价上才不会让步呢。但,不着急评论小朋友的意见,且看他还能想出哪些假设来。
非非想到的第二个影响因素是“版权贵不贵”。他觉得,有些书要付作者很多版权费,自然定价就高,有些书的内容早已是公共领域资产,自然定价就低。这假设也不错,可惜一本书的版权成本及其对定价的影响过于复杂,不是我们坐在家里做个小调研可以搞明白的。所以这条也暂且不表——补充一句,非非能想到版权成本,这是因为我之前跟他聊过几次何为著作权,何为著作权期限,何为公共领域。
非非又想到“书的装订好不好”。小朋友嘴里的装订,大概包含了书的版式、开本、装帧形式、装帧档次等好几个指标。这确实是影响定价的关键因素。非非还指出, “书的厚度”可能也和定价有关。
我鼓励他从书架上随便抽几本书找找感觉,看还有没有其他发现。书架上有好几本书页焦黄的书,定价极其便宜,有一元几角的,有三角五角的。这些书为什么便宜?因为出版印刷得早呀!非非意识到,书的出版印刷年代当然也是影响定价的核心因素——他约略知道“通货膨胀”的说法,但道不清其中细节。为了让后面的调研更准确,我还让非非比较了“第某版”的年代和“第某次印刷”的年代之间的差异,同时确定,更加影响定价的其实是后者。
小心提案
用非非的语言,现在已得到“内容好坏”“版权贵不贵”“装订好坏”“厚度”“印刷年代”这五个假设。实际在家里做调研时,前三个不大好用。我引导非非,这次调研就只考虑书的厚度及印刷年代与定价间的关系。
厚度如何量化?做出版的人会立即想到“印张”的概念,但我不想花时间给小朋友做科普。就和非非讨论另外两种方案,一种是直接用版权页上标明的“字数”来代替厚度,另一种是直接用书的“页数”来代替厚度。非非觉得“页数”更直观易懂,但他自己也发现,如果考察页数对定价的影响,那最好就只比较类似大小的书。否则,像《新华字典》和《辞源》这类开本差别巨大的书,页数就算相差不大,定价也会大相径庭。
好了,非非自己的小调研方案基本成型:
-
找一大堆开本类似的书——我们找的都是32开或大32开的书;
-
记下每本书的印刷年代,页数,定价;
-
如果某书有上下册且定价是全价,那就记录上下册的总页数;
-
记录好所有数据,整理成表格;
-
根据表格,做出合适的图表,然后观察定价的影响因素。
快速实施
有了方案,赶紧行动。非非搬来梯子,爬上爬下地从书柜里搬出开本差不多的三四十本书来,全都堆到桌上。
收集数据需要流水线作业。非非扮演项目经理,安排我负责翻书报数据,他自己则负责用iPad录入。我们用iPad里的WPS创建电子表格。我报数,非非一行行录入数字。
得到的表格如下:
我跟非非讲,大人做这类调研时,常把这项工作称为“统计”。被调研的每本书也叫一个“样本”。针对每个样本,我们分别提取记录了“印刷年代”“页数”“定价”三个数据。根据这些数据找规律,有时也叫“建模”。要是用电脑自动根据这些数据来找规律,那就离今天常说的“人工智能”不太远了——可惜的是,非非似乎对大人世界里的这些事儿不太感兴趣,他完全沉浸在自己搬书,自己录入数据的简单快乐里。
仔细洞察
这个小调研涉及三种数据。印刷年代与定价相关,页数也与定价相关。小朋友多半不能一下子理解最有效的分析方法。但他们只要开始设想数据之间的关系,知道可以从数据表格创建图表,再从图表里总结规律,这就不简单了。