随着城市流动摊贩规模的不断壮大,如何快速而精准地掌握其空间分布信息已成为一大难题。本文以深圳市西乡片区为例,采用深度学习技术对研究区域内的街景图像进行流动摊贩的识别。随后,对识别出的流动摊贩进行分布点的比较和核密度分析,并与实际调研拍摄图像的识别结果进行对比。经过深度学习技术的识别,我们在街景图片中成功检测出43个含有流动摊贩的点位。分布点的比较和聚集分析显示,两者的集聚模式大体上呈现多核集聚的特点,点位相似度较高。然而,在中小学和居住区附近的集聚程度存在显著差异,这主要是由于摊贩的出摊时间与街景图像采集时间的不一致所致。深度学习技术在城市流动摊贩规模化检测方面展现出一定的效率,但街景图像中的摊贩检测结果仍受到拍摄时间的限制。这一发现揭示了街景图像数据和实地调研数据在城市流动摊贩研究中的不同局限和优势。本文旨在探索更高效、准确的街头摊贩数据收集技术,揭示大数据与小数据在城市研究中的差异,并为街景图像在摊贩空间治理政策中的应用和完善提供有益的启示。
中国的流动摊贩历史可追溯到夏朝,隋唐时期已逐渐规范化。至宋朝,摊贩的发展尤为繁荣,北宋汴京的摊贩云集之景在《清明上河图》中得以生动展现。随着城镇化进程的推进,非正规经济成为全球城市化进程中的普遍现象,其中流动摊贩占据了重要地位
[1]
。2018年,中国总理李克强提出改革要求,旨在优化对流动摊贩的管理,并将其纳入国家“放管服”改革的范畴
[2]
。据智研瞻产业研究院的研究报告显示,从2018年至2022年,中国地摊经济市场规模稳步增长,从22.59亿元扩大至31.48亿元。
深圳市于2015年发布的《深圳市流动摊贩治理方式创新研究报告》揭示,深圳市的流动摊贩规模达到约15万档口,涉及近百万人口。至2020年,深圳各区推行了流动摊贩疏导试点,全市共设立150余处疏导点,疏导摊贩近万人。随着疫情政策的逐步放开,深圳街头流动摊贩的数量逐渐增多。2023年,深圳市修订了《深圳经济特区市容和环境卫生管理条例》,新条例将于今年9月1日起实施。新条例不再全面禁止路边摊,而是授权街道办在方便群众、布局合理、监管有序的原则下,划定摊贩经营场所。这一政策的调整使得流动摊贩规模进一步扩大,对城市治理提出了新的挑战。
随着大数据和深度学习技术的不断进步,运用这些新兴技术来辅助研究城市流动摊贩提供了新的可能性。
本文以深圳市西乡片区为例,对该区域日间的流动摊贩进行了连续多日的实地调研和拍摄记录。同时,利用百度街景开源平台采集了该区域的街景图像。通过深度学习技术,训练流动摊贩物体检测模型,并将这一模型应用于现场调研的摊贩图片数据和街景图像数据集。通过识别后的数据分布点位和空间聚集分析,验证街景图片在流动摊贩数据大规模采集中的可行性。
目前,关于流动摊贩的研究已逐渐深入,涵盖了其经营主体的身份特点、形成机制,以及治理方式的创新等多个维度。威廉姆斯和温德板克(1995)曾将非正式就业归纳为异质性的就业市场,指出弱势群体在非正式市场中难以改变其工作性质
[3]
。黄耿志(2015)则深入研究了流动摊贩利用城市公共空间进行小商品交易的非正规经济运作模式
[4]
。在治理层面,流动摊贩已成为城市公共空间治理的焦点,涉及到空间政治和社会融合等议题。部分研究从包容性增长的角度出发,主张应充分认识到非正规空间的合理性,并通过弹性管理摊贩来实现城市形象与民生的平衡
[5]
。
此外,当前研究还聚焦于流动摊贩与正规商业之间的关系。例如,张延吉(2017)利用DO指数和M函数深入探讨了流动商贩的空间特征及其与正规商业的分布关系
[6]
。同时,也有研究关注影响流动摊贩空间分布的因素,如城市建成环境、用地性质和物业管理等
[7-8]
。不仅如此,流动摊贩的空间分布特征和组织模式也成为研究的热点,包括空间分布特征与区位因子的微观作用机制
[9]
,以及地摊经济空间组织模式的分类和对城市空间影响的分析
[10]
。
在数据采集方面,流动摊贩的数据主要通过个人调查和官方普查数据两种方式获得。
个人调查通常涉及实地观察、问卷调查以及与摊贩从业者、消费者和相关管理人员的对话访谈等,尽管这种方式有助于深入了解摊贩的个人信息,但其覆盖范围有限、成本较高且数据时效性受限
[11]
。而官方普查数据,如城市管理综合执法局的摸查数据、数字化城市管理系统数据和全国人口普查信息等,虽然能够提供有关非正规经济活动的有价值信息,但对于个人研究者而言,获取难度较大。
近年来,随着计算机视觉技术的不断进步,深度学习在城市规划领域得到了广泛应用。城市街景图的计算机视觉应用主要包括城市要素识别、街道空间品质评估和街景绿化评价等
[12]
。街景数据在城市研究中的广泛应用为解决流动摊贩数据采集难题提供了新的可能性。尤其是通过深度学习技术的应用,探索是否可以减轻由于流动摊贩的流动性、灵活性和隐蔽性所带来的数据采集难度。通过深度学习技术和街景图的大规模采集和分析,为深入了解流动摊贩的经营状况、空间分布特征和影响因素提供了有益的思路和方法,有助于进一步挖掘流动摊贩的空间分布规律和与城市环境的关系。
本次研究区域位于宝安区西乡街道片区,如图 1所示,以西乡、坪洲、碧海湾和海诚四个地铁口主要覆盖区为此次研究的主要研究范围。
研究区域内的用地类型以居住为主,常驻人口数量保持稳定,同时人员构成呈现出多样化的特点。为了全面了解流动摊贩的空间分布状况,我们在12月8日、12月9日、12月17日和12月22日这四天,从早上8:00至下午6:00对西乡片区进行了深入的调研。选取工作日和周末两个不同的时间段,以每5分钟为一个观察单位,对各个路段进行观察。利用录城Pin Survey小程序,拍摄记录流动摊贩在日间不同时间段内的分布位置,并统计了他们的出摊规律和大致数量。
3.2.1 本文分析框架和具体步骤
为了对研究区域的摊贩点位进行收集,我们以街头流动摊贩为调查对象,基于街景图像和深度学习技术对街头流动摊贩进行空间调查,再结合实地调研的分布结果与街景图片采集的分布结果进行比对,从而验证基于深度学习去探测城市流动摊贩空间分布方法运用的可行性,具体步骤如图 2所示。
首先,我们利用OpenStreetMap采集研究区域的路网数据,并通过百度开放平台下载该区域的街景图像。随后,通过各大开源平台搜集流动摊贩的图片,构建数据样本集,并且对不同的流动摊贩类型举行标注。接下来,对标注的样本进行训练,利用深度学习技术构建流动摊贩的物体检测模型。完成模型训练后,将其应用于西乡片区采集的街景图片数据集和实地调研拍摄的数据集中。通过模型识别,获得研究区域内街头摊贩的分布情况。为了进一步分析街头摊贩的空间聚集特征,我们采用点位分析和核密度分析方法。这些分析有助于评估研究范围内街头流动摊贩的集聚模式,揭示其分布规律和潜在问题。最后,将实地调研采集的街头摊贩集聚图与通过街景图片识别出的街头摊贩集聚图进行对比识别,从而验证其技术方法的有效性。
3.2.2 街景数据处理与收集
本文利用开放街道地图(OSM)采集了深圳市西乡片区的城市道路网底图,以获取研究区域的精确道路坐标点。鉴于街头流动摊贩分布的不规则性,我们采用30米的距离间隔来划分这些坐标点,并对每个取样点捕获四个不同方向的街景图。具体来说,偏航角参数设定为60°、150°、240°、330°,俯仰角参数设定为20°,视场角参数设定为12°,以确保采集的图像能够全面涵盖采样点周围的环境信息。随后,我们编写了Python脚本,该脚本能够读取每个采样点的坐标,并自动调用百度街景图像API来下载相应的街景图像。最终,我们成功获取了共计1125副有效街景图像,每幅图像的分辨率设定为1024*512像素。
考虑到街景环境较为复杂,前后遮挡较多,本文采用YoloV5深度学习模型,该模型采用了多尺度的特征融合,从底层到高层的不同分辨率的特征图都被用于检测,有助于更好的捕捉不同尺寸和现状的流动摊贩目标,对街头流动摊贩多尺度特征融合有助于提高检测的鲁棒性。并且YoloV5在目标检测任务中表现出色,具有较高的精度和召回率,这对于确保摊贩检测的准确性和全面性非常重要
[21]
。
3.3.1 数据集的采集与清洗
在数据集收集阶段,通过百度、小红书、微博和谷歌等网站爬取与流动摊贩相关的图片,共计3576张。随后,对这些图片进行初步筛选,去除质量较低的图片,保留了3076张高质量的图像。接着,利用Make sense开源平台对筛选后的图片进行了标签标注,将这些流动摊贩图片大致分为四类,如表1所示,包括地面摊贩类、简易装备摊贩类(如简单的桌子和小推车)、三轮车摊贩类以及小货车摊贩类。
为了确保数据集的质量和准确性,进行了二次数据清理,剔除了代表性不足和图像质量过低的样本图片。之后,将清理后的数据集随机划分为训练集、验证集和测试集三大部分,划分比例为8:1:1。其中,训练集占比80%,而验证集和测试集各占10%。该划分有助于我们初步测试模型的性能,并检验数据集的标注框准确性。在测试过程中,特别注意了是否存在漏标或过度标注的情况,以及标签信息是否完整、图像数据是否损坏,从而确保数据集的完整性和可靠性。
3.3.2 模型的训练与验证
为了提高模型的精度、增强训练数据集的规模和模型的泛化性能,我们采用了交叉验证的方法来构建和优化模型
[22]
。
交叉验证是一种有效的策略,可以在不损失大量信息的情况下建立模型,并评估模型在应对新样本时的精度,从而防止过拟合问题。
在本研究中,我们选择了五折交叉验证法,将标记的数据集均匀随机地分成5个子集,确保每个子集的选择都不重复。随后,交替使用4个子集中运用训练,而剩余的一个数据子集则用于验证
[13]
。
在模型训练过程中,为了优化模型的收敛速度和泛化性能,我们经过多次实验,将学习率初始值设置为0.0008,并采用了余弦退火策略。此外,为了提高模型对于不同数据变换的敏感性,我们还在训练过程中进行了数据增强,包括图像的翻转、缩放、拉伸、扭曲、镶嵌和反转变化
[14]
。
在检测模型方面,我们利用置信度阈值和IOU阈值两个关键参数进行校准。通常,可信阈值的建议范围在0.1到0.5之间,IOU阈值的建议范围通常在0.3到0.7之间
[23]
。通过对照实验,我们发现当置信度阈值和IOU阈值都设置为0.4时,模型的性能较为稳定。因此,在本研究中,我们将这两个阈值都设置为0.4。为了评估模型的性能,我们采用了F1分数和平均精度(mAP)分数作为评价指标。F1分数结合了精确度和召回率,能够全面反映模型的准确性
[15]
。
C表示总类别数目
APi 表示第 i 类的 AP 值)
经过五次训练和验证,我们计算了四类街头摊贩的平均准确率,分别为地面摊贩类45.3%、简易装备摊贩类46.1%、三轮车摊贩类65.4%和小货车摊贩类63.4%。从结果来看,三轮车摊贩类和小货车摊贩类的精度较高,这主要得益于它们显著的可识别特征和较少的干扰因素。相比之下,地面摊贩类和简易装备摊贩类的精度较低,这可能与它们与其他行人或正规街头商店的混淆以及摆摊群体年轻化带来的装备多样化有关。
通过多次对照实验训练,模型的波动逐渐趋于平缓,其精度和泛化性能也得到了一定保证。最终,我们选择了MAP得分最高的检测器用于后续的图片识别任务,图4展示了该检测器的精度-召回曲线。
在工作日(12月8号和12月22号)的分布统计中,如图 5(a)所示。早晨8:30至9:30的高峰期,流动摊贩主要聚集在地铁站点或出入口附近。随后,在9:00至12:00的时间段内,街头几乎难觅摊贩的身影,同时该时段的路段人流量也相对较少。然而,到了中午12:00至1:30,一些办公楼下开始出现售卖鲜花和麦芽糖的摊贩,尽管数量不多。下午14:30之后,机动车道上开始频繁出现摊贩车,数量逐渐增多。特别是15:30之后,街头摊贩的数量明显增加,主要集中在幼儿园、中小学校园的路口或商圈附近。大约在17:00左右,中小学校附近的路口摊贩数量达到一个小高峰。
在周末(12月9号和12月17号)的分布统计中,如图 5(b)所示。上午由于人流量较少,街头摊贩的数量也相对较少,但在一些人流密集的地铁口或大型住区如泰华阳光海会附近的路口,仍可见到一些水果摊贩。下午2:30之后,机动车道上开始出现零星的摊贩,而在3:30至4:30左右达到一个小高峰。这些摊贩出现的地点与工作日相似。值得注意的是,在中小学路段附近,周末的摊贩数量明显减少,而其他路段的摊贩数量则相对稳定。
总体来看,工作日和周末的摊贩位置分布差异并不显著,但周末的摊贩数量明显减少。这可能是由于部分摊贩转向公园或商城等地点聚集,同时受深圳气温骤降的影响,摊贩的出摊习惯也可能发生了变化。
为了更直观地展示一天中流动摊贩在不同时间段的数量变化,绘制表3的柱形图。通过统计各时段的流动摊贩数量,我们发现流动摊贩的出摊规律在工作日和周末时间段形成了一个较为稳定的模式。上午时间段流动摊贩的数量较少,但工作日的早高峰时间段会有一定数量的流动摊贩。大部分摊贩集中于下午2:30左右开始出摊,并且在4:30-6:00期间流动摊贩的数量会达到一个高峰。
对研究区域内,流动摊贩的位置分布主要归为三类,如图6所示。第一类分布在各个主要十字路口,例如宝源路和新湖路的交叉口,这些摊贩在周末和工作日的差异不大,集中在下午时间段出摊,数量稳定且通常在特定位置经营多日。第二类集聚在一些人行道出入口,特别是在小区和城中村的入口附近。例如,在悦和路两侧,许多年轻人通过小推车或简易折叠桌在该路段摆摊售卖,摊贩的时间和地点相对固定。第三类摊贩聚集在地铁口等主要的公共交通口附近,例如在地铁出入口附近,这些摊贩会在地铁口附近整条路段上零星分布,摊贩数量大约在3-6个左右。
经过深度学习模型的应用,我们在街景图像和调研拍摄的图片数据中成功识别了流动摊贩的出现点位。此次检测专注于点位识别,不涉及具体类型和数量统计,且移除置信度低于0.4的检测目标图片。
在街景图像数据中,我们采集了43个流动摊贩点位,如图7(a)所示。而调研拍摄的图片数据集中,工作日识别到83个点位含有流动摊贩,周末识别到43个点位,分别如图5(a)和(b)所示。
为了更深入地了解流动摊贩的集聚情况,我们利用ArcGIS的核密度工具绘制了集聚图。街景图像数据的核密度分析结果如图7(b)所示,呈现从高密度到低密度的深蓝色到浅蓝色梯度。对于调研图像数据,我们分别对工作日和周末进行了分析,结果如图8(a)和(b)所示。
对比周末和工作日的集聚图,可以看出两者在主要分布区域上大致相似,但由于周末摊贩数量较少,集聚程度存在一定差异。特别是在研究区域的右上角,即坪洲大仟里购物中心附近,周末商城人流量激增,吸引了更多摊贩的涌入,导致集聚程度增加。
将街景图像和调研图像数据中识别的流动摊贩点位进行比较,我们发现街景图像的点位主要分布在出入口附近,尤其是社区和城中村的出入口;而调研图像的点位则主要集中在十字路口附近。这表明在实际场景中,流动摊贩更倾向于聚集在人流量较大且稳定的十字路口附近。
在集聚模式方面,街景图像和调研图像均呈现出多核集聚模式。
尽管两者在某些位置上存在相似之处,但不同位置的集聚程度存在明显差异。例如,在碧海湾地铁站附近,调研图像显示有明显的集聚,但街景图像中该区域的集聚程度较低。这可能是由于街景图像的采集时间主要集中在上午,而调研图像是基于整个日间时间段汇总的结果。此外,实地观察发现,该区域的流动摊贩主要在下午3点至6点出摊,这也解释了街景图像未能捕捉到高峰期的集聚情况。
另外,在宝源路右侧下半部分区域,调研图像显示在工作日和周末均有较为明显的集聚,但周末的集聚程度相对较低。而在街景图像中,该区域未检测出流动摊贩。通过分析该区域的主要用地类型,以教育用地为主,建设了坪洲小学和中英公学。因此,在学生放学时间段(3:30-6:00)内,流动摊贩数量较多。一旦学生离开,流动摊贩也会迅速撤离,这也解释了周末集聚程度相对较低的原因。由于该区域在一天中只有很少一段时间会有摊贩集聚,这也在一定程度上限制了街景图像的检测效果。