1.范围
本文件对深圳数据交易所开展数据定价中的术语和定义、定价原则、定价标的、定价流程、评价和改进内容等基本要求提出指引,为在深圳数据交易所上市的数据产品、数据工具和数据服务提供定价参考。
2.引用文件
包括但不限于《深圳市数据交易管理暂行办法》《深圳市数据商和数据流通交易第三方服务机构管理暂行办法》《数据交易服务规范》等规范文件。
3.术语和定义
定价标的:
包括数据产品、数据工具和数据服务及经主管部门同意的其他交易标的。
其中,
数据产品:
主要包括用于交易的原始数据和加工处理后的数据衍生产品。包括但不限于数据集、数据分析报告、数据可视化产品、数据指数、API数据、加密数据等。
数据服务:
卖方提供数据处理(收集、存储、使用、加工、传输等)服务能力,包括但不限于数据采集和预处理服务、数据建模、分析处理服务、数据可视化服务、数据安全服务等。
数据工具:
可实现数据服务的软硬件工具,包括但不限于数据存储和管理工具、
数据采集工具
、数据清洗工具、数据分析工具、数据可视化工具、数据安全工具。
定价参与方:
包括数据卖方、数据买方、数据商和第三方服务机构。
其中,
数据卖方:
在数据交易场所内出售交易标的的法人或非法人组织。
数据买方:
在数据交易场所内购买交易标的的法人或非法人组织。
数据商:
从各种合法来源收集或维护数据,经汇总、加工、分析等处理转化为交易标的,向买方出售或许可;或为促成并顺利履行交易,向委托人提供交易标的发布、承销等服务,合规开展业务的企业法人。
第三方服务机构:
是指辅助数据交易活动有序开展,提供法律服务、数据资产化服务、安全质量评估服务、培训咨询服务及其它第三方服务的法人或非法人组织。
定价机构:
本指南所指定价机构为
提供数据市场化定价服务的数据交易机构。
4.定价原则
数据定价应遵循以下原则:
公平性:确保所有定价活动在公开和公正的基础上进行,所有相关方都能访问到定价过程中的关键信息,以促进信任和公平竞争。
高效性:定价机制应设计得足够灵活,以迅速响应市场动态和变化,同时保持流程的高效率,减少不必要的延误和成本。
价值性:定价应真实反映数据资产的内在价值,综合考量其稀缺性、独特性以及市场的需求和潜在应用,确保价格与其价值相匹配。
合规性:在定价过程中,应严格遵守数据安全、资金安全、保密管理和隐私保护等相关法律法规,确保定价活动不仅符合市场需求,也符合法律和道德标准。
5.定价标的
定价标的为数据产品、数据工具和数据服务,应符合相关制度规定,明确相关信息。一是明确定价标的相关信息,包括但不限于定价标的性质、登记状态及对应登记信息等。二是明确定价标的对应的上市信息。三是明确定价参与方、定价机构以及其他定价相关方的基本信息。
6.定价流程
构建“估价-报价-议价-定价”的交易定价流程。包括数据商报价形成初始价、交易所估价形成建议价、买卖双方议价、生成定价结果和动态调整机制。
6.1交易所估价形成建议价
深圳数据交易所可通过数据探查、引入第三方评估机构结果等方式,结合交易平台历史交易数据生成数据交易价值评估结果。基于评估结果,交易所通过定价模型生成估价,并将估价结果反馈至数据商,作为数据商定价参照的重要依据。
6.2 数据商报价形成初始价
数据商或数据提供方根据自身的预期价格和交易所提供的参考建议价,在交易所对相应的数据产品进行报价。此报价成为数据产品最终展示价格,数据商可以选择直接采纳交易所的估价或基于自身情况和估价结果自行报价。
6.3买卖双方议价形成成交价
数据产品的最终成交价由买卖双方通过协议决定。交易所提供交易撮合和议价环境,但最终的成交价格由市场行为决定,反映了供需双方的共同意愿。
6.4定价的实施
定价过程中,采用市场法作为基础模型,以同类型数据产品的市场成交价作为定价基准。通过调整系数反映每个产品的个性因素,形成目标数据产品的建议价格。调整系数由多个因素构成,包括数据质量、数据贡献度、数据信用度和历史交易评价等。
6.5动态调整机制
随着市场的发展和历史交易数据的积累,估价模型会不断优化,更贴近市场实际,实现科学化定价。初期可能依赖于信息增益算法,随着时间推移,会逐渐引入更多的非信息增益算法,如独立性权重法、秩和比法、
因子分析
法和层次分析法等,以更全面地反映市场行为。
7.定价方法
7.1成本导向定价:确定报价下限
成本导向定价是定价最基本也最重要的方法,以全生命周期的各项成本支出作为定价的底线依据。任何定价方案都不应低于总成本水平,否则将难以维系数据资产的长期运营。通常需要计算三大类成本:数据采集成本、数据处理成本和存储传输成本。其中,数据采集成本分析包括:(1)数据源获取成本数据源往往需要付费购买,如第三方数据、行业报告、专利技术等;(2)人工采集成本对于需要人工采集的数据,如线下实地调研、发放问卷、访谈等,需要计入相应的人力成本;(3)第三方数据采购成本。如果直接向数据供应商采购数据,则需要计算数据购买费用。数据处理成本分析包括:(1)数据清洗成本原始采集数据通常存在诸多质量问题,如重复、格式混乱、缺失、异常等,需要对数据进行全面的清洗、标准化处理;(2)数据标注成本对于需要标注的数据,包括众包标注或内部团队标注;(3)算法模型训练成本主要包括:硬件成本、云服务费用、能耗成本等。数据存储与传输成本包括:基础设施投入、带宽费用和运维成本等,计算公式为: