您的位置: 善知识与道 > 简历

【前沿】玩转大数据——成都各区域主导产业分析

2019-04-10来源:善知识与道

成都,作为“新一线城市”,在“人才大战中”重磅推出历年来含金量最高、惠及面最广、支持力度最大、针对性最强的人才政策,让一大批青年人才落户蓉城。这么多新成都人要去哪工作,选择哪里最巴适?本文将利用大数据的研究方法来告诉你哪些区都有什么主导产业,各区域能够给这些新宠儿提供什么样的工作岗位。



大数据来源之POI数据(Point of Interest):即兴趣点,是对真实地理实体数据的点状表达,具有空间和属性信息,具有精度高、覆盖范围广、更新快、数据量大等优势,通过地理信息平台的分析处理,能够直观有效的表达设施分布集聚程度与空间分布情况,在城市研究中广泛应用,目前国内外学者基于POI数据的城市研究多数集中在:城市结构研究、城市边界提取、城市人口时空变化、城市功能分布和城市设施便利程度等多个方面。


了解到大数据来源后,我们接下来看看大数据玩转之思路分析。


核密度分析:对POI数据分析主要采用核密度分析。它能有效揭示各服务设施的空间分布特征。通过对一定范围POI数据半径密度值进行估算,判断成都各区域服务设施的密度大小,从而反映出不同区域服务业密集程度和分布情况。


空间属性查询:POI数据具有名称、类别,地理坐标等详细信息,能够根据属性进行统计,并结合高德、百度等在线地图进行空间落位。通过对某一类POI数据进行数量、类别的统计和在空间上落位,可以进一步判断成都各区域某一类主导产业的发展情况。


突然来了个“核密度”,感觉是不是有点懵,别怕,我们来拓展一下核密度知识,提升一下专业能力。


首先让我们了解一下什么是“核”:如果不了解背景,看到“核密度估计”这个概念基本上就是一脸懵逼。


我们先说说这个核 (kernel) 是什么。首先,“核”在不同的语境下的含义是不同的,例如在模式识别里,它的含义就和这里不同。在“非参数估计”的语境下,“核”是一个函数,用来提供权重。例如高斯函数 (Gaussian) 就是一个常用的核函数。


让我们举个例子,假设我们现在想买房,钱不够要找亲戚朋友借,我们用一个数组来表示 5 个亲戚的财产状况: [8, 2, 5, 6, 4]。我们是中间这个数 5。“核”可以类比成朋友圈,但不同的亲戚朋友亲疏有别,在借钱的时候,关系好的朋友出力多,关系不好的朋友出力少,于是我们可以用权重来表示。总共能借到的钱是: 8*0.1 + 2*0.4 + 5 + 6*0.3 + 4*0.2 = 9.2。那么“核”的作用就是用来决定权重,例如高斯函数(即正态分布):


图1  高斯函数分布


如果还套用上面的例子的话,可以认为在 3 代血亲之外的亲戚就基本不会借钱给你了。


最后呢,一般要求核函数有下面两个性质:

归一化:

对称性:对所有 u 要求 K(−u)=K(u);


核密度估计:理解了“核”,核密度估计就容易理解了。如果我们画直方图,其实目的是画出“概率密度函数”,而直方图本质上是认为频率等于概率。但这种假设不是必然的。核密度函数就是一种“平滑(smooth)”的手段。相当于是“我说我很牛逼你可能不信,但你可以听听我的朋友们是怎么评价我的,加权平均下就能更好地了解我了”。于是乎:设(X1,X2...Xn)是独立同分布的 n 个样本点,它的概率密度函数是 f,于是我们估计:

上面式子中 h 是人为指定的,代表“朋友圈”的大小,正式的叫法是“带宽”(bandwidth) 。而 x− 就是自己与朋友的亲疏程度,当然最后要正归化到 [-1, 1] 之间。下图是直方图和核密度估计的一个对比:


图2  直方图和核密度估计对比图


选择不同的带宽,核密度估计的结果也大不相同,因此人们研究了一些算法来选择带宽。这里就不细说了,具体的可以查看相关资料。



接下来就是正餐的时候了,来看看我们今天研究的内容:


研究POI数据来源于百度地图、高德地图、大众点评。针对服务业发展特征,我们将数据划分为两大类——生活性服务业和生产性服务业,并根据数据特点选取15种小类数据进行分析。



注:这里为什么要将数据分为这两大类呢?是因为这两者是有区别的。生产性服务是市场化的非最终消费服务,是作为其他产品和服务生产的中间投入的服务,是面向生产的服务,具有专业化程度高、知识密集的特点。生产性服务业包括交通运输业、现代物流业、金融服务业、信息服务业、高技术服务业和商务服务业等重要行业和部门。而生活性服务业是服务经济的重要组成部分,是国民经济的基础性支柱产业,它直接向居民提供物质和精神生活消费产品及服务,其产品、服务用于解决购买者生活中(非生产中)的各种需求。

表1 选取服务业POI数据分类表


生活性服务业选取原则:根据人们日常需求从吃穿住行、文化、教育、医疗等方面选取。其中日常金融方面,考虑到ATM设施常与银行网点一起设立,故选取ATM的POI数据,来衡量日常金融服务的便利程度;便利超市主要涵盖24小时便利店、大型超市和日杂超市,来反映日常消费的便利程度;文化设施主要包括博物馆、美术馆、展览馆、档案馆、科技馆、图书馆和文化宫,来反映公共文化服务水平;医疗设施主要包括综合医院、专科医院、急救中心、诊所,来反映医疗服务水平;中学、小学、职业技术学校来反映教育服务水平。


生产性服务业选取原则:根据生产性服务业包含的产业门类,主要选取培训机构、科研机构、传媒机构、网络信息公司、金融机构、会展中心、商务酒店等POI数据来反映人力培训、研发设计、信息服务、金融服务以及商务服务业的发展水平。


具体分析过程:对每一类POI数据进行核密度分析,根据生活性服务业和生产性服务业POI数据核密度空间集聚度特征选取特定的核密度指标,并进行中心城区各区间指标对比,从而识别出具有优势的主导产业。然后通过空间属性查询的方式,对识别的主导产业POI数据进行再分类与数量统计,并空间落位到高德地图上,识别产业具体空间载体及其发展现状,来判断主导产业的具体类别。


以便利超市和培训设施为例,具体评价过程:对各区便利超市核密度比较,用ArcGIS中属性对各区核密度平均值统计如下(见表2),武侯区排名第一核密度平均值达3.32,说明在五区中日常生活消费便利性最好,青羊区排名第二核密度达2.02,而锦江区、成华区和金牛区核密度平均值都为1.70左右,说明这三区在日常生活消费便利性方面相接近。


表2 各区便利超市核密度平均值统计表


对各区培训设施核密度比较,用ArcGIS中属性对各区核密度最大值统计如下(见表3),武候区排名第一核密度最大值达8.55,说明在五区中人力培训产业发展最好,锦江区和青羊区分别名列第二第三,核密度最大值达7.00左右,说明两区在人力培训产业上相接近,锦江区比青羊区发展略好,金牛区排名第四位,成华区核密度最大值只有4.59,排名最低,说明在人力培训产业发展最弱。


表3 各区培训设施核密度最大值统计表


综合排名评价:通过对各区15类服务业核密度评价排名,可以发现青羊区、锦江区和武侯区占据中心城区各类服务业的领先位置。


青羊区在生活性服务业上文化设施、医疗设施以及教育设施在五区中排名第一,而ATM、便利超市、餐饮方面排名中等,说明青羊区在城市公共服务上具有较高水平,在文化、教育与医疗等服务业的发展上处于领先位置,而在日常生活服务上仍需提升。在生产性服务业中仅金融机构排名第一,说明青羊区在金融服务业上发展良好。青羊区在文化相关产业与金融服务产业上具有优势。


锦江区在ATM和餐饮方面领先,说明在日常消费便利程度上更具优势,在生产性服务业方面传媒机构、会展中心和商务服务处于领先,表明锦江区在高端商务和传媒产业具有优势。


武侯区在便利超市的分布上处于领先,说明日常生活便利程度更具优势,在生产性服务业方面培训机构、科研机构、网络信息公司处于领先,说明武侯区在大数据、互联网以及科研等新兴高端产业具有优势。


表4 基于POI核密度分析各区现代性服务业排名


空间落位分析:通过核密度分析我们识别出青羊区优势产业为文化产业与金融业,为了进一步识别产业的具体类别,我们将青羊区文化设施和金融机构POI数据进行再分类统计,并结合高德地图落位到具体空间地点,通过对具体的空间载体和其发展现状,来判断文化产业与金融业的具体类别。


青羊文化设施大多集聚在区内几处主要文创产业街区和大型文化场馆,同时目前已形成一批在全市、乃至全国范围内初有品牌、知名度高的文创场所,如发展创意设计的明堂、当代著名建筑师刘家琨设计并入选 2016 威尼斯建筑双年展的西村大院、依托峨眉电影制片厂发展的峨影影视传媒创意体验区、宽窄巷子文创区、文殊坊等。说明青羊区在文创产业上具有良好的发展平台,未来在文创产业及其衍生产业上具有极大的发展优势。


图3 青羊区文化设施POI数据空间落位分析图


青羊区传统金融业优势明显,以国有大银行与保险为主。空间上青羊区天府广场与骡马市周边是金融类产业空间最为集聚的地区,其次是锦江区天府广场东侧区域,最后是武侯区的桐梓林和高新区的金融城区域。从数量上和企业类型上看,青羊区以国有银行的省、市支行以及传统的保险企业区域总部为主,锦江区则集聚较多的外资投资公司以及新兴保险企业,而高新区主要以省、市级的城市发展基金公司以及资产管理与投资等新兴金融企业为主。


单从企业的实力来看,国有银行及传统保险类企业的区域总部相较于外资银行与新兴金融类企业在资本运作实力方面具有明显优势,有利于青羊依托传统的具有雄厚资本的金融机构向新兴金融与创意产业等新兴经济体系延长与拓展。


图4 各区金融企业POI数据类型与数量统计图


图5 天府广场以南锦江、武侯商务楼宇金融企业统计


图6 天府广场以北青羊商务楼宇金融类企业统计


随着时代发展和技术革新,互联网迅速发展,对于城市的研究已不局限于对传统数据统计的分析,而面对城市发展所涉及到的经济、产业、社会、环境以及土地等诸多因素,如何快速有效的把握城市发展核心要素,也已成为研究城市发展的关键,利用POI数据对于城市主导产业的识别,为我们提供了另一种新的途径。大数据的技术分析手段将进一步增强我们对城市的认知,如何探索更多新技术方法应用在城市发展研究中将成为新时代背景下城市规划创新发展的重要挑战。



相关阅读

【前沿】学术期刊前沿分析

【前沿】GIS在山区轨道选线中的应用

【前沿】遥感技术于城市规划的应用

【前沿】2018年3月至2018年8月国内外重要规划大会信息

【前沿】2018年2月-2018年7月规划前沿信息•规划政策及领导讲话篇





(长按二维码识别就可关注我哦^-^)


本文由善知识与道整理,内容仅供参考,未经书面授权禁止转载!图片来源图虫创意,版权归原作者所有。

相关阅读