GIS笔记 | 本科FYP之数据预处理
序
真的好久好久没写东西了,掐指一算本科四年也就这样迷迷糊糊过去了。实在遗憾自己没做太多的事情,又因为接连不断的疫情在不同的地方频繁受困。是时候再写写东西了。 Final Year Project (FYP),在大部分高校通常是毕业论文/毕设,好像是大四竭尽一学期努力搞出来的。但这玩意好像在我校并没有那么神圣的地位?因为对于我们来说则只算其中的一个“课程”,在第一学期和第二学期(上半)都是被其他六门课无情挤占着,毫无地位,只能在日复一日的大夜中尽情挥洒汗水与泪水。当然,系里好心再最后给了你两周时间“打包”FYP。但再怎么说,它也有足足10学分,不容小觑,对于下半年能不能续期学生证来说,还是有挺大的影响方法概述
这次的研究基于五个维度和十四个测度指标所构建起的可步行性评估框架。该框架利用了四种类型的数据:步道网络、POIs、街景、问卷。图1展示了研究的数据处理流程和其对应的测度指标/维度。
图1: 研究方法框架
基础数据
接下来讲讲这四个基础数据的来源和预处理。步道网络数据
步道网络数据自然是通过喜闻乐见的OpenStreetMap获取的,当然因为我研究区域的尺度比较小,国内又没什么编辑者,因此我还是提前先把莲花新村的路网完善了,再下载,同时我也把校园区域的路网一并完善了,留给学弟学妹们发挥啦,也算是简单做点贡献了。
图2: 研究区域的OSM地图,丰富内容的后社区与隔壁真是形成鲜明对比

图3: 处理好的网络数据
POIs数据
POI全称Point of Interest,即兴趣点。POIs数据通常来源于网络地图,当时了解了一种是自己找轮子扒下来,同时还有一些软件来转换火星坐标;另一种是也有很多专门扒在线地图的工具,比如水经注地图下载器云云,但这些软件动辄授权费上千,我暂时也不会用到很多,所以也没必要。作为懒人的我,最后还是搬出淘宝大法啦——直接淘宝找商家代下数据。当时没有货比N家,最后发现好像被宰了一大刀,默泪许久。 拿到POIs数据后,接下来清洗筛选,剔除掉与研究无关的类型(汽修店、停车场、政府机关之类)和重复的数据,这次研究不算很复杂,因为就百来个点,手动操作下就完事了。
图4: 研究区域的POI分布,典型的邻里中心形态
街景数据
说到街景数据也都是泪,因为研究涉及到小区内部,很多地方不可能会有百度街景,必然要亲自跑腿了。首先先基于路网数据打个渔网图,间隔100米,然后调整下渔网点,剔除掉封闭区域或非步行区域内的点(学校、河道),然后将剩下的点调整到最近的道路上,于是我要获取街景的观测点就出来了。 接下来就是拿数据了。百度街景没有的数据亲自实地拍摄,那两天,每天走3万步,硬是走完整个社区百多个点。最开始拿的相机拍摄,其实到了午后就发现阳光太强,渣渣相机光圈驾驭不住这光,还不如带有硬件HDR的手机,遂后大半全用手机拍摄。 实地跑完回宿舍开始获取百度街景数据。其实街景数据的爬取也有一些工具,但反正因为网络街景的观测点不多嘛,干脆在屏幕上设定一个标准视角参考线,直接暴力手动截半小时。当然这样难免有误差,大家还是不要学我,只是赶时间找个最高效率方案啦。 最后就是裁剪、标准化这些影像数据,我用XnConvert简单处理,以地平线中心为中心点,以长1000px的尺寸进行截取,然后把处理好的数据整理完放一边就可以准备做后面的语义分析了。
图5: 街景的观测点
问卷数据
问卷数据就不用太多提了,主要介绍下问卷设计和收集方式。 问卷设计直接拿来主义,请了Zhou et al (2011)对Neighborhood Environment Walkability Scale(步行环境量表)的中国本地化成果,其已经验证具有较好的信度和效度。至于问卷的收集方式,参考了Kelly et al. (2011) 的可步行性评价现场问卷的相关收集方法,如图6所示,在了街道的尽头或社区的出口向行人发放问卷,以获得受访者对街道的即时性评价。 冬天实在太冷了,近于零度的街上没什么人,收集问卷实在不多,本来打算3月初春再去收集一轮的,奈何疫情啊,最后这部分也不是什么重点了。
图6: 问卷的收集地点
GIS笔记 | 本科FYP之数据预处理
https://www.scjiang.com/archives/gisbi-ji-ben-ke-fypzhi-shu-ju-yu-chu-li