粤港澳大湾区规划中的城市关键词
粤港澳大湾区的提法提了一年多,最终出来了一个规划,市场反映热烈,其实这个规划与以往最为不同的,是在于将香港、澳门和内地城市放到一起进行规划。
粤港澳大湾区规划的特征如何,不同城市的重要性,至少是在规划中的重要性有什么差异,通过分词可以提供一个量化的视角。本文的分词分成以下两步骤:1)在规划文本中选取涉及某个城市的句子,由于自贸区在近几年推进改革开放有重要意义,也是大湾区改革方面的核心,因此广州、深圳、珠海的统计加上南沙、前海、横琴的数据。2)对选出的句子按城市分组,每一组句子不重复,但不同组之间句子存在重复,再进行分词。分词前加入部分本规划常出现的专用词,分词后删去停用词,包括一些规划中经常有到的推进、支持、探索,然后按城市分组统计分词情况,统计词频并输出词云。
城市 | 次数(句子) | 次数(词) |
---|---|---|
香港 | 76 | 94 |
澳门 | 70 | 85 |
深圳 | 40 | 35 |
广州 | 38 | 40 |
珠海 | 31 | 19 |
佛山 | 9 | 8 |
中山 | 8 | 7 |
东莞 | 7 | 7 |
江门 | 7 | 6 |
惠州 | 6 | 5 |
肇庆 | 5 | 4 |
- 从各城市提及的次数上看,香港、澳门涉及句子均超过70,远超过第三名的40,如果从词语提到的次数上,频率均在第三名的2倍以上,其实还有很多“港澳”这样的字眼,可以看到,港澳两地的地位确实十分特殊。
- 规划中提到了4个中心城市,规划中略有差异,除了香港、澳门提及次数远远高于其他,另外就是珠海,广州、深圳、珠海涉及句子都在30-40之间,但是提及珠海次数只有19次,仅为广州、深圳的一半,主要是相当部分涉及珠海的内容直接提交横琴,一方面是自贸区的特殊地位,另一方面珠海的定位与澳门紧密关联。
- 实际上还有一处有意思的地方,各城市按句子统计提及次数的排序和按词语统计基本一致,唯一不同的一处在于深圳和广州,提及深圳的句子对于广州,但是“广州”一词出现次数更多。
- 总体上看,规划有两个方面的特点,一是主要词语是地名,并且多数地区存在联系,二是十分强调创新,显示的前20个关键词中,几乎都出现创新,唯一的例外是佛山,但提到转型。
- 如前所述,香港、澳门是规划的重点,经常同时提起,澳门组中第二是香港,香港组中第二是澳门。其他地域的联系上,香港强调深圳、广州、国际,澳门涉及横琴、深圳、广州、葡语,经济领域香港提及基金、服务、投资等金融、服务业,澳门提及旅游、服务。
- 广州和深圳在定位上存在错位,但从关键词上看,似乎有许多接近的地方。与广州联系的地域,主要是深圳、香港、南沙,还部分涉及澳门和珠海,深圳则是广州、香港、前海,也涉及澳门和珠海,并提到深港,除了各自的自贸区,几乎一致。其他方面,两地都提到了青年、创业、机场、国际。
- 珠海也颇有些特点,提及横琴的次数(22)多于珠海(19),相关的地域依次是横琴、澳门、广州、深圳,尽管有港珠澳大桥,似乎提及香港的不多,提到了港澳。其他词语中,提到机动车、口岸,主要还是与港澳的融合、往来的便利化方面。
- 佛山和东莞。佛山比较特别的地方在于提到较多的词语都是地名,前9个词语中7个是地名,从第二名开始分别是香港、东莞、珠海、深圳、澳门、广州,除了城市间的联系,更多是政策安排上与其他地区相同。东莞处于广州深圳之间,经济规模也接近佛山,远高于其他城市,但从词云上看,和中山、惠州、江门几乎一致。
- 肇庆。肇庆提及的次数最少,仅有5次,其经济实力于大湾区中也是最后一位,提及肇庆的句子中,广州和铁路出现的次数最多,肇庆主要以从属的地位出现。关键词中也有一些很是特别,除了前面的铁路,还出现了仅有的一个农产品。
- 其他4个城市。其他4个城市除了各自城市名称在词云中重要性有所不同,主要词语几乎是一致的,港澳、青年、创新、创业、基地。因为“支持港澳青年和中小微企业在内地发展,将符合条件的港澳创业者纳入当地创业补贴扶持范围”一句提及多个港澳青年创新/创业基地。
前文分析了从规划文本关键词的视角对大湾区规划的理解,尤其是对各城市特点差异的理解。但总体来看,这种方法在衡量城市的重要性更为有效,衡量城市特征可能存在一定缺陷。城市分组的词频统计中,多次出现其他城市,可能是两个城市之间往来密切,规划中统一安排以达到融合发展,但也可能是两者具有某些相同特征,共享一项政策(比如惠州和肇庆)。此外,对于提及次数较少的城市,难以从词频统计获取特征信息,东莞、中山、惠州、江门最主要词语几乎都是一致的,只是来自同一句话,描述差异性的语句反倒在词频统计中不明显。
1 | import docx |