国内外游客量预测研究综述
纵览了有关旅游需求的相关文章,以大数据为切入点,将研究成果按照数据来源的视角划分为传统数据和网络数据两大类,并分别进行了介绍和分析,指出每种预测方法的优势和不足,为后续研究开拓了思路。
一、引言
2012年3 月,奥巴马政府宣布投资2 亿美元启动“大数据研究和发展计划”,标志着“大数据”时代到来!因而在数据来源上,大数据时代打破了传统政府统计数据滞后性的瓶颈。近年来,在人们自由可支配收入和时间的双重增长下,旅游业得到了快速的发展,景区的游客量也随之增长。2013年十一黄金周,韶山旅游区游客量井喷,日接待游客8.14万人次。可见游客量的预测对地方政府及景区有着至关重要的引导
作用。
纵观国内外关于旅游需求方法研究文献,迄今为止,共有10篇。其中,国外有7篇,除了Haiyan Song于2008年对旅游需求预测模型进行了较为完整详细的综述外,其余的6篇都只针对旅游需求预测方法中经济模型展开文献综述。国内的共有3篇,赵西萍(1996)对国际旅游需求预测方法做了概括性的描述;任来玲(2006)对已有的文献进行了统计,对预测方法结果的准确性进行综述;殷书炉(2008)也对旅游需求方法进行了评述,并简要介绍了预测方法。综上,学者都是以传统数据为基础,从而在方法和模型上对游客量预测进行了分类,在综述内容上大多对预测的结果进行分析,在预测方法上的介绍也较为粗略。
对此,本文主要基于数据来源的角度对游客量预测进行分类和综述,进而在对其优缺点进行分析之上展望未来的发展趋势和研究重点。
二、游客量预测简介
关于旅游需求预测的研究始于20世纪60年代,但绝大多数的研究成果出现于20世纪80年代。Haiyan Song针对SSCI、Google Scholar以及其它期刊,对2000—2006年中的游客量预测文章进行了综合,合计119篇。相比于国外,国内关于游客量预测的研究,据CNKI统计共有44篇,其中大部分集中发表于2006-2013年。
20世纪90年代以前,研究者主要划分为定量和定性预测方法。20世纪90年代以后,随着人工智能的引进,演变为时间序列、计量经济及人工智能。21世纪初,在大数据背景下网络数据成为游客量预测的创新点。故本文从数据来源上将游客量预测归类为传统数据(历史数据)和网络搜索数据。
三、游客量预测的应用
(一)基于传统数据的游客量预测
关于传统数据以下将从三个方面进行综述:一为时间序列模型,由于其不考虑其他解释变量的作用,只涉及到历史的游客量,其假设条件为未来是过去和现在变化趋势的延伸。二为计量模型称因果模型。其原理是找出预测变量的相关影响因素,建立回归模型,进行分析和预测。最后为人工智能模型,该方法近年来由于对数据具有很好的包容性和适应能力,从而被广泛的应用到旅游预测。
1、时间序列模型
时间序列的研究历史已达四十多年。纵观国内外研究现状,从方法的演绎过程中,将其分为基准方法和季节性方法
分析。
基准方法主要是指天真法一、天真法二。其中,天真法一也称无改变法,原理是t+1段时间内的旅游需求与t段时间的旅游需求相等,即Et+1=Et0。天真法二也称比例改变法,认为旅游需求随时间有定百分比的改变,即。在已有的研究中,大部分的学者都将其作为预测模型效度检验的基础。楚方林(1998)、Goh Carey,Law Rob(2001)、Goh,Law(2002)等学者都以天真法一和天真法二作为客源国游客量预测方法检测基准。
移动平均方法(季节性方法)由于旅游业存在着明显的季节性,因而季节这个显著特征变量成了重要的考察因素,最终形成季节性的自回归移动平均法SARIMA,其在2000年以后得到了广泛的研究和运用。关于移动平均游客量预测方法的研究,主要包含单个预测方法研究和对比研究。魏启恩(1997)基于ARMA和ARIMA对境外游客量进行了预测。Christine Lima(2000)使用ARIMA对澳大利亚在亚洲的三个主要客源国进行旅游需求预测。卿前龙(2009)基于ARMA对国内旅游人数、入境旅游人数以及入境过夜旅游者人数进行了游客量
预测。
2、计量模型
由于计量模型对旅游变化的解释性,能很好的为旅游企业和旅游政府所用,得到大量的研究。主要包括自回归分布滞后模型(ADLM)、误差修正模型(ECM)、向量自回归模型(VAR)和近乎理想需求系统(AIDS)等。关于ECM 的研究主要有Kulendran & Wilson(2000),Song& Witt(2000)等。Song and Witt(2006),Witt et al.(2004)等主要研究VAR。ADLM也主要由Song,Witt&Jensen(2003)和Song,Wong&Chon(2003)所研究。而拥有很好的经济理论基础的AIDS于19世纪80年代首次运用的旅游领域,其发展主要经历了两个阶段:一是单个模型;二是组合模型如De Mello& Fortuna(2005),Li et al.(2004)等的ECM –AIDS;Li,Song et al.(2006)的TVP–LR-AIDS和 TVP–EC-LAIDS模型等,且都得到了较好的预测准确度。但计量模型依然存有缺点,其局限想主要表现在以下三个方面:一是过分依赖已有的变量,二是难以预测自变量自身的变化趋势,最后是自变量的实用性随着时间而变化。
3、人工智能模型
人工智能模型主要包括神经网络模型、灰色理论、模糊时间序等。
神经网络是一种能模拟人脑处理和智力功能的智能化系统。它最主要的优势是能够适应并不是十分完美的数据,而且不局限于数据的线性性。于20世纪90年代末期运用于旅游预测中,在2000之后得到了广泛的运用和改善。关于神经网络预测准确度,很多实证研究都表明神经网络优于时间序列和多元回归模型。Burger,Dohnal,Kathrada & Law(2001)研究表明神经网络优于天真法一、指数平滑、多元回归、遗传回归等。之后部分学者也相继得出了此结论(Cho,2003;Kon &Turner,2005;吴江华,2013)。虽然神经网络具有传统预测方法无法比拟的优越性,但它依然存在缺点,缺乏理论支撑,不能为旅游企业和政府深层次的运用。
灰色理论主要以小样本、贫信息、不确定为研究对象。由于旅游市场的复杂性及不确定性,灰色理论成为游客量预测的有效方法之一。王道林(2004)依据该理论对黄金周的游客量进行了预测,之后相关学者也依据灰色理论对旅游目的地的旅游需求进行了实证研究(袁柳,2010;阮氏海宁,2013等)。
模糊时间序列由Song和Chrisom1993年首次提出,当数据资料不完整或不合理时可用此方法解决,主要用于短时间的预测。在现有文献中讲模糊时间序列运用于游客量预测中的较少,可待进一步研究。Wang(2004)发现德国到台湾的游客量预测中灰色模型则适应于美国和中国香港到台湾地区的入境旅游预测,而模糊时间序列适合于中国香港到台湾地区的
预测。
(二)基于网络数据的游客量预测
1、理论研究
在理论研究方面,现有文献中主要从网络数据与实际数据之间的相关性和作用机理等方面进行论证。大部分的学者都证实了网络搜索量与实际客流量之间的强相关性以及导引作用。国外学者JIE Lu(2004)、Andrew P. Davidson和Ying Miao Y(2005)都发现网站信息流对游客旅游行为具有引导潜力。国内学者路紫等多位学者也都证实了旅游相关网络搜索量与实际游客人数之间的相关性及网络信息流对旅游流的导引作用(路紫,2007;陈争燕,2009;龙茂兴2011),与此同时,李山(2008)发现旅游景区的网络关注度对其实际游客量具有前兆效应,但前兆效应呈现出一定的不确定性。
2、实证预测研究
将网络数据应用于游客量预测的研究可谓历历可数。李君轶(2007)通过Web点击率数据为自变量,结合人口数量、GDP、该省的网络普及率、各客源地游客人均在陕旅游消费、客源地省会城市到西安的机票价格等形成引力模型,从而对陕西省国内游客进行预测。黄先开(2013)基于百度指数,以北京故宫为例,通过对比分析发现加入百度关键词后的自回归分布滞后模型的预测精度比没有百度关键词的ARMA 模型提高了12.4%。任乐(2014)通过结合历史数据和百度合成指数,构建了北京市旅游客流量预测模型,其绝对平均误差仅为 5.08%。
四、应用效果及发展趋势
(一)应用效果
关于目前各种预测方法的评价可谓是百花齐放,且都尚未形成统一的结论。预测结果的标准主要来自于三个方面:一是预测的准确性,二是预测成本的高低,三是预测方法的可行性。从总体上看没有一种方法能胜出。但在预测成本方面,网络数据的可获得性最高且及时,相比历史数据的滞后性与不全面性有很大的改善。由于受到数据的影响,可以根据实际情况来选择预测方法,一般情况下:如果影响游客量因素的数据不能得到,预测效果较好的是时间序列模型;如果影响因素的波动较大且需要估计时,解释性的回归模型的效果会较佳;最后如果影响因素是已知且确定时,神经网络最佳。
(二)发展趋势
1、预测方法的多样化
随着研究的跨学科性,游客量预测的方法已不仅仅局限于某一个领域,从数理统计、问卷调查到计算机等,方法越发的多样化,这是其一。其二,在预测模型方面,部分学者通过两者或多种模型组合而形成新的模型。如Montserrat(2005)将跃迁概率矩阵和遗传算法相结合。廖治学(2013)的AB@ G 集成预测模型等。组合模型的出现在预测上提高了其准确度,但由于这些组合模型尚处于尝试性阶段,且每种模型的约束条件及原理都有不同,如何选择预测模型以及在理论基础下如何组合,从而使组合的模型扬长补短,都需要研究者去探究,将预测方法从个别走向一般。
2、数据来源的多样性
随着大数据时代的兴起以及网络的普及,对于游客量预测中的历史数据的来源,已经不仅仅停留在抽样数据、调查数据这类结构数据中。网民依据自己的需求去网上寻找所要的信息并挖掘出所需要的数据已逐步进入研究者的视野。在游客量预测中,学者利用网络数据的易获得性及及时性,通过点击率、旅游网站、文本分析等从中获取所需要的数据和内容进行预测,在一定程度推动了游客量预测的发展,打破了数据来源滞后性的局限。但由于网络信息内容的庞杂性、更新的迅速性等,如何在其中寻找有价值的信息?网络数据与历史数据之间的关系?将是学者进一步研究的方向。
五、结论
纵观文献发现每种预测方法的优劣势并存,技术先进的并不一定能将传统的预测方法取而代之。在预测方法的选择下,应该根据已有数据的特点选择合适的预测方法,在量的基础上实行质的飞跃,要求研究者将预测方法从个案的实证走向一般性、规律性研究结果。在运用实践方面,如何使预测成为旅游企业和旅游政府提供有效的管理工具。数据来源方面,由于网络数据的运用尚处于初级阶段,如何在海量的数据中挖掘有价值的信息,了解潜在顾客的需求。
(作者单位:湖南师范大学旅游学院)