房地产批量估价技术的应用分析
摘要:虽然我国目前还没有对房地卒但右环节进行普遍的房地产税税收征管,但是存量房交易的税收核价环节以及金融机构的风险控制部门等都已经衍生出了对房地产子[毗量估价的需求。市场上或多或少地也出现了一些批量估价的系统或产品,在批量估价技术方面已经具有了一定的社会实践基础。本文就目前几个主流的房地产批量估价技术,做简要的汇总和分析,希望有助于房地产批量估价技术的深入探讨和研究。
关键词:地产批量估价;标准价调整法;多元线性回归模型;数据挖掘
本文将根据房地产批量估价技术中的人工参与程度,将现行批量估价的技术方法分为以人工为主的技术方法、以计算机技术为主的技术方法和以人工与计算机技术相结合的技术方法三类,来进行讨论和研究。这里的以人工为主,是指在参数设定、价格评估等环节主要还是依靠估价师的知识和经验;以计算机技术为主,是指参数的设定、价格评估等都是通过预先设定的算法由计算机从大量的案例数据和其他相关数据中进行挖掘和分析得到的。
一、以人工为主的技术方法之标准价调整法
1.标准价调整法的概念
标准价调整法,作为市场比较法派生出来的一种方法,类似于城市动拆迁评佔中的基准价格修正法和香港的指标估价法,但又有其自身的特点。标准价调整法可定义为:在一定区域内对所有被估价房地产进行分组,使同一组内的房地产具有相似性,在每组内设定标准房地产并测算其价值,利用相关调整系数将标准房地产价值调整为各宗被估价房地产价值或价格的方法。标准价调整法适用于估价对象物业属性和估价特性较为近似的物业,尤其适用于小范围且价格影响因素少的房地产批量估价。
2.标准价调整法在不同物业类型中的应用
标准价调整法的实施涉及了估价分区的划分、标准房的设定、价格修正系数的设定以及标准房价格的评佔。无论应用于哪种物业类型,这四个步骤必不可少,差异在于各步骤的具体实施方法不尽相同。
在住宅物业的批量估价中,往往以小区作为估价分区的划分,在一个小区内根据一定规则设定一个标准房,再由有经验的估价师根据实地调研情况设置标准房与其他房屋之间的价格差异系数,最后仍旧由估价师定期对标准房进行估价,并通过已设定的系数求得所有物业的价格。
在办公物业的批量估价中,差异在于分区是以楼栋或项目来划分,后续步骤和住宅物业的评估一致。
在集中型商业物业或工业物业中,可以借鉴上述方法来进行操作。但在沿街零售型物业中,由于沿街零售性物业分布广泛,没有明显的集中趋势,并且价格影响因素的差异较大,导致标准价调整法的应用也与其他物业类型有较大不同,主要表现在估价分区的划分和价格修正系数的设定这两个环节。现有的技术方案一般采取两级调整。按商圈(或类似因素)将城市区域划分成诸多估价分区,在每个分区中设定一个标准商铺,称为区域基准商铺。之后在分区内再进行一次估价分区的划分,这一划分以路段为分区,在每个路段中设定一个标准商铺,称为路段基准商铺。估价人员经过现场调研后,需设置两级修正系数,,即区域基准商铺与路段基准商铺的价格调整系数,以及路段基准商铺与路段内其他商铺的价格修正系数。最后经估价师定期对区域基准商铺进行估价,并通过两级系数的修正求得所有商铺的价格。
3.标准价调整法的优点
(1)在规模较小的城市中,可以实现绝大部分物业的批量估价需求,具有较强的实用性。
(2)可以达到较高的批量估价覆盖率。
( 3)估价准确性较好,并具有较好的质量可控性。
(4)除建设初期投入的人员成本和时间成本较大,后续维护的成本适中。
4.标准价调整法的缺点
(1)由于人工作业的工作量太大,不适用大、中型城市。
(2)对估价人员的经验要求较高,尤其是系数设置与标准房的价格评估等环节对质量的要求很高。团队运作时,需要具备较高的质量管理能力。
(3)不同物业间的系数关系可能受到市场、规划等因素的影响,需要定期进行监控和维护,有一定的难度,容易疏忽、遗漏。
二、以人工为主的技术方法之多元线性回归模型
1.多元线性回归模型简述
多元回归分析是目前在国外批量估价中占主流的校准技术,包括线性回归分析和非线性回归分析。其基本原理是,在大量样本的基础上,通过对变量、误差的假定,依靠最小二乘法来拟合因变量与自变量关系,从而建立数学模型。
多元线性回归方程模型为:
多元回归是一个统计学方法,运用时需要和经济学理论结合,实践中对多元回归模型的应用是基于特征价格理论。国内关于运用特征价格理论来进行批量估价也有较多的研究和学术论文,但绝大多数还处于理论研究阶段。
2.多元回归分析的主要步骤
多元回归既可以用来预測售价,也可以用来预测租金,甚至可以用来统计其他中间参数。在步骤上不同类型的物业没有明显的区别,只是在变量的选择与量化上有所不同。为便于表述,下面以预测办公物业价格为例来进行阐述。
(1)选取样本:为了训练预測办公物业价格的模型方程,在目标范围内选取一定数量的样本,:,调研其价格信息和基础信息。这里的重点是样本对总体的代表性以及样本数据采集的准确性。
( 2)构建办公物业价格影响因素体系:通过调研分析以及房地产专家意见调查,归纳出可能影响办公物业价格的特征变量,并进行赋值量化。
(3)模型拟合:观察、分析特征变量的变动规律,采用统计分析软件进行分析,对模型和特征变量赋值不断地尝试和修正,找出合理的价格和各特征变量之间的定量关系。
(4)模型检验:最终得到的模型是否成功,取决于如下的检验:经济意义检验、统计检验、计量经济学检验以及模型预测检验。其中统计检验包括了拟合优度检验和显著性检验;计量经济学检验包括多重其线性检验及异方差检验等。但凡通过上述所有的检验,即可认为模型已成功建立。
(5)模型应用:对办公物业的特征变量进行赋值,代入最终的模型进行自动计算,即可评估办公物业的价格。
3.多元线性回归模型的优点
(1)多元回归方法所涉及的工作量主要在于特征变量的数量以及特征变量的赋值容易程度,受城市规模的影响较小,因此可‘以适用于大中型及以上城市。
(2)多元回归方法通过拟合因变量与自变量关系从而建立数学模型,这个过程与何种物业类型无关,因此理论上多元回归方法适合各类型物业的批量估价建模。
(3)通过“调整R方”和“标准误差”两项指标,基本可以判断和掌握模型价格估计的准确度,并且可以对模型进行持续改进,从而保证批量估价的淮确性。
(4)在市场稳定时期,由于自变量与因变量的关系也较为稳定,因此模型更新维护的成本较低,从而价格更新的成本也较低。
4.多元线性回归模型的缺点
(1)在不同区域或不同市场,价格的影响因素不尽相同,建立的回归模型也不相同。因此对每个城市每个物业类型的市场需要分别建立回归模型。
( 2)多元回归建模研究过程的理论假设、建模方法、数据采集等环节,需要综合的知识、经验和技能。除了房地产估价师所需具备的估价理论知识、实务经验、调研及价格判断能力外,还需要统计学、经济学等多学科知识,对人员和团队的综合能力要求很高,而这往往是传统估价机构所欠缺的。
( 3)对样本数据的准确性要求较高。如果没有准确的样本数据,建立科学的经济学模型则为空中楼阁。而获得准确的样本数据,长久以来就是个难题,其中有人为的因素(如交易避税),也有客观的因素(如商业物业的交易活跃度低)。
(4)在市场波动大的时候,原有模型可能失效或者预测能力大幅下降,而模型的迭代或维护周期较长,可能无法及时调整。
三、以计算机技术为主的技术方法
房地产批量估价领域中以计算机技术为主的技方法主要是基于大数据的数据挖掘。这一技术的应用最早开始于房地产互联网企业,如我们熟知的搜房、安居客等房源网站,后来逐步被引入到房地产批量估价的技术或产品研发中来。
1.数据挖掘的方法和原理
数据挖掘的前提是需要有大量的数据可供挖掘。随着互联网不断在各行各业渗透,房地产经纪行业中出现了众多房源网站,并逐步成为房地产经纪人发布房源信息招揽客户的主要渠道。一个房源网站中可以搜索的房源数量多达数十万甚至上百万条,并且每天都有数万条以上的数据更新。这样的网站有不少,为房地产的数据挖掘提供了可行的前提。
其次,结构化的数据为数据的采集提供了便利。在房源网站中,房源已经按小区进行了分类,经纪人发布哪个小区的房源,则该房源将展现在该小区的搜索项下。至于面积、户型、价格、楼层以及装修等参数,也都以格式化的方式来展现。因此,利用互联网爬虫等抓取技术,可以很方便地将这些网站的房凉信息抓取下来,建立房源案例数据库。
接下来是数据挖掘工作。数据挖掘一般是指从大量的数据中通过算法搜索出隐藏于其中的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。根据上述定义和描述可以发现,数据挖掘的核心是算法。而这个算法在不同的批量估价系数或产品中都不相同,算法的优劣也决定了不同系统或产品的优劣。
2.数据挖掘方法的优点
(1)高效无疑是数据挖掘方法的最大优点。—旦完成对算法的研究,价格估算的工作都可以交由计算机来完成。
(2)对整体市场价格运行的反映具有较高的准确度。
3.数据挖掘方法的缺点
(1)对微观市场价格运行的反映可能存在较大偏差。微观市场中,例如一个住宅小区,其挂牌房源的数量很有限,即使规模最大的小区,其挂牌房源也就是几百的数量级。由此来看,大数据挖掘的数据数量前提已不满足,从而影响了对微观市场的价格估计。
(2)批量估价的覆盖面不完整。互联网数据虽然总量巨大,但并非面面俱到。以住宅小区为例,一些体量较小的小区或者一些远郊区域,可能无法在互联网上被搜索到。因此,基于互联网数据挖掘的批量估价势必在覆盖面上存在缺陷。
四、以人工与计算机技术相结合的技术方法
房地产批量估价,尤其是涉税的批量估价对评估系统的要求主要有:全面覆盖所有物业、估价结果准确以及系统维护成本适中。根据前文对各方法的论述,单一方法很难实现上述要求。如标准价调整法若在大型或超大型城市中应用,将面临很高的运营成本;多元回归建模的更新维护周期较长,当市场出现快速波动时可能无法及时调整;基于大数据的数据挖掘在估价精度与覆盖面上有所欠缺。总之,无论从技术上论证,还是从实施效果来看,多种方法的有效结合是较为理想的,也是房地产批量估价技术的发展趋势。
实践中各方法的结合已得到普遍应用,并且各有巧妙之处,不尽相同。下面就几种简单的组合方式进行讨论。
1.标准价调整法与大数据挖掘技术的组合
数据挖掘可以满足一些活跃小区的价格估算,因为活跃小区的挂牌房源较多,能满足算法所要求的数据量前提,而不活跃的小区则无法为算法提供足够的“原材料”,因此不适用数据挖掘的方法。这时就可以运用标准价调整法来弥补。按照标准价调整法的原理,在不活跃小区的临近或相似区域内设置一个标准房,经人工调研后设置标准房与不活跃小区价格的调整系数。这样在算法得出活跃小区价格的同时,就可以利用预先设置好的系数一并计算不活跃小区的价格。
此外,在算法可以计算的活跃小区的价格中,根据前文所述,也有可能存在价格偏差。这时也可以应用标准价调整法的思路,设置活跃小区间的价格调整系数,来检验算法所得结果的合理性。
这一组合的应用前提主要是存在大量数据可供挖掘,因此适合房地产市场规模较大、“互联网+”比较发达的城市和地区。此外,在结合了大数据挖掘技术后,标准价调整法可以应用到大型及以上城市,克服了其原有的一大弊端。
2.多元回归模型与大数据挖掘技术的组合
除了对人员的能力及样本数据的质量要求较高以外,多元回归模型最大的弱点在于迭代问题。市场不断变化,模型不可能一成不变,当市场发生变化并导致变量之间的关系也发生改变时,原有模型的价格预计精度必然下降,此时必须对模型进行重新构建。
问题在于,市场价格变化未必会导致变量间的关系也发生变化(或变化很小),且当变量间关系发生变化时,人员主观上可能无法及时发现;当主观能够感受到变量间的关系出现变化时,往往已经有了很大的变化,此时再进行模型的迭代就已经晚了,之前的价格估算可能已经出现了错误。
大数据挖掘技术可以很好地弥补上述缺陷。大数据挖掘不仅可以直接计算某些具体变量,任何数据内在的规律和关联都可能应用大数据挖掘的方式进行探索和发现,并且能对极为细小的数值波动进行反应。利用数据挖掘的这一特性,我们可以建立对变量的波动监控,当波动超过一定的预设阀值时,即可启动模型的迭代更新。
这一组合的应用前提同样是存在大量数据可供挖掘。除了在城市规模有限等情况下不适用,在商业物业、工业厂房等物业市场也不适用。
3.标准价调整法与多元回归模型的组合
标准价调整法往往适用于特性相近的物业,如在一个小区中设定一个标准房,再设定标准房与其他房屋的价格修正系数。在价格更新时,求取标准房价格后,即可得到小区内所有房屋的价格。但当城市规模很大时,也就是有很多小区时,必须要求取所有小区的标准房价格,如仅以人工评佔得出的话,成本非常高。此时在求取小区标准房价格方面,采用多元回归模型的方法可以极大地减少人工和时间成本。
由于标准价调整法和多元回归模型都属于以人工为主的技术方法,理论上这一组合的应用几乎不受限制。在结合多元回归模型后,标准价调整法也可以扩展应用到大中型及以上城市。
从上述三个组合中我们可以看到,原单一技术的某些弊端可以被克服,整体技术方案的适用范围和效果可以获得较大提升和改进。实际研究和应用中可能有更多种的技术组合,且并不限于本文中论述的三个主流技术方法。多种技术的组合应用是房地产批量估价技术探索和创新的主要方向。
五、房地产批量估价技术应用中的几个相关问题
1.关于交易实例的应用
个案估价方法中的比较法、收益法、成本法及假设开发法等主要方法中,无论是直接的价格测算还是中间参数的测算,都离不开交易实例的应用。然而在批量估价中,根据选用的批量估价技术不同,对交易实例应用的情况不尽相同。
在标准价调整法中,对估价分区中的标准房进行定价,其实就是个案估价的过程。一般采用的是比较法,因此其中对交易实例的应用与个案估价中对交易实例的应用一致。标准房与各宗房地产单元的系数设定,也是从交易实例中进行统计和提取(实际操作中也有按估价师经验直接进行设定的)。
在多元回归模型中,交易实例的应用是作为样本数据来使用的。即根据多元回归模型的设计需要,按照样本代表性的原则和要求来进行交易实例的筛选。除了将交易实例统一修正到口径一致,可能还要根据模型设置的要求进行额外信息的采集(额外信息通常不是传统评估中交易实例的常用信息)。
在大数据挖掘技术中,所用的案例主要是挂牌案例而非交易实例。如前文所述,数据挖掘是指从大量的数据中通过算法搜索出隐藏于其中的信息的过程。数据挖掘的这一特性决定了其更偏向于数量庞大的挂牌案例,而非数量有限的交易实例。虽然挂牌案例的质量参差不齐,甚至混杂较多的虚假数据,但真实信息仍蕴含其中。已有的实践显示,随着案例数量的不断增加,数据挖掘得到的估计值逐渐向实际值(或均值)收敛。大数据挖掘技术对交易实例的应用完全背离了估价规范的要求,盖因大数据挖掘技术本身就不是传统估价的技术和方法。在攻克房地产批量估价难题的过程中,对新技术新方法的尝试势在必行,,在估价行业内已经存在“大数据和估价规范的关系”的相关研究和讨论。
2.关于数据标准的问题
除了批量估价技术,数据标准是房地产批量估价中另一核心环节。显而易见,房地产批量估价中面临大量的基础数据和案例数据的采集、整理及价格和参数的测算,需要建立庞大的数据库系统,如果没有统一规范的数据标准就无法实现房地产的批量估价。
关于“数据标准”较为具体的阐述为:以数据共享为目标,在特定领域中,对数据内容进行界定、分类和编码以及对数据字段进行命名、定义、表示和标识等的规范和原则。本文主旨在于对批量估价技术的探讨,因此对于数据标准仅对评估技术中涉及的相关概念进行讨论。
在标准价调整法中的标准房就是一个需要标准化的字段,以上海城市研发的VISS住宅估价系统为例,其在小区内设定的标准房内涵为:中高层或高层以8楼为楼层基准,多层以2楼为楼层基准;面积、户型以小区中主力面积户型为基准;朝向以小区中主要朝向为基准;装修状况设定为毛坯;其他个别因素以普遍性原则设定;交易条件设定为买卖双方各自承担交易税费。以此为基础进行的价格测算才能符合估价规范。
在多元回归模型中,同样需要对价格数据进行标准化。区别在于该因素是否被纳入到模型的变量中。如果纳入到模型的变量中,则不需要进行标准化;如果没有纳入到模型的变量中,则需要进行标准化修正。假设,在价格回归模型中设置了楼层的变量,则不需要对交易实例的楼层因素进行修正,因为模型本身就可以用来揭示楼层对价格的影响。如果模型中未包含楼层的变量,说明模型未对楼层因素进行考量,则样本数据中应将交易实例的楼层数据设置为统一标准。
再来看大数据挖掘中的情况,笔者认为基于大数据挖掘的价格测算,其价格的内涵是模糊的、不确的。我们以互联网的应用为例,在搜房、链家等房源网站中,可以在每个小区找到小区均价。这些均价都是基于挂牌案例通过计算机算法统计得到的。但是且不论挂牌案例的虚假和杂乱程度,挂牌本身和市场价并不等同,挂牌案例中的很多参数是缺失的或不准确的,因此只能基于大数据概念运用算法来进行均价的统计,因而,此均价不包含上述内容中确切的定义和内涵。
在数据标准方面,三大主流批量估价技术的表现仍然不同。因此在应用时了解他们的特征,扬长避短,确保整体技术方案的规范和可行应是主要目标。
3.批量估价与个案估价的差异
分析批量估价与个案估价之间的差异、各自的不足,可以帮助我们深入思考和研究,促进批量估价技术的提升。归纳起来,估价效率、估价精度以及估价规范的适用性是二者的主要差异所在。
首先,追求估价效率是批量估价存在的意义,此处不再赘述。
其次,总体而言,个案估价的估价精度理论上应优于批量估价的估价精度,原因在于批量估价技术本身。在标准价调整法中,在标准房的价格评估后还要经过一套修正系数才能得到某一单元物业的价格。这里经过了标准房和修正系数两重环节,分别会产生一定的误差,而累积的误差一定大于单一环节的误差。在多元回归模型中,由于房地产价格影响因素过于繁杂,实践中很难有一个绝好的模型可以拟合出准确的价格。一旦某些特别情况被排除在模型以外并且未被识别时,则可能出现较大的误差。至于大数据挖掘中的算法统计技术,就目前而言,根本无法达到较高的估价精度。
最后,房地产批量估价较个案估价的特殊性,导致了在估价规范的适用上有所欠缺。主要表现在:不能遵循最高最佳利用原则;由于太多信息不能确定,需要进行较多的估价假设。此外还有估价目的不明确,价值类型一旦设定无法轻易更改(一般设为市场价值)等背离估价规范的情况。
因此,在研发房地产批量估价技术的时候,除了要考虑提高估价精度的问题,还须考虑如何与估价规范进行匹配。
六、房地产批量估价技术的选用
无论是单一技术还是多种技术方法的结合应用,房地产批量估价技术的选用依据主要是数据状况、结果的质量状况以及运行成本。
数据状况主要指数据的数量和数据的质量。就技术方案来说,側重点有所不同。例如在多元回归模型中,对于样本案例的参数质量要求是所有技术方案中最高的;而大数据挖掘技术则对数据的数量要求最高。现实中我们不太会碰到数量多且质量好的数据状况,因此在技术选用时首先需要考虑是否可以稳定获得所需要的数据。
至于结果的质量状况和运行成本,很难设定一个标准线。只能根据不同的需求目的来设定质量目标,并根据组织的投入产出效益来选择可行的技术方案。以上海城市房地产估价有限公司开发的ⅥSS系统的运行情况来看,其在住宅物业批量估价方案中采用了标准价调整法与大数据挖掘相结合的方法,使其系统的评佔精度基本控制在正负6%的误差范围内,极端误差范围为正负10 %。对于上海12000多个住宅小区,其价格更新周期为每月,其数据维护人员仅8到10人,每次价格更新的工作周期仅为两周。在其新研发的办公物业批量估价方案中,更是结合了标准价调整法、多元回归模型以及大数据挖掘三种方法,使其系统的评估精度可以控制在正负10 %的误差范围内,极端误差范围为正负15 %。对于上海3000多栋写字楼物业,可以实现3个月的价格更新周期,而数据维护人员仅3人。
因此,在选用何种技术方案时,主要有四个评价因素:一是技术方案所需的数据是否可以稳 定获得;二是批量估价的价格精度是否满足目标需求;三是批量估价的物业覆盖面是否完整;四是批量估价的运行维护成本企业(或组织)是否可以承受。以此为标准,运用多方法结合的思路进行技术的研发和创新才是房地产批量估价技术发展的正确道路。
七、结语
本文之所以将房地产批量估价技术按照以人工为主和以计算机技术为主来划分,盖因其出处不同。三大主流技术中,大数据挖掘来自互联网行业对估价业务的渗透;多元线性回归模型来自大学院校对房地产的研究;只有标准价调整法来自估价行业本。任何一种技术的单一使用都有其利弊。房地产批量估价技术的探索与创新必须跨越行业和专业的限制,学习跨领域的知识和技术,以房地产估价规为指引,结合多种技术和方法,才能全面实现房产价值的批量估价。
(摘自《中国房地产估价与经纪》2016年2期 作者:肖历一 作者单位:上海城市房地产估价有限公司)
共有条评论 网友评论