网站首页  词典首页

请输入您要查询的论文:

 

标题 基于决策树的住房租赁价格微观影响因素研究
范文

    范雅静+黄笛

    [摘要]随着我国经济水平飞速增长,城市间人口流动日益频繁,房屋租赁市场日趋繁荣,房屋的租金也受到越来越多的关注。而由于互联网的发展,房东与租户通常会在网络上发布并获取信息,因此租房网站中包含丰富的租房信息。文章利用网络爬虫技术从租房网站收集了北京市各区域共计三千余条租房信息,并将住房租赁价格作为被解释变量,并选择6个微观因素作为解释变量,基于特征价格理论建立决策树模型,分析影响租房价格的关键因素,并为住房租赁价格定价及预测提供新的思路。

    [关键词]住房租赁价格;微观影响因素;决策树

    [DOI]1013939/jcnkizgsc201717037

    1引言

    作为房地产市场体系两个必不可少的重要组成部分,租赁市场与买卖市场,与北京市房地产市场的健康平稳运行有着密切的关系。持续提高的城镇化水平意味着将有相当数量的农村剩余劳动力及人口转移到城市。北京地区的高房价客观上也使购买商品房需要大量的资金。因此,越来越多的人选择暂时放弃购房需求,并将目光由买卖市场转向租賃市场,借助租赁市场将自身的住房需求解决。在此背景下,住房租赁价格由哪些因素确定成为了学者关注的问题。

    目前,已有大量学者对此进行了研究。Marks(1984)用特征价格指数对温哥华租赁住宅数据进行研究,结果发现停车位提供、自动洗衣店等相关变量均显著影响住宅租金。Guntermannn(1987)的研究表明,游泳池、健身房的存在对租金有着显著影响。此外,许多学者将研究重心放在配套设施对住宅的影响。George(1985)、Sirmans(1990)等则对住房内的配套设施,如电视、洗衣机等对租金有正方向的影响作用。然而,住宅由于其私密性等问题,传统的入户调查方法成本较高且难以获得较大数据。从国内文献看,学者大多集中在微观因素对写字楼等商用房屋租赁价格影响的研究。聂冲(2009)研究发现区位、建筑、商铺和租约特征都是购物中心商铺租金的重要决定因素,但相对而言,区位特征最为重要。梁艳(2011)选取深圳市场上能获得数据的四类20个解释变量进入租金模型。采用特征模型,对深圳市114栋写字楼的要价租金均价进行回归分析,并发现大部分特征因素对写字楼租金有显著影响。全百松(2013)通过构建写字楼特征价格模型,发现不同城市发展水平下的写字楼租金影响因素在显著性及影响系数两方而表现不同。

    然而,由于住宅私密性等问题,传统的入户调查方法成本较高且难以获得较大数据,若要避免入户问题则只能对写字楼等开放区域进行调查。为弥补此缺陷,本文通过网络爬虫技术获取到北京市住房租赁价格相关数据,可以在较短时间内获得丰富的租房微观数据。此外,本文通过建立决策树模型对北京市住房租赁价格进行分析,可利用决策树的优势对住房租赁价格的微观影响因素进行深入分析,从而使各类租房人群能结合自身对房屋的需求,借助模型估算参考价格,同时对当地房地产中介机构合理评估住房租赁价格有一定的参考借鉴意义。

    2理论基础

    21特征价格模型理论

    特征价格模型来源于特征价格理论。A T Court(1939)首次对汽车价格进行了研究,认为汽车价格是由汽车本身特征决定,并构建了汽车价格指数。随后,Lancaster(1966)提出消费者偏好理论,认为消费者购买一个产品,是由于产品的特征符合消费者的需求。Rosen(1974)则完善了Lancaster偏好理论,理论上构建了特征价格供需特征模型,为特征价格模型奠定了基础。该理论认为,住房价格是由住房特征带给人们的效用决定的,由于住宅特征的数量及组合方式不同,使得房地产的价格存在差异。因此,本文根据特征价格理论对住宅租赁价格的影响因素分解,分析各因素对房租的影响。

    22决策树理论

    本文主要采用决策树方法进行建模。决策树是一种监督式的学习方法,产生一种类似流程图的树结构。决策树对数据进行处理是利用归纳算法产生分类规则和决策树,再对新数据进行预测分析。树的终端节点——叶节点(leaf nodes),表示分类结果的类别(class),每个内部节点表示一个变量的测试,分枝(branch)为测试输出,代表变量的一个可能数值。为达到分类目的,变量值在数据上测试,每一条路径代表一个分类规则。

    在树的每个节点上,使用信息增益选择测试的变量,信息增益是用来衡量给定变量区分训练样本的能力,选择最高信息增益或最大熵(entropy)简化的变量,将之视为当前节点的分割变量,该变量促使需要分类的样本信息量最小,而且反映了最小随机性或不纯性(impurity)(Han和Kamber,2001)。若某一事件发生的概率是p,令此事件发生后所得的信息量为I(p),若p=1,则I(p)=0,因为某一事件一定会发生,因此该事件发生不能提供任何信息。反之,如果某一事件发生的概率愈小,不确定性愈大,则该事件发生带来的信息愈多,因此I(p)为递减函数,并定义I(p)=-log(p)。给定数据集S,假设类别变量A有m个不同的类别(c1, …, ci, …, cm)。利用变量A将数据集分为m个子集(s1, s2, …, sm),其中si表示在S中包含数值ci中的样本。对应的m种可能发生概率为(p1, …, pi, …, pm),因此第i种结果的信息量为-log(pi),则称该给定样本分类所得的平均信息为熵,熵是测量一个随机变量不确定性的测量标准,可以用来测量训练数据集内纯度(purity)的标准。熵的函数表示如下式:

    I(s1, s2, …, sm)=-[DD(]m[]i=1[DD)]pilog2(pi)

    其中pi是任意样本属于ci的概率,对数函数以2为底,因为信息用二进制编码。变量分类训练数据集的能力,可以利用信息增益来测量。算法计算每个变量的信息增益,具有最高信息增益的变量选为给定集合S的分割变量,产生一个节点,同时以该变量为标记,对每个变量值产生分枝,以此划分样本。再根据变量的不同值建立树的分枝,每个分枝子集中重复建树的下层结果和分枝的过程,一直到完成建立整株决策树。

    3数据说明、预处理与变量选择

    31数据说明

    本文所使用的数据来源于58同城网站。58同城(http://58com)作为覆盖全领域的生活服务平台,业务覆盖招聘、房产、汽车、金融、二手及本地生活服务等各个领域。其网站内含有海量的房产信息,也包括北京市的房屋出租信息。本研究采用C#语言并基于Net框架,建立一个租房信息采集程序,依据所设定的采集方案与规则,成功地实现了一定数量的租房信息自动采集,同时将所采集到租房数据持续地添加到SQL Server数据库中。

    本文随机抓取了2015年期间发布的3606条北京市住房招租信息,并将数据导入至Excel表格文件中,原始数据主要包括城市、标题、租赁价格、户型、面积、装修程度、所在楼层、原有设施种类、地址等。

    32数据预处理

    原始数据中数据格式比较特殊,多为对房屋进行描述的语句。因此,本研究首先使用了R中的stringr以及jiebaR包,将每个样本所在的城区、楼层、朝向、原有设施、装修程度等关键词一并提取。其次,由于租房信息中不能准确描述楼层信息,通常用楼层范围来表示,如“2层/6层”表示2~6层,因此本研究采用平均数估算其楼层;此外,由于房间数量也是影响房租的一个重要因素,因此对形如“3室2厅2卫”的住宅类型数据,提取“室”的数量作为房间数量指标;最后,租房信息中还对住宅内配套设施加以描述,包括电视、洗衣机、冰箱等,由于设施种类较多,因此将设施种类数量作为单一指标。

    33变量选择

    基于特征价格模型理论,本文将住房租赁价格作为被解释变量,将不同类别的微观因素共19个指标作为解释变量,建立机器学习模型进行预测。下表报告了选取的被解释变量与解释变量的详细说明。

    4实证分析

    通过建立决策树模型,得到结果如下图所示。决策树共有一个根节点、四个中间节点以及六个叶节点。每个节点上方的数值表示平均价格,下方百分比表示样本所占比例,连接线上表示该节点的条件,节点颜色由浅到深表示该子样本平均价格由低至高。由下图可以看出,影响房租价格最主要的因素为所在城区。决策树第一层将城区分为昌平、大兴、房山、门头沟、密云、平谷、顺义、通州、西城区和朝阳、东城、丰台、海淀、石景山,其中前者价格较低,此外,房山、密云的租房价格也比昌平、大兴、门头沟、顺义、通州更低。除西城区外,其结果也较符合城区离北京市中心距离越远租房价格越低的实际情况。对于朝阳、东城、丰台、海淀、石景山区,决定房租价格的关键因素为住宅类型,如果是公寓类则价格较低,别墅、精装修、平房、普通住宅、商住两用类的平均价格较高。对于后者,其价格还取决于朝向,其中朝北的住宅价格较高,这也体现了居民对房屋风水朝向的要求。由结果可以看出,平均价格最低的为房山、密云的住宅,最高的为朝阳、东城、丰台、海淀、石景山朝向北的中高檔住宅。

    5结论

    本文利用从58同城网站抓取的北京市住房租赁数据,将决策树模型引入到租赁价格的分析、预测工作中,并分析影响住房租赁价格的微观因素。北京的研究经验表明,影响房租最关键的因素为所在城区,其次为住房类别及朝向。未来,在对房租微观影响因素进行研究时,为了提高分析的准确度以及因素覆盖范围,应结合其他领域技术提取更多的解释变量,例如根据地址提取距地铁站距离、距商圈距离等地理位置相关信息;同时,还可利用其余学习方法,如神经网络等进行分析预测,以更全面地分析房地产价格的围观影响因素。对

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/4/15 1:15:14