网站首页  词典首页

请输入您要查询的论文:

 

标题 基于“拍照赚钱”众包形势下的任务定价优化的研究——以东莞市数据为基础
范文

    蒋木 周振宇

    摘要:近年来,互联网新兴社会媒体和开放式创新正逐步重塑人与人之间分享信息及协作的方式,同时也为软件开发模式带来了革新的机遇。“拍照赚钱”正是在这种环境下应运而生的,我们称这种商业模式为“众包”。如何驱动群体参与,是众包应用管理当中的难点,而众包策略研究针对的就是聚众问题。本文对众包下的任务定价进行了建模分析,任务额定价是否合理直接影响任务的完成量,在东莞市大数据的支持下对模型进行分析,讨论定价规律并给出新的方案,并提出启示与建议。

    关键词:随机森林;聚类分析;泊松回归;EMPR定价方法;回归方程

    中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)16-0169-03

    1 引言

    众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。(就是通过网络做产品的开发需求调研,以用户的真实使用感受为出发点)。众包定义由JeffHowe在2006年的《连线》杂志中提出。众包又称为网络化社会生产,是指把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络的做法,具有低成本生产、联动潜在生产资源、提高生产效率,以及满足用户个性化需求等优势,如图1可以清楚地理解众包的原理[2]。

    通常情况下,众包的任务是单个工作者来完成的,但如果涉及需要多人协作完成的任务,也有可能以依靠开源的个体生产的形式出现。对各个行业而言,众包提供了前所未有的解决问题的全新模式。该定义认为众包是指公司或机构把过去由员工执行的任务,以自由自愿的形式外包给非特定的大众网络群体的行为。基于众包的软件开发通过互联网召集全球的在线开发者完成覆盖软件生命周期的多种任务,本文就是基于题目讨论“众包”定价策略及优化。笔者从定价分析、建立新的方案并,与原方案进行比较三个方面进行研究。

    2 定价分析

    从广东省的数据进行分析,研究其中的任务定价规律:

    在数据中存在着以下几个变量:任务和会员的 GPS 经纬度,任务标价,任务执行情况,预订任务限额,预订任务开始时间,信誉值。将上述几个变量以散点图的形式表现出来后,可以明显地看出任务标价与其他变量之间存在着明显的聚类相关性。先运用多元回归分析的方法,分别将经纬度,任务执行情况有直接关系的因素作为自变量,标价作为因变量,将预处理后的数据利用MATLAB拟合。通过观测模型的 R?、sig 等统计量值,判断模型的拟合效果,剩下变量结合散点图进行直观性观察检验。

    会员的位置分布散点图如图3,存在明显的聚类现象。同时查询实际地理位置后,得出会员的位置主要集中在东莞市中心,可以联想到城市与郊区的地理位置对会员位置的分散影响。而任务的分布也存在聚类现象。同时查询实际地理位置后,得出任务完成的位置主要集中在东莞的城市中心,而郊区或者交通不发达的位置往往存在任務未完成现象。

    我们根据任务的位置的密度分为三类,分别为经度区间为(112,113.5),(113.5,113.9),(113.9,114.5)。设回归方程为: Y=t1A1+t2A2+t3A3+t4 借助spss对经纬度,标价,完成程度进行回归分析,如图4。

    由以上回归分析中显示:sig,=0<0.05,R2=0.74,说明该回归方程较符合要求。得出回归方程为:[Y=0.089A1+0.425A2+0.019A3-20.552] (模型一)。

    虽然以经纬度,完成情况以及标价之间关系得出的多元回归方程得出存在一定的相关性,但是R2并不显著,仍然存在一定的误差,为此我们采用决策树,随机森林和交叉检验加以验证的方法对模型进行一定的优化。

    首先进行数据预处理我们将价格量化,把65-85分为三类:低,中,高,分别0,1,2。通过模型随机森林和决策树,交叉检验的结果是70%,得出结果如图5,可知模型的解答较符合。

    由上图考虑信誉值对价格定价的影响,对信誉值聚类,用95%左右贡献区间的信誉值去观察定价,信誉值和定价都集中在一片区域。可得未完成点大多聚集在价格较低处,可以得出价格低是任务未完成的一个比较重要的原因。同时结合模型一,当任务位置较偏时,也会造成任务未完成。

    3 设计新的任务定价方案,并和原方案进行比较

    我们从两个角度去拷问,一个是价格的外在因素,一个是价格的内在因素。

    考虑外在因素,结合问题一中已出现的变量,我们可以考虑时间对定价规律是否存在一定的作用。在相关文献理论[1]支持下,我们可以知道价格主要通过刺激参与者的外部动机,而时间则是采用任务周期影响工作强度。根据对参与者动机的研究表明,参与者的动机之间可呈现共生关系,也即标价和时间互相影响。我们以时间变量为自变量得出模型二。

    另外对软件众包经验数据中的历史任务价格进行特征分析,识别任务价格因子[3],这是价格的内在因素。我们将经纬度归为识别的价格因子,以东莞市的数据为依据,通过统计和机器学习算法建立经验定价模型二;之后将数据进行切分用于模型的验证与评估;最后根据评估结果选择最为有效的经验定价模型应用至新的任务定价方案。

    我们采用泊松回归来界定每个任务的定金策略和时间策略对于任务完成情况之间的实证计量回归模型:

    (1)Performancew~Possion([λ])其中Performancew为第u个任务收到的数量,[λ]是分布的参数。则任务参数和每个任务的定价和时间的关系为:

    (2)[logλ=B1+B2logPrize+B3logT+B4logT2+B5logT×logPrize+B6logT2×logPrize +μ] (模型二)

    其中[B2] 和[B3] 分别检验定价和时间各自的影响效果;而[B5] 则是检验定价和时间的交互影响。其他则是相关对任务完成情况可以产生影响的控制变量,主要作用控制可能的替代性解释。为了使模型的估计更加准确,我们采用分层的方法,即在每层增加一个随机参数来控制不同任务间的差异,即[μ]可以分解为:

    (3) [μs+μω]

    其中[μs]为组之间的固定变量,而[μω]为组内不同个体的误差系数。

    以上三步综合考虑分析了包含控制变量对任务完成情况的影响,时间和定价的主作用并加入了研究的调节变量,是一个比较完整的模型,给出了一种新型的定价方法。

    对经验数据中历史任务价格进行特征分析和因子识别,而得出的一种基于经验模型的定价方法,我们称之为EMPR定价方法,该方法通过经验数据建立模型,利用过去成功实施任务中的定价经验来指导现阶段的定价决策。根据EMPR定价方法,我们可以得出以下的问题分析框架如图6。

    我们将价格因子中的任务距离分为任务纬度和任务经度两种因素。对价格因子的数据分析如图7:

    模型三结合了问题一中我们都未结合研究的变量,并且有依据的将这些变量结合在一个模型当中,也是一种新型的定价方案。

    我们从两个角度出发对问题进行了全面的分析,外部因子与内部因子的相结合,可以让我们更清楚地了解到价格的定价规律,模型二,虽然没有具体的相关系数,但是在模型中可以直观的展现出时间与定价的联系。模型三利用EMPR定价方法,给出的过程同样很直接。两个模型相辅相成具有一定的参考意义。

    4 模型的评价

    在对模型一求解之后,并没有放弃存在的误差性,而是继续采用随机森林算法进行验证,并从另一角度完善优化了模型,使模型变得更贴近现实。

    模型二三的建立类比了原模型的自变量与因变量,并将多种可变量结合在一起,完善了定价方案。

    给出的限额,我们没有过多的去分析和研究,其实这是一种歧视定价模型[4]当平台对新老用户进行歧视定价,可以结合模型给出最大的优化,在现实众包交易中具有较大的参考价值,但于模型收题目条件和数据的限制,只能给出最适合的模型。而现实中往往需要考虑的因素不仅仅是这些,比如,本论题也可以采用多臂赌博机问题,利用机器学习当中的监督学习部分与解决多臂赌博机问题的贪婪算法,解决了在不考虑工作者完成任务数量且有预算的限制条件下,最大化任务发布者收益的问题。然后,考虑另定价问题模型,将黄金标准测试方法、定价机制设计与贪婪算法相结合,解决问题[5]。本文在时间这一变化因素上,若能给出每个任务所需完成的时间,可以将以上得出的所有模型都再次精确模拟,更能贴近现实。在算法上了,采取了比较经典的随机森林算法和打包算法,很适合多元问题的考虑,极大地优化了多维度数据,平衡误差的同时给出了最大的准确性。商家在平台发布任务,需要后续的动态调整,我们研究的是静态过程,考虑到这点,可以结合平台定价模型,求解模型的分布式框架[7],因时间有限,未能更立体化的研究问题。

    参考文献:

    [1] 李丹妮,冯小亮,王殿文,等.众包策略影响研究:奖金和时间的组合设计[J].北京:营销科学学报,2016,12(2):100-110.

    [2] 谭婷婷,蔡淑琴,胡慕海.众包国外研究现状[J].武汉,武汉理工大学学报·信息与管理工程版, 2011,33(2).

    [3] 毛可.软件众包任务的定价模型与人员匹配方法研究及工具實现[J].中国科学软件研究所,2014(4).

    [4] 毕菁佩,舒华英.基于竞争平台的新老用户定价策略分析[J].北京:管理学报,2016,13(8).

    [5] 孙信昕.众包环境下的任务分配技术研究[D].扬州大学:2016.

    [6] 冯小亮,黄敏学.众包模式中问题解决者参与动机机制研究[J].商业经济与管理,2013(4).

    [7]吴瑞杰,孙鹏,孙昱.分布式任务计划动态调整模型及算法[J].系统工程与电子技术,2017,39(2):322-328.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/10 16:05:12