标题 | 基于用户画像的大学生创新平台开发案例 |
范文 | 黄姿 胡小忠 徐杭 秦圆 陈磊 摘要:针对部分大学生自身定位不准、参加创新活动难以找到合适伙伴或团队等问题,该文通过用户画像、数据挖掘和推荐算法等概念展开了对大学生创新匹配平台开发的探讨。利用软件工程等技术,分析设计了平台的系统功能模块、工作流程、软件架构及页面设计等,其内容可为我国教育事业创新性研究提供参考。 关键词:用户画像;大学生创新平台;匹配算法;软件开发 中图分类号:TP399? ? ? ? 文献标识码:B 文章编号:1009-3044(2019)16-0044-03 开放科学(资源服务)标识码(OSID): 1 背景 近年来,随着时代和网络的发展,类型多样的活动使得大学生课余生活变得更加丰富多彩。然而,这些活动在提高学生综合素养同时也带来了一些问题。调查显示,由于大多数活动的组队赛制、学生个人定位不准确及交际网过窄等,超过三分之一的人不知如何找到合适的队友或团队。 作为日益成熟的数据分析工具,用户画像能全面细致地抽象出用户的信息全貌,了解并跟踪用户需求变化并分析探求用户需求变化的根本原因[1],其在生活中得到了广泛运用。商界内,以京东、淘宝及亚马逊等电商平台为典型。学界内,杨帆[2]在研究中以读者的行为偏好为中心,实现了图书馆的个性化推荐;国外学者 Iglesias 等[3]对 Web 站点的网络日志进行了深度挖掘,通过对用户行为模式进行聚类来刻画不同群体的用户画像等。 尽管如此,在国内却鲜有人基于用户画像等概念对如何促进大学生创新进行研究。本项目充分考虑大学生对组队比赛的需求,旨在通过用户画像、数据挖掘和推荐算法等技术,开发一套大学生创新匹配平台,以此准确定位学生个人能力,向其推荐心仪的活动、团队和伙伴等,使得团队效益最大化,为我国创新创业助力。 2 系統总体设计 按照软件工程的方法,项目首先进行了需求分析,重点对数据需求和功能需求进行了相关研究,通过分析,总结出平台主要解决“推荐活动”和“推荐人员”两个核心问题,由此衍生出多个为其服务的功能模块。如登录注册、信息管理、聊天通知及匹配推荐等,其功能模块如图1所示。 图1中,登录注册、信息管理与通知及聊天为基础功能模块。登录注册建立用户与平台的联系,为后期收集用户信息、生成用户画像及个性化服务做准备;信息管理高效安全地存储用户信息,为精准推荐匹配功能提供数据基础;查询让用户快速获取所需信息;通知及聊天为用户相互了解提供渠道,使得人与人之间的合作机制更加高效。 自动打标签与报名及匹配为平台核心功能模块,前者可根据信息管理模块提供的基础信息,分析和挖掘数据间关系,为实体标注标签,同时动态更新用户画像;后者除实现报名外,还可借助前者生成的标签、权重与用户画像,依据一定的推荐算法进行活动与人员的推荐。其中,由于人员组成类型的多样,又可将其分为志趣相投的伙伴、有目标活动的队伍及队员三类。 3 核心功能工作流程 图1给出了系统所包含的主要功能模块,其中自动打标签、报名和匹配功能模块的设计与优化是提升本系统实用性的关键。其中,虽然报名与匹配同属一个大模块,但报名功能相对较为独立,可单独进行分析。 1)自动打标签流程 自动打标签模块分为2个部分,分别负责活动和人物的标签分析。 由图2可知,自动打标签模块由时间周期触发运算更新标签操作,系统内置计算规则决定运算标签的权重及内容。而用户画像主要由标签组成,一旦实体标注的标签内容准确,画像的分析则可通过调用接口实现。 2)报名工作流程 报名工作将意向用户或活动加入匹配池,为后续匹配工作提供数据源。 由图3知,报名方式分两种,若是个人报名,在确定之后将加入目标活动的人员匹配池;若是团队报名,则在选择队伍之后加入目标活动队伍匹配池。这2个池为匹配推荐功能中的队员推荐和队伍推荐提供基础。 3)匹配推荐工作流程 匹配推荐分为活动、伙伴、队伍和队员推荐四个子块。为了实现精准推荐,每个模块都将基于实体的标签表进行运作。 由图4知,不同匹配子模块之间的运作流程基本类似,只不过它们所基于的运算数据源和算法不一样,从而划分成了不同子块。匹配推荐的流程可以抽象概括为:系统先判断用户当前的匹配类型,再根据匹配类型获取所需的数据与计算规则进行运算,在得到了相应的匹配数目的集合之后,按照匹配度从高到低的顺序从优呈现给用户。其中,推荐队员和推荐队伍实质上是一个逆向的计算过程,仅在数据源、结果集的处理上有所不同,因此它们共用一个匹配度计算功能子块。 4 系统开发环境 为优化系统性能、提高开发速率及降低功能耦合等,本系统采用微服务架构提供业务服务。以五台微服务服务器提供业务服务,一台数据服务器提供数据源,Redis缓存数据库加快访问速率及Mysql数据库实现数据持久化;利用Jenkins可以监控软件开发流程等;Docker容器中创建和部署各个应用,以实现软件系统服务隔离等。其具体性能和搭载的服务组件如表1所示。 在该硬件配置方案下,仅一台服务器负责数据存储工作,这容易造成服务器性能瓶颈。对此,通过配置及带宽升级可在一定程度上解决该问题。基于以上配置和思想,可得系统运作基本架构如图5所示。 由图5可见,微服务器各负责不同的业务功能,它们之间可以进行通讯服务。Master DB负责数据的存取,Nginx实现服务器之间的负载均衡。如此架构,系统便具有了高扩展、松耦合、易部署和易理解等特点。 5 系统实现主要界面 在总体设计和详细设计的基础上,进行了编程和测试,下面给出系统开发的主要功能界面。 1)个人中心 图6个人中心集中展现了目标用户的信息,除本人用户可对其进行修改外,访客也可通过此了解目标用户的大致情况。本人用户可以通过我管理的队伍、我参加的活动进入匹配功能进行推荐队友、队伍等。 2)伙伴推荐 图7展示了进行伙伴推荐之后的结果页面,只要向上拉动伙伴推荐页面就可以拉取最新推荐内容。其中,科技成就值和可靠度正是通过内置算法计算得出,其数值可直观地为用户提供选择队友或活动的依据。 3)活动推荐 图8展示与伙伴推荐类似,只是此处并没有更细节的展示匹配度,取而代之的是与活动相关的细节信息,有助于用户筛选符合目标条件活动。 6 结束语 本项目属于国家级大学生创新训练项目,开发灵感来源于生活,将用户画像等概念运用在大学生创新上,具有较强实用性。目前该系统正处于系统运行与维护阶段,虽然实现了预期的目的,但仍然存在一些不足,如推荐算法效率和精度不高等问题,后续将会继续深入研究。 参考文献: [1] 王凌霄, 沈卓, 李艳. 社会化问答社区用户画像构建[J]. 情报理论与实践, 2018, 41(1): 129-134. [2] 杨帆. 以画像分析为基础的图书馆大数据——以国家图书馆大数据项目为例[J]. 图书馆, 2018(2). [3] IGLESIAS J A, ANGELOV P, LEDEZMA A, et al. Creating evolving user behavior profiles automatically[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(5): 854-867. 【通联编辑:谢媛媛】 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。