基于机器学习的商业运营管理研究与实现_刘雨昀.pdf-资源下载-蜗牛文库-知识共享服务平台

基于机器学习的商业运营管理研究与实现_刘雨昀.pdf

1、第 31 卷第 4 期 2023 年 8 月Vol.31 No.4Aug.2023电脑与信息技术Computer and Information Technology文章编号：1005-1228（2023）04-0097-06收稿日期：2022-08-23作者简介：刘雨昀（2000-），女，云南省玉溪人，本科，软件工程专业，主要研究方向：机器学习。1基本概述随着科学技术的发展，各个行业、各个领域逐渐形成智能化管理的趋势，以此来优化其他的业务，增强自身的商业竞争力。疫情三年，重置了中国商业的基本面，据赢商大数据统计，2022 年 1-4 月场日均总客流量仅 12861 人次，同比 2021 年

2、下降 19%，商场作为线下服务为主的实体商业，在“适者生存”规则下，企业需要加速转向精细化运营1。当下的商业市场主要由分散建设的交易机构群体组成，每天都在生成各式各样的交易数据，这些数据是散乱分布的，传统的行业专家只能根据经验或估算提出决策建议，且因数据过大，难免带着先入为主的观点得到似是而非的结论。依据数据的实时性、海量化等特点，依托大量样本数据的商业数据分析工作，是未来商业模式的改革趋势。如何利用已有的商业数据帮助企业深度挖掘消费者新的消费需求，以保证企业在消费市场逐步回暖中领跑下半场成为我们在商业研究领域的一项新挑战。目前，基于机器学习2对海量数据进行分析的方式，能够有效的帮助商圈的各个

3、商家优化服务、挖掘客户需求、提升服务效率，以获得当下最大的经济基于机器学习的商业运营管理研究与实现刘雨昀（北华航天工业学院计算机学院河北廊坊 065000）摘要：我国现代计算机技术日新月异，商业智能运营建设取得了空前发展，机器学习理论体系大量融合到现代的科技商业中，使得商业的精准化管理有飞跃性发展。文章旨在研究商业智能运营的分析方法及决策提取。文章以某商场 2019 年第二季度的部分销售数据为例，建立数据的聚类模型并对其进行关联规则分析，并提取决策信息。文章提出的基于 K-means 的聚类模型分别从客户和商铺的角度出发，更加充分的挖掘数据中的有效信息，将复杂繁琐的商业数据生成管理商业的决

4、策建议，为商业提供更加精准的运营决策。关键词：商业精准运营；机器学习聚类；PCA 降维；K-means；关联规则中图分类号：TP311.5，F830.33文献标识码：AResearch and Implementation of Business Operation Management Based on Machine LearningLIU Yu-yun（College of Computer Science,North China Institute of Aerospace Engineering,Langfang 065000,China）Abstract：The progress

5、of modern computer technology in our country is very fast,the construction of intelligent commercial operation has achieved unprecedented development.A large number of machine learning theoretical systems have been integrated into modern technology and business,which makes the precise management of

6、business develop rapidly.In this paper,we aims to study the analysis and decision making of intelligent commercial operations.By taking part of the sales data of a shopping mall in the second quarter of 2019 as an example,we build a clustering model and perform association rule analysis on it,then w

7、e extract decision information via the analysis.The K-means-based clustering model proposed in this paper starts from the perspective of the customers and shops,respectively.This model can find valid information from the data,and generate complex and tedious business data to decision advises.Thus,ou

8、r model provides more precise operational strategies.Key words:commercial precision operation;machine learning clustering;PCA dimensional reduction;K-means;association rule analysisDOI:10.19414/ki.1005-1228.2023.04.003电脑与信息技术 2023 年 8 月98效益。如何高效的使用机器学习完成上述目标是当下研究的必要趋势。本文的主要贡献如下：（1）通过 ETL 在海量数据中筛选出聚类

9、的特征指标，再利用 PCA 降低特征维度，在保留了大量必要的商业信息数据的同时还减少了数据量，降低后续数据建模和算法分析的时间复杂度。（2）通过 K-means 聚类算法从客户和店铺两个维度提出商业决策建议，既结合商业自身的营销数据又综合考虑了面向顾客的消费需求，通过对聚类结果的详细分析，有效的将海量数据转化成合理的营销决策建议。（3）通过 Apriori 算法对客户的消费行为进行关联规则分析，能够得到客户消费行为与店铺之间的强关联关系，最终提供给店铺揽客、留客等方面营销决策。2基于 K-means 的商场管理聚类分析方法现代化经济商圈运作11分为机会分析、店铺目标和策略制定和客户关系管理三大

10、阶段，不同阶段需要结合商圈不同形态的下的消费者特征、经济情况、店铺运维特征、劳动力保障、法规等进行综合分析，通过收集和整理多样化的数据信息，划分管理规则，分析客户行为信息，从而为商圈运作提供决策支持。商圈运作分析的主要目的是帮助企业制定开拓市场目标、有效进行市场竞争、开展精准营销，通过挖掘分析各类店铺和客户的信息，为企业管理提供决策建议。企业在收集数据的同时也会受到决策本身的反馈影响。文章的研究主要从客户和店铺的角度为商圈运作提供理论上的营销策划依据文章中的商场管理分析基于 K-means 聚类模型对数据进行挖掘，建立管理决策的模型。所谓的聚类，就是将样本划分为由类似对象组成的多个类的过程。聚

11、类后，我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测，也可以探究不同类之间的相关性和主要差异。由此建立店铺-客户商场管理模型。商圈数据随着不同时间的商业情况，会导致商场的数据密度不同，在常用的聚类分算法中，基于密度的数据聚类算法显然不适用于可变密度数据集，故本文采用基于中心体集群的聚类算法。本文采用的数据及主要包含了商圈用户消费记录及商铺信息。该数据记录了从 4 月到 6 月所用用户的消费记录，共 58590 条。每条记录表示用户的一笔消费，字段信息见表 1:经过数据清洗、删除噪声数据等操作提升数据质量，可对此数据进行进一步的操作。2.1基于 K-means 店铺的聚类分析方

12、法时间数据需要先经过预处理将划分为周中数据和周末数据两类，预处理后从数据集中提取了平均每周周中交易额(weekdays_amountperweek，记为 Da、平均每周周末交易额(weekends_amountperweek，记为 Ea)、平均每周周中交易次数(weekdays_countperweek，$记为 Dc)、平均每周周末交易次数(weekends_countperweek，记为 Ec)、平均每周周中客单价(weekdays_personal_amount，记为 Dp)、平均每周周末客单价(weekends_personal_amount，记为 E

13、p)六个特征数据组成店铺分类的数据集，求出每个特征的均值，有：=niiiizna1)6,1(1（1）其中，ai表示特征均值，n 表示特征样本总数（本数据集中 n 取值为 58590），zi代表一个特征。数据减去均值后为 X=z1-a1,z2-a2,z58590-a58590，再求取协方差矩阵、特征值以及对应的特征向量，标准化以后选择两个较大的特征值对应的特征向量C(c1i,c2i)即可。随机初始化 K 个由六个参数数据对应的向量作为质心，将降维后的特征向量组成二维向量，将样本向量 F 代入公式（2）（2）计算对应的欧氏距离Fi=(c1i,c2i),i (1,n)（3）其中，n 表示特征训练集数

14、量，在文中 n=2.计算出两个空间点的欧式距离，从而将这些向量所对应的数据点分配到 K 个质心去。计算每个质心里所有样本的平均距离中心,寻找最靠近均值点更新聚类中心。计算机聚类评价指标 SC，针对单个样本的轮廓系数 s，定义如下：第 31 卷第 4 期99刘雨昀，基于机器学习的商业运营管理研究与实现（4）其中，a 表示某个样本与其所在簇内其他样本的平均距离，b 表示某个样本与其他簇样本的平均距离。所有样本的 s(i)的均值称为聚类结果的轮廓系数SC，轮廓系数 SC 的取值范围为-1,1,取值越接近 1则越说明聚类效果越好，相反越接近-1 则说明聚类效果越差，0 表示有簇重叠。可以作为聚类是否

15、合理、有效的度量，计算公式如下：（5）其中，N 表示样本总数。基于 K-means 聚类的店铺聚类分析流程如图 1所示：图 1 基于 K-means 聚类的店铺聚类分析流程图2.2基于 K-means 客户聚类分析方法时间数据需要先经过预处理将划分为上午交易数据和下午交易数据两类，预处理后从数据集中提取了每周平均人午交易次数(amperweek,记为 Aw)、每周人均下午交易次数(pmperweek,记为 Pw)、每周人均交易额(amountperweek,记为 Ap)、每周人均交易次数(countperweek,记为 Cp)四个特征数据组成客户分类的数据集，与基于 K-means 聚类的店铺

16、聚类分析方法类似，完成客户的聚类。聚类分析方法流程可以扩展为以下步骤：Step1:处理数据中的非法数据，按照数据预处理的步骤建立符合 K-means 聚类要求的数据集；Step2:导入数据集，使用 pandas 库提取出指标组成数据训练集；Step3:使用手肘法选取 K 值，并随机初始化 K 个质心；Step4:使用 K-means 算法对数据进行聚类分析，计算质心到其他各点的欧式聚类并计算该质心中的所有样本的距离均值，判断是否需要更新质心；Step5:完成聚类以后，计算聚类评价指标轮廓系数9SC，判断轮廓系数 SC 是否大于 0;若结果大于 0，则表明聚类结果良好，则可以保留聚类结果，反之则再次重复 Step2-Step5；Step6:分析聚类结果，将结果可视化并给出对应的决策。汇总不同的客户去过的店铺信息进行关联分析，利用 Apriori 算法中的最小支持度生成相应的频繁项集，再利用最小置信度筛选出合适的强关联规则。通过不断调整设置的阈值，我们可以将关联规则控制在一定范围内，方便可视化操作，能更直观地看出店铺之间的关联性，以利于研究客户消费行为与店铺之间的关系，从而给店铺提供有效的

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？