湖北理工学院学报
JOURNAL OF HUBEI POLYTECHNIC UNIVERSITY
Vol.35No.3
Jun.2019
doi:10.3969/j.issn.2095-4565.2019.03.008
基于网购平台大数据的电子商务用户行为分析与研究
韦建国,王玉琼
(阜阳职业技术学院工程科技学院,安徽阜阳236031)
摘要:为更好地促进电子商务行业健康持续发展,需要对电子商务用户的行为进行深入分析与研究。基于单因素与多因素的概率分析和属性分析,以用户运营管理、消费者行为及在线商品性价比为研究对象,利用K-means软件进行综合因素分析,并对数据开展分析和运算。研究发现,商品物流运输效率、消费者需求诉求,以及在线商品性价比是影响电子商务用户行为的关键因素,而且电子商务用户是否购买商品,主要取决于在线商品性价比与消费者需求诉求,其次是商品物流运输效率。该研究有助于进一步认识商务用户行为,促进电子商务行为的创新发展。
关键词:网购平台;大数据;电子商务用户;行为;数据挖掘
中图分类号:1P273文献标志码:A文章编号:2095-4565(2019)03-0034-05
Analysis and Research on E-commerce User Behavior Based
on Big Data of E-commerce Platform
WEI Jianguo,WANG Yuqiong
(School of Engineering and Technology,Fuyang Institute of Technology,Fuyang Anhui236031)
Abstract:In order to promote the healthy and sustained development of e-commerce industry,it is necessary to analyze and study the behaviors of e-commerce users.With the user operation management,the consumer behavior and the cost performance of the online commodity as the research object,the comprehensive factors z analysis is done with the help of K-means software and a conclusion has bee drawn that the key factors affecting the behavior of e-commerce users are the efficiency of commodity logistics transportation,the appeal for consumer demand and the cost performance of online commodities after excavation analysis and calculation,based on probability analysis,attribute analysis and universality analysis of the single factor and multi-factor.It has been found that whether the users buy commodity or not mainly depends on cost performance of online commodities and the appeal for consumer demand,then efficiency of commodity logistics transportation comes after.This study is helpful to know the commerce users z behaviors and can promote the innovative development of e-commerce behaviors.
Key words:online shopping platform;large data;e-commerce users;behavior;data mining
随着互联网飞速发展,用户倾向于通过互联网交易和在线支付选购心仪的商品。我国电子商务发展的大体趋势是实体交易场所逐渐被互联网在线交易平台所替代。因此,确保电子商务沿着健康的轨道发展至关重要⑴。电子商务是依靠互联息作为载体的在线
收稿日期=2018-09-14
基金项目:安徽省高校质量工程项目(项目编号:2018JYXM0133);安徽省高校质量工程项目(项目编号:2017ZHKT349)。作者简介:韦建国,讲师,硕士。
第3期韦建国,王玉琼:基于网购平台大数据的电子商务用户行为分析与研究35
交易新业务,在发展过程中易受到互联网的基 础设施建设、用户行为及诚信状况的影响。一
方面,我国在互联网的基础设施建设投入加
大,且效果显著;另一方面,我国出台了确保互
联网交易平台安全运营的法规和诚信机制。
不可否认,这些有利措施确实使我国的电子商 务得到了飞速发展⑵。本文基于电子商务交 易平台上的各种消费行为,进行数据挖掘分 析,从概率分析、属性分析及共性分析的综合
视角对在线商品、消费者兴趣、需求和评价进 行了分析,并建立数据模型,对消费者的行为 展开深入研究,进而熟知消费者购物意图,并 促进电子商务行业的创新发展。
1网购平台大数据研究思路
网购平台大数据理论主要是指运用大数据
分析原理,对海量的网购平台数据进行数据挖
掘处理,进而对参与网购的消费者表现出的行 为作有效分析,并最终找到消费者网购的偶然 性与必然性、关联性与性、普遍性与特殊
性,以精准预测未来消费者的消费趋势等信息。
所谓综合化视角是指概率分析、属性分析 及共性分析,即通过基于数据挖掘的计算机数 据分析原理,分别分析消费者行为、商品质量 及用户运营管理方面的数据,并对在线商品、
消费者兴趣、消费者需求及评价分别进行单因 素和多因素系统分析和研究,建立单因素和多
因素影响下的数据模型,进而为电子商务用户
提供先进的管理决策、优质的营销策略,为消 费者提供个性化的服务⑶。本文的技术研究 路线如图1所示。
胞孚商务用户行为丽
1
I 单因峯分析I
I 多因睾分析I
I 概率分析□在线
商品
一
▼
—
王消
费者行为 匸用户运营管理丁
H
在线商品一
▼
—王消费者行为^>
王
用户运营管理丁
土在线商品」 ▼
1
王消费者行为T
£用户运营管理丁
I 属程分析I
|共性分析|
I 概率分析I 属性分析I 共性分析分析结果得出结论
土在线商品」 ▼
—王消费者行
丄用户运营管理!
数据挖掘分析图1技术研究路线
2基于单因素的概率分析
在单因素条件下,从概率分析出发,分别 研究用户运营管理、消费者行为及在线商品性 价比对电子商务用户的影响,其中,消费者行
为包括消费者兴趣、消费者需求及评价。概率 分析流程如图2所示。
(数据库(卩"I 数据整理| |大概率因素数据分析自用户行为特征'
F 13
)大概率因素确目
图2概率分析流程
以2016年中国数据分析行业网对互联网
电商平台进行实时数据采集、数据处理与整
合、计算和分析的数据为依据,收集了包括天 猫、京东、苏宁等8个主要电商平台的1 200
种品类,3 000个品牌及50万个商品。对数据 进行系统性归纳与整理,并分析概率。概率分 析结果见表1。
表1概率分析结果
随机抽取电子商务数据及数据序列
1 2 3 4 5因素指标指标代号
用户运营管理
0.02
0.040.020.01
0.01
消费者行为
A 2
0.420.470.51
0.500.48在线商品
a 3
0.56
0.50
0.47
0.49
0.51
由表1可看出,各个因素对电子商务用户
的影响或作用效果是不同的,在线商品对电子 商务用户行为影响最大,消费者行为次之,用
户运营管理则对电子商务用户影响最小。
3基于单因素的属性分析
属性分析,即属性数据分析,本质是将事物
的某些特征通过数据形式体现出来,较为明显地
反映出事物存在的客观规律⑷。在分析电子商 务用户行为时,根据所选取分析数据的数量及具 体特征来定义其属性分析原则,具体是将反映用
户运营管理、消费者行为及在线商品的数据进行
整理,再计算各个因素指标数据分别占所选数据 库的比例,并按照设定的电子商务利润盈利与亏
本的样本数量比例大小来判定用户运营管理、消
费者行为及在线商品对电子商务用户影响的大小⑸。属性分析数据见表2。
表2属性分析数据
因素指标盈利样本数亏本样本数合计
用户运营管理245376621
消费者行为482013426162
在线商品质量57479856732合计10812270313515
属性数据分析公式为:
22
X y=£屈(呦-npy^/npy=("12-"21)2/ («12+«21)2,(1) 22
X1=葛若(n iJ_%)2/n PiJ=(”22-"21)2/("22 +"21尸,(2) 22
X;=若若(n:j_npij}2/叭=(”32-"31)2/("32 +"31)2。(3)式(1)-(3)中,匕表示用户运营管理影响的盈亏系数;匕表示消费者行为影响的盈亏系数;匕表示在线商品质量影响的盈亏系数;"12表示受用户运营管理影响的亏本的电子商务用户数量;S表示受消费者行为影响的盈利的电子商务用户数量;"22表示受消费者行为影响的亏本的电子商务用户数量;"31表示受在线商品质量影响的盈利的电子商务用户数量;"32表不受在线商品质量影响的亏本的电子商务用户数量;r表示因素指标数量;m表示因变量数,取m=1o
经过计算得出:Xi=°-04,xi=0.32必= 0.50o
同时必(r-m-1)=^o.o52(1)=0.05,为盈亏临界值。
根据数据计算结果,用户运营管理匕小于0.05,消费者行为匕大于0.05,在线商品质量匕大于0.05,表明在线商品质量和消费者行为对电子商务营销的盈利影响较大,而用户运营管理对电子商务营销亏本影响较大。
4综合因素分析
基于单因素和多因素综合分析电子商务用户行为,即对消费者行为、商品质量及用户运营管理的数据作挖掘分析,以电子商务用户特点为研究中心,来探究电子商务用户在受综合因素影响时所体现的主要特征,同时预测体现主要特征的出现机率[6-8]O
在用K-means对数据挖掘分析时,分别设定自变量和因变量,自变量分别为:Xi—用户运行管理一消费者行为一商量质量;而因变量分别为:匕一是否点击商品,蜀一是否确认购买。对Y,和¥2分别作数据挖掘分析。
4.1点击商品
设定受到用户工作效率评价(测试1)、用户服务态度评价(测试2)、商品物流运输效率(测试3)、消费者兴趣评价(测试4)、消费者需求诉求(测试5)及在线商品性价比(测试6)方面因素影响,在K-means中建立数据模型作挖掘分析与运算。以2016年中国数据分析行业网对互联网电商平台进行实时数据的采集、数据的处理与整合、计算和分析后的数据为依据,数据收集的范围包括天猫、京东、苏宁等8个电商平台对电子商务用户做出的评价,消费者对商品及电子商务用户的评价见表3。
表3消费者对商品及电子商务用户的评价
项目反馈量
用户工作效率10500
用户服务态度83350
商品物流运输34600
消费者兴趣36000
消费者需求诉求54800
在线商品性价比32480
根据K-means算法公式:
P(y=cw=心晋"M)p(x)
XP(X=x\\Y=C k)P(Y=C k)
k=l
=P(X⑴=«(1),…,X(n)=X M\\Y=C k)
=^P(XS=皿|y=c”),(4) >=1
z=^p(y=c”)力p(戒*ir=cj,(5)
ir±—j O\\v7皆s
式(4)-(6)中,P代表先验概率;z代表条件概率密度;M代表影响系数。根据上述公式在K-means中建立数据模型进行挖掘分析与运算。
将除6个因素以外的其他因素(测试7)第3期韦建国,王玉琼:基于网购平台大数据的电子商务用户行为分析与研究37
作为测试参照,其他因素作为测试参照的运行结果见表4o
表4其他因素作为测试参照的运行结果
参照测试M Z P>Z
10.256 4.3160.003
**
20.465 4.8590.001**
30.76214.320**
7
40.51410.930**
50.318 5.7370.001**
60.219 3.6130.002
**由表4可知,6个因素的影响系数均大于0,表明6个因素影响下的点击商品概率均要好于其他因素,也说明影响电子商务用户行为的关键因素为用户工作效率评价、用户服务态度评价、商品物流运输效率、消费者兴趣评价、消费者需求诉求及在线商品性价比。
用户工作效率评价作为测试参照的运行结果见表5o
表5用户工作效率评价作为测试参照的运行结果
参照测试M Z P>Z
20.228 3.6710.006**
30.351 5.6240**
140.3 6.4720**
5-0.417-6.831-0.0015**
60.5147.7320.005**
由表5可知,测试5的影响系数小于0,则说明测试5的影响力要小于测试1的影响力,而其他测试的影响力要大于测试1的影响力,表明:用户服务态度评价、商品物流运输效率、消费者兴趣评价及在线商品性价比为电子商务的最关键因素。
将用户服务态度评价作为测试参照,则数据挖掘运行结果见表6。
表6用户服务态度评价作为测试参照的运行结果
参照测试M Z P>Z
10.492 5.7250.0015**
30.265 3.8250**
24-0.873-9.624-0.0026**
50.5197.5180**
60.6&0340**
由表6可知,测试4的影响系数小于0,则说明测试4的影响力要小于测试2的影响力,而其他测试的影响力要大于测试2的影响力,表明:用户工作效率评价、商品物流运输效率、消费者需求诉求及在线商品性价比为电子商务的最关键因素。
将用户物流运输效率作为测试参照,则数据挖掘运行结果见表7。
表7商品物流运输效率作为测试参照的运行结果
参照测试M Z P>Z
1-0.373-4.681-0.0011**
2-0.134-2.547-0.004** 34-0.878-9.629-0.003**
50.365 4.0320.0018**
60.523 6.3160.024
**
由表7可知,测试1,2及4的影响系数小于0,则说明测试1,2及4的影响力要小于测试3的影响力,而其他测试的影响力要大于测试3的影响力,表明消费者需求诉求和在线商品性价比为电子商务的最关键因素。
将消费者兴趣评价作为测试参照,则数据挖掘运行结果见表8。由表8可知,测试1,2的影响系数小于0,则说明测试1,2的影响力要小于测试4的影响力,而其他测试的影响力要大于测试4的影响力,表明商品物流运输效率、消费者需求诉求及在线商品性价比为电子商务的最关键因素。
表8商品物流运输效率作为测试参照的运行结果
参照测试M Z P>Z
1-0.182-2.952-0.0011**
2-0.235-3.684-0.0011** 430.463 5.7490.008**
50.404 5.4360.010**
60.5967.2050.003
**
将消费者需求诉求作为测试参照,则数据挖掘运行结果见表9。由表9可知,测试1,2及4的影响系数小于0,则说明测试1,2及4的影响力要小于测试5的影响力,而其他测试的影响力要大于测试5的影响力,表明商品物38湖北理工学院学报2019年
流运输效率及在线商品性价比也是电子商务用户最关键因素。
表9消费者需求诉求作为测试参照的运行结果
参照测试M Z P>Z
1-0.106-1.482-0.024**
2-0.337-2.145-0.038** 530.5 6.7320.005**
4-0.342-6.935-0.003
**
60.6917.3380.042**
将在线商品性价比作为测试参照,则数据挖掘运行结果见表10。
表10在线商品性价比作为测试参照的运行结果参照测试M Z P>Z
1-0.293-2.106-0.006**
2-0.158-1.9140** 630.4697.5390.015**
4-0.267-3.4730**
50.5529.8570.025**
由表10可知,测试1,2及4的影响系数小于或等于0,则说明测试1,2及4的影响力要小于测试6的影响力,而其他测试的影响力要大于测试6的影响力,表明商品物流运输效率与消费者需求诉求也是电子商务用户最关键因素。
综合点击商品的6个因素并对其进行数据挖掘的运行,进行结果表明商品物流运输效率、消费者需求诉求及在线商品性价比是影响电子商务用户行为(是否点击商品)的关键因素。
4.2确认购买
基于“4.1点击商品”数据挖掘运算分析基础,对影响电子商务用户行为(是否点击商品)的关键因素:商品物流运输效率(测试3)、消费者需求诉求(测试5)及在线商品性价比(测试6),作进一步挖掘分析,并在K-means中,以商品物流运输效率、消费者需求诉求及在线商品性价比作为自变量,而是否确认购买作为因变量,建立数据挖掘模型并运行结果‘⑹。
将商品物流运输效率作为测试参照,则数据挖掘运行结果见表11。
表11商品物流运输效率作为测试参照的运行结果参照测试M Z P>Z
3
5
6
0.323
0.496
5.115
&754
0.018**
0.020
**由表11可知,测试5及6的影响系数大于0,说明测试5及6的影响力要大于测试3的影响力,而测试5及6无明显差异性,表明消费者需求诉求与在线商品性价比,对是否购买商品影响比较大。
将消费者需求诉求作为测试参照,则数据挖掘运行结果见表12。
表12消费者需求诉求作为测试参照的运行结果
参照测试M Z P>Z
5
3
6
-0.172
0.682
-2.536
3.107
0**
0.025**
由表12可知,测试6的影响系数大于0,而测试3的影响系数小于或等于0,则说明测试6的影响力要大于测试3的影响力,且测试3影响力小于测试5,同时测试3及6存在明显差异性,表明:在线商品性价比,对是否购买商品的影响比较大。
将在线商品性价比作为测试参照,则数据挖掘运行结果如表13所示。
表13在线商品性价比作为测试参照的运行结果
参照测试M Z P>Z
6
3
5
-0.239
0.376
-3.624
5.353
0**
0.015**
由表13可知,测试5的影响系数大于0,而测试3的影响系数小于或等于0,则说明测试5的影响力要大于测试3的影响力,且测试3影响力小于测试6,同时测试3及5存在明显差异性,表明:消费者需求诉求,对是否购买商品的影响比较大。
综上所述,电子商务用户是否购买商品主要取决于在线商品性价比与消费者需求诉求,其次对商品物流运输效率比较关注。因此,建议广大的电子商务用户使用电子商务平台在线营销商品时,首先要确保商品具有较好的性价比,同时还要兼顾。(下转第57页)第3期张校飞,张银凤:退火温度对Bi°.原「捕电丿九戲彳薄膜结构和性能的影响57
istry C,2010,114(45):19318-19321.
[9]CHANG H W,YUAN F T,TIEN S H,et al.
Effect of substrates on the structure and ferroelec
tric properties of multifierroic BiFeO3films[J].
IEEE Transactions on Magnetics, 2014,50(1):
2500604.
[10]KAWAE T,TERAUCHI Y,TSUDA H,et al.Im
proved leakage and ferroelectric properties of Mn
and Ca codoped BiFeO3thin films[J].Applied
Physics Letters,2009,94(11):112904.
[11]REETU,AGARWAL A,SANGHI S,et al.Ri-
etveld analysis,dielecttric and magnetic proper
ties of Sr and Ti codoped BiFeO3multiferroic
[J].Journal of Applied Physics,2011,110(7):
73909.
[12]FAN S,XIE X,ZHANG F,et al.Improved leak
age and ferroelectric properties of Sr doped
BiFe095Mn00563thin films[J].Journal of Mate
rials Science:Materials in Electronics,2016,27
(7):6854-6857.
[13]王翠娟,范素华,张丰庆,等.BiFeO3薄膜的制
备及掺杂改性研究进展[J]・山东建筑大学学
报,2014,29(1):-70.
[14]解肖斌,张丰庆,王营营,等・NaCl基片上制备
BiFeO3模板膜工艺参数探讨[J]・稀有金属材
料与工程,2O15,44(S1):1-4.
[15]ZHANG H,LIU W F,WU P,et al.Unusual mag
netic behaviors and electrical properties of Nd-
doped BiFeO3nanoparticles calcined at different
temperatures[J].Journal of Nanoparticle Re
search,2014,16(11):2205.
[16]DAI H,LIU D,CHEN J,et al.Effect of BiFeO3
doping on the structure,dielectric and electrical
properties of CaCu3Ti4O12ceramics[J].Applied
Physics A,2015,119(1):233-240.
(责任编辑高嵩)
(上接第38页)
5总结
通过K-means软件对数据作挖据分析并运算,发现商品物流运输效率、消费者需求诉求及在线商品性价比是影响是否点击商品的关键因素,而电子商务用户是否购买商品主要取决于在线商品性价比、消费者需求诉求以及商品物流运输效率,在电子商务未来的发展中必须提高在线商品性价比,多关注消费者需求诉求、提供方便快捷的商品物流运输服务体系是保持电子商务可持续发展的坚强基石。
参考文献
[1]唐胡鑫,钱旭.基于信息爛的电子商务用户行
为分析聚类算法[J]•计算机仿真,2014,31
(4):422-425.
[2]王召义,薛晨杰.基于K-MEANS聚类的电商
网站用户行为分析[J].温州大学学报(自然
科学版),2017,38(3):49-54.
[3]余慧佳,刘奕群,张敏,等.基于大规模日志分
析的搜索引擎用户行为分析[J].中文信息学
报,2007,21(1):109-114.
[4]周娇,霍欢.社交网络服务中的空间视频
推荐算法[J]•计算机工程,2015,41(1):245
-250.
[5]赵伟明.基于用户行为分析和混合推荐策略
的个性化推荐方法研究[D].北京:北京工业
大学,2014.
[6]顾海斌.基于大规模电商数据的用户消费行
为分析方法及研究[D].长春:吉林大学,
2016.
[7]毛佳欣,刘奕群,张敏,等.基于用户行为分析
的搜索引擎自动性能评价[J].计算机工程,
2014,19(11):3023-3032.
[8]韦素云,业宁,吉根林,等.基于项目类别和兴
趣度的协同过滤推荐算法[J]•南京大学学
报,2013,49(2):142-149.
[9]袁春阳,李青山,王永建,等.基于行为与域名
查询关联的僵尸网络聚类联动监测[J]•计算
机应用研究,2012,29(3):1084-1087, [10]薛黎明,栾维新.聚类算法在高校网络用户行
为分析中的应用[J].现代电子技术,2016,39
(7):29-32.
(责任编辑张银凤)