搜索
您的当前位置:首页正文

主因素分析在购买行为分析中的应用

来源:爱够旅游网
http://www.paper.edu.cn

主因素分析在购买行为分析中的应用

翟月霞,冯娜

辽宁工程技术大学管理系,辽宁葫芦岛 (125105)

E-mail:fengna0528@tom.com

摘 要:随着市场的日益丰富,客户的信息和产品的信息越来越多,消费者的购买行为也难以预测,巨大的数据量已达到采用传统的方法已经难以胜任的地步。数据挖掘技术可以为企业提供一个深刻了解、全面管理顾客价值的窗口。本文提出了运用统计类数据挖掘技术中的主因素分析法来研究消费者购买行为。 关键词:购买行为,主因素分析,数据挖掘

1 前言

购买行为分析是客户关系管理的重要组成部分,是指消费者为获取、使用消费物品或服务所采取的各种行为。顾客购买行为的确定受到很多因素的影响,如消费者的心理活动过程、消费者的个性心理特征、消费者周围的社会因素、商品因素等等[1]。对购买行为的分析就是了解客户需求的过程,如果能抓住消费者的行为特征和购买倾向就能留住老客户,达到客户关系管理的。消费者购买行为是一门应用性很强的综合性学科,常常借鉴社会学、心理学、经济学等学科的研究方法。常用的研究方法主要有观察法、调查法、实验法、投射法。

然而这些方法仅停留在强调对表像的记录和反映,缺少深层次的分析。对于哪些因素是影响消费者的的主要因素,这些因素中有哪些对不同的消费群体有很强的相关性?从而达到节省成本,寻找潜在客户,应该提升产品的那些方面已满足不同消费者的需求。这是企业所关心、所迫切需要解决的问题。本文从衡量消费者的可度量指标入手,将主因素分析和相关分析方法用于消费者购买行为的定量分析研究,实证研究结果证实这种方法简洁有效。

2 统计类数据挖掘的基本原理与模型建立

在所有数据挖掘技术中,统计类数据挖掘工具是数据挖掘技术中最成熟的一种,已经在数据挖掘中得到广泛的应用。统计类数据挖掘技术主要有回归分析、聚类分析、主成分分析、判别分析等技术。利用这些技术可以检查那些异常形式的数据,然后利用各种统计模型和数学模型解释这些数据,解释隐藏在这些数据背后的流程改进的机会[2]。例如,可以使用统计分析工具寻找最佳商业机会,增加市场份额和利润;提高产品和服务的质量,使客户更加满意;通过统计数据挖掘调整或企业业务过程的重整,增加利润。

主成分分析法:主成分分析是将研究对象的多个相关变量化为少数几个不相关的变量的一种多元统计方法。一般情况,设某过程有P个变量,若过程的差异能由P个变量的m个主成分(m < P)来概括,那么我们就可以用这m个主成分来代替原P个过程变量。主成分分析往往不是目的,而是达到某种目的的一种手段,在过程监测算法中应用主成分分析提取少数几个能体现原过程绝大多数信息的新变量,通过监视新变量的变化来判断生产流程是否正常,或产品质量是否合格。主成分的降维思想是从简化方差、协方差的结构来考虑的,而求取主成分的各种算法就是通过求取原始数据协方差阵的特征根和特征向量来实现[3]。 设过程数据有P个变量。主成分分析的过程实质上是对原坐标系进行平移和旋转变换,使得新坐标系的原点与样本点集合的重心重合,新坐标系的选取的第一轴与数据变异的最大方向对应,新坐标系的第二轴与第一轴标准正交,并且对应于数据变异的第二大方向,依次

- 1 -

http://www.paper.edu.cn

类推。这些新轴分别被称为第一主轴、第二主轴等,若经舍弃少量信息后,由主轴p1,p2…pm构成的子空间能够十分有效的表示原数据的变异情况,则原来的P维空间就被降至m维,这个新生成的m维子空间被称为m维主超平面。当m=2时,就称其为主平面。可以用原样本点集合在主超平面上的投影来近似地表示原样本点集合。

原样本点集合在主超平面的第h主轴上的投影构成综合变量th∈R,称为第h主成分h=1,2,…,m。若以方差Var(th)表示第h主成分th所携带的变异信息,则主成分分析的结果是Var(t1)≥Var(t2)…Var(tm)≥0[4]。

提取主成分的主要目的是为了降维,所以一般情况下需要选取m(mm

3 实验结果与分析

根据手机市场的管理特点和本论文研究的目的,以葫芦岛市客户为研究对象。调查问卷分为三个部分:被调查者的基本情况,个人对手机的偏好、研究问卷结果收集之后,问卷数据经过合并、整合和数据预处理。本次调查发放问卷168份,收回150份。

客户行为偏好数据主要是考虑手机的各种属性,主要从质量(通话质量 、耐用性 、防水性、防辐射、配套设备、安全性)、功能设计(基本通讯功能、网络功能、商务功能、游戏功能、多媒体功能)、外观设计(显示屏、键盘设计、体积、色泽)、其他(品牌、价格、时尚、广告、售后服务)三方面来调查客户的购买手机时所考虑因素,本研究采用整体抽样问卷调查法获得数据,该调查问卷因素分为四大类,并细分为21个,问卷中考虑的测量尺度采用5分制,分值越高偏爱的程度也就越高。

通过主成分分析来选择关键输入变量,主成分分析可以以较少的工作量来选择自变量,获得选择变量子集合的效果。按50%的信息量选取主分量,通过数据挖掘软件SPSS,建模过程如下:

(1)KMO及Bartlett检验

KMO样本测度是所有变量的简单相关系数的平方和与这些变量之间的偏相关系数的平方和之差,当KMO值愈大时,表示变量间的共同因素愈多,愈适合进行因素分析,根据专家Kaiser01974)观点,若KMO在0.9以上非常适合进行因素分析;0.8-0.9很适合;0.7-0.8适合;0.6-0.7不太适合;0.5-0.6很勉强;0.5以下不适合进行因素分析[5]。

本研究所运用的葫芦岛市手机购买考虑因素的调查数据做KMO andBartlett' s Test of sphericity检验,结果如表1所示。

表1 KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling

Adequacy. Bartlett's Test of Sphericity

Approx. Chi-Square df Sig.

- 2 -

.814 957.559 210 .000

http://www.paper.edu.cn

x

结果表明,KMO值为.814,表明很适合做因素分析。表中的巴特利特球体检验的1统计值的显著性概率是0.000,小于1%,说明数据具有相关性,是适宜做因素分析的。

(2)信度检验

信度(reliability)是指调查问卷的可靠性或稳定性。最常用的衡量信度的指标通常是Cronbach

α系数。Cronbach α值在0.9以上表示问卷具有很好的信度;在0.8之上表示可

以接受;而低于0.7左右则表示问卷的信度不好,应该删除和修改一些问题在0.7以下则表示问卷价值不大。本文通过SPSS软件的分析值为.841,问卷信度可以接受,见下表2

表2 Reliability Statistics

Cronbach's Alpha

.841

N of Items

21

(3)对21个输入变量(自变量)进行主成分分析,特征值如表3,特征向量(由于因素过多,直列出其中的一部分因素的特征向量表4)

表3 Total Variance Explained

Initial Eigenvalues

Component 1

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Total 5.661 2.107 1.423 1.282 1.173 .991 .953 .842 .833 .762 .726 .635 .538 .524 .503 .440 .407 .360 .337 .287 .215

% of Variance

26.95610.0336.7756.1075.5884.7174.5374.0123.9643.6273.4583.0262.5612.4982.3972.0941.9371.7161.6071.3681.024

- 3 -

Extraction Sums of Squared Loadings Total 5.6612.1071.4231.2821.173.991.953.842.833.762.726.635.538.524.503.440.407.360.337.287.215

% of Variance

26.956 10.033 6.775 6.107 5.588 4.717 4.537 4.012 3.964 3.627 3.458 3.026 2.561 2.498 2.397 2.094 1.937 1.716 1.607 1.368 1.024

Cumulative %

26.95636.99043.76549.87255.45960.17664.71368.72572.68976.31679.77482.80085.36187.85890.25592.34894.28596.00197.60898.976100.000

Cumulative %

26.95636.99043.76549.87255.45960.17664.71368.72572.68976.31679.77482.80085.36187.85890.25592.34894.28596.00197.60898.976100.000

http://www.paper.edu.cn

表4 Component Matrix(a)

x1

x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21

1 .117 .466 .318 .215 .486 .548 .475 .420 .575 .475 .544 .714 .569 .524 .770 .656 .514 .420 .567 .551 .545

3 -.203 -.234 .137 .623 .481 .410 .011 .080 .259 -.212 -.142 -.049 -.030 .051 -.241 -.254 -.158 -.189 -.076 .360 -.237

4 .748.212.321-.214.014.170-.072-.116.247.063-.254-.101.088.292-.019-.271.054-.354-.208-.039.054

7 .011.207.123.364.031-.299.280.306-.171-.119-.076-.190.101.271.235-.002.094.130-.299-.311-.252

Component 10 .023.291.224-.075-.172.085.256.096.067-.381.286.093-.017-.354-.244-.121.072.103-.194.097.075

12 .009-.148.090.001-.123.046-.247.311-.304.077.089.193-.067.210-.090-.394.194.145.019.095.084

19 .011.013.074.051-.154.113-.041-.012-.041.093.261-.298-.160.119.091.069-.204.023-.082.140.044

20 .024 .017 -.097 .109 -.116 -.327 .064 -.050 .244 .027 .083 .035 -.072 .109 -.067 -.138 .007 -.032 .096 .136 .011

21 -.005 .007 .006 .026 -.006 -.045 -.034 .057 -.009 .075 -.011 .024 .100 .125 -.331 .212 -.044 .015 -.112 -.008 .084

按50%的信息量原则,保留10个变量,按删除原则,删除最小贡献率色泽(红色字体显示的因素),然后用剩余的变量再进行主成分分析,直到满足需要的10个因素为止。最后一次进行的主成分分析结果,如下表5

表5 Component Matrix(a)

x1 x2 x5 x8 x10 x11 x17 x18 x19 x20 x7

1 .111 .514 .541 .442 .544 .607 .544 .506 .626 .518 .461

2 -.044 -.426 -.510 .281 .047 -.145 .192 .467 -.426 .146 .624

3 .853 .304 -.208 -.165 .249 -.147 .231 .038 -.159 -.282 -.024

4 -.056.059.023.534.529-.304-.482-.123.092-.278.074

Component 5 6 .397-.237.282.079-.081-.335-.178-.172-.021.637.010

.063.144.063.440-.236.293.178-.537-.364-.053.154

7 -.034.452.075-.242-.211-.058-.383.067-.108.029.466

8 .018.288-.177.376-.423-.249.047.248.164.032-.238

9 .238 -.120 -.329 .062 -.078 .452 -.376 .014 .198 .078 -.029

10 .182 -.252 .409 .096 -.221 .080 -.086 .263 -.029 -.341 .057

11 -.044.129.082.042.136.150-.144.237-.426.143-.299

- 4 -

http://www.paper.edu.cn

按删除原则,删除最小贡献率品牌,剩余10个变量进行主成分分析,见表6

表6 Component Matrix(a)

Component

x1

x2 x5 x8 x10 x11 x17 x19 x20 x7

最后得到10个变量:基本通讯功能,网络功能,多媒体功能,通话质量,防水性,防辐射,配套设备,价格,时尚和售后服务。

1 .118 .554 .601 .442 .539 .628 .521 .646 .509 .406

2 -.046 -.381 -.398 .453 .101 -.058 .213 -.420 .226 .694

3 .856 .288 -.221 -.121 .262 -.147 .240 -.185 -.267 .018

4 .096-.073-.023-.451-.532.322.515-.158.322-.006

5 .364-.255.265-.032-.019-.411-.242.085.614-.049

6 .088.467.143.275-.494-.029-.257-.208.001.187

7 .108-.166-.016.549-.176-.003.279.021-.037-.487

8 .273 -.302 .094 .044 -.003 .524 -.342 -.072 -.098 .016

9 .057 .134 -.572 .033 -.088 .118 -.185 .350 .221 -.053

10 .111-.200.067.003-.253-.137.083.411-.279.274

4 结论

第一: 在功能指标的5个因素中,商务功能与游戏功能不被消费者所重视,分析其原因手机上的游戏对于大部分20-30岁左右的消费者来说过于简单没有吸引力,而且影响视力;大多数调查者都处于基础基层工作,商务功能用不上,对40岁以上的人群来说手机上的商务功能过于复杂,难以操作。

第二:在质量指标中通常会非常注重手机的通话质量、防水性、防辐射和配套设备,由于消费者大多能接受的手机价格在1000元左右,手机消费已经从奢侈品转化为日常日用品,所以对手机的耐用性已显得不太重要了,消费者购买手机的频率也越来越高,实用省电由于现在充电方式的多样性和方便性,消费者也很少为这方面担心;手机很少出现不安全因素,所以也不予以考虑。

第三:在外观中所有因素被剔出,这部分与调查问卷的局限性有关系,40岁以上的消费者较少,空缺数据也较多,所以很难反映他们的消费心理,而且在大多数年轻人群众,其他因素中的时尚因素与这部分重叠。

第四:价格理所当然的成为考虑的敏感因素,随着手机市场竞争越来越激烈,企业也应该更注重售后服务,年轻消费者对时尚的追求,要求企业加强手机样式的创新,设计出更能满足消费者需求的手机;对品牌和广告消费者已经不太在意,反应了消费者消费行为更加成熟与理性。

参考文献

[1] 林崇德.《发展心理学》.人民教育出版社

[2] 中国人民大学统计学系数据挖掘中心,统计学与数据挖掘.统计与信息论

2002(1):4-10

[3] 马庆国. 科学出版社. 管理统计, 2006.01 308

[4] 张文璋.实用统计分析方法与SPSS应用[Ml.北京:科学出版社

[5] 时东艳.统计类数据挖掘在六西格玛的应用研究,南京理工大学,2004

- 5 -

http://www.paper.edu.cn

The application of key factor analysis in purchasing

behavior

Zhai Yuexia,Feng Na

Department of Manage and Liaoning project technology university,Huludao,Liaoning(125105)

Abstract

As the society progress, information of customers become more and more abundant, so it is difficult to predict what customer will do next. It is also difficult to use traditional method to analyze enormous date volume. Date mining provides an opportunity that deeply understands and manages customer value for the enterprise. It refers to use key factor analysis of statistical data mining to study customer’s purchasing behaviors in the context.

Keywords:Purchasing behavior,Key factor analysis,Data mining

- 6 -

因篇幅问题不能全部显示,请点此查看更多更全内容

Top