上海理工大学学报  2017, Vol. 39 Issue (5): 459-466   PDF    
商品名称复杂度对用户网购效率的影响
蒋成姣, 孙军华, 李林, 金京     
上海理工大学 管理学院 上海 200093
摘要: 通过实验设计,由受测者在指定的电子商务网站上购买指定的商品,并对购物全过程进行录像;采集用户网络购物效率的指标,应用信息熵对商品名称复杂度进行衡量,研究商品名称信息熵对用户网络购物时输入关键词时间、输入关键词数量、购物时间、重新搜索次数、搜索结果排序和浏览商品的数量的影响;进而,通过问卷调查,研究用户感知商品名称复杂度、商品熟悉度以及输入商品关键词难易度对以上用户网购效率指标的影响;最后,对商品名称的定义提出了改进建议.
关键词: 信息熵     网络购物     用户行为    
Influence of the Complexity of Commodity Name on the Online Shopping Efficiency
JIANG Chengjiao, SUN Junhua, LI Lin, JIN Jing     
Business School, University of Shanghai for Science and Technology, Shanghai 200093, China
Abstract: Based on an experiment design, the volunteers buy specified commodities on a specified electronic commerce website and the shopping processes were recorded.Then the online shopping behavior indicators were collected by record analysis.The complexity of commodity name was measured by virtue of the information entropy, and its influences on the online shopping behavior indicators, such as the inputting keywords time, number of searching keywords, shopping time, searching times, rank of searching results and number of scanning products, were explored.Through questionnaire inspection, the impacts of the user perceived complexity of product name, familiarity with commodity name, and difficulty of inputting the keywords on the online shopping efficiency were investigated.Finally, improvement suggestions on the definition of commodity name were put forward.
Key words: information entropy     online shopping     user behavior    

随着信息技术和网络技术的快速发展以及物流服务质量的提高, 电子商务市场快速扩张.据联商网报道, 2016年中国电子商务市场交易规模稳居全球第一[1], 中国电子商务研究中心监测数据显示, 2016年中国电子商务市场交易额达20.2万亿元, 较2015年增长23.6%[2].快速发展和竞争激烈的市场下, 网页设计质量成为电子商务企业的核心竞争力之一, 用户在电子商务网站上的购物体验会影响用户的满意度和再购意愿.众多研究者的研究结果表明, 使用性、简便性、功能性是网页设计质量的重要维度, 因此网页设计时, 要注重用户的操作效率和操作体验.

用户在网络购物时, 通常会输入商品名称关键词进行搜索, 然后浏览搜索结果进行选购.因此, 商品名称的复杂度、难易度等特点会对用户的搜索、浏览行为和购买意愿等产生重要影响.本研究将探索商品名称复杂度对用户网络购物效率的影响, 通过实验设计, 引入信息熵对商品名称复杂度进行衡量, 探索商品名称信息熵对用户网络购物效率的影响; 调研用户感知的商品名称复杂度、商品名称熟悉度和输入关键词难易度, 分析这些变量对用户网络购物效率的影响; 最后对商品名称的定义给出建议.

1 文献综述 1.1 商品名称对网络购物效率的影响

效率是指单位时间内完成的工作量[3], 网络购物中用户会希望快速找到需要的商品, 并顺利下单, 因此网络购物效率可以定义为用户单位时间内完成的购物任务.Koyuncu等[4]提出网络购物主要包括3个核心过程, 即信息搜索、评估选择和购买, 网络购物效率则是这3个核心过程的综合效率.已有的对于提升网络购物效率的研究大多集中于搜索引擎的改进[5-6]、推荐算法的改进[7-8], 以及基于人因工程的网页设计改进[9-10], 而商品名称如何对网络购物效率产生影响的研究则大都处于探讨的阶段.

杨锦锋等[11]指出商品名称中的很多词汇是出于商品的功能描述和营销等目的而创造出来的, 如果这些新词不能被输入法准确识别, 将会大大降低音字转换精度, 进而影响用户使用体验.孙军华等[12]的研究指出, 选择关键词会导致用户较多的思考时间, 而输入商品名称的关键词, 会导致大量的用户输入点击动作, 这些都会对用户的购物效率产生影响.可见, 商品名称复杂度会对用户在信息搜索时的输入效率产生影响.

Jansen等[13]对搜索引擎的用户行为进行分析, 发现消费者只浏览很少的搜索结果页面, 第一页成为主要的关注焦点, 因此搜索结果的准确性对于提升用户的评估选择效率具有重要的意义.杨锦锋等[11]认为如果搜索引擎不能识别商品名称中的新关键词会影响其数据挖掘和分析的性能.孙军华等[12]的研究中发现在搜索结果中找到需要的商品导致了较多的浏览和思考的时间.孙军华等[14]的另一项研究中指出商品名称会直接影响用户输入关键词的数量, 间接影响商品排序、搜索结果的精确性, 最终影响用户操作效率和操作体验.黄鹂强等[15]的研究发现消费者对产品的熟悉程度不同将会对搜索结果采用不同的信息处理模式.对于不同产品的搜索结果, 对于消费者熟悉的那些产品, 他们更多地点击靠近中间位置的选项, 而对于消费者不太熟悉的商品, 他们更多地点击搜索结果中比较靠前的选项.可见商品名称复杂度及用户对商品的熟悉度都会对用户的评估选择过程产生影响.

从以上研究可以看出, 商品名称对网购动作效率有较大的影响, 如果商品名称复杂, 那么用户会在选择、输入商品关键词时体验不佳, 商品名称复杂还会影响该商品在搜索结果中的排序以及用户在搜索结果中定位商品时的体验.但是如何衡量商品名称的复杂度, 以及商品名称复杂度对用户网购效率的影响模式还未见研究.

1.2 信息熵

为了解决信息源不确定度的问题, 香农提出了信息熵的概念.譬如信息源中有n个信息, 分别为U1, U2, U3, …, Uj, …, Un, 每个信息出现的概率为p1, p2, p3, …, pi, …, pn, 每种信息出现的情况相互独立.信息源的不确定性为单个信息不确定性的统计平均值E, 即信息熵, 公式如式(1)所示[16].

(1)

由信息熵的概念和计算公式可见, 一个信息源的信息熵越大, 那么它出现的状况就越多, 或者说包含的内容越多.语言文字是信息的载体, 信息熵对语言文字的信息处理具有重要意义.目前有研究者利用信息熵对文字进行相关研究, 王兴兰[17]利用信息熵和手工筛选的方法抽取了医学类学术论文摘要的关键词; 李丽双等[18]提出一种信息熵和词频分布变化相结合的术语抽取方法; 陈科文等[19]基于信息熵权重计算提取了文本特征词; 李圣文等[20]采用熵的方法对文本间的相似度进行度量.

商品名称属于文本信息, 杨锦锋等[11]将商品名称定义为描述商品的品牌名、产品名、系列名和产品属性值的若干汉字组成的词或者这些词的组合, 用户在网购时通常是根据品牌、产品名称、系列名及关键参数进行搜索.不同商品名称产生的关键词的数量和概率会有差异, 进而影响用户的输入效率和浏览效率.因此, 本研究中将引入信息熵来衡量商品名称的复杂度, 进而探索商品名称信息熵对用户网购效率的影响.

2 实验设计

为保证受测者的良好状态, 减少受测者的单次购买量, 同时又保证样本的数量, 本研究先后在两家网站上进行了两次购物实验.根据市场咨询机构凯度对超过200个快消品牌商进行的调研结果表明, 天猫、京东和一号店3家电商的综合实力在2015和2016年都名列前三名[21].但是, 由于京东网站销售的主要商品是数码产品和办公用品, 而本研究实验设计的购物对象是日用百货, 因此研究最终选取了1号店(www.yhd.com)和天猫超市(chaoshi.tmall.com)作为购物实验的平台.

根据凯度的调研结果, 食品饮料、个人护理和家庭清洁类商品是增长速度很快的商品[21].因此, 本研究主要从这3大类商品中选取实验购买的商品, 在具体的品牌选择中则涵盖用户熟悉的、一般熟悉和不熟悉的商品.实验一需要受测者在1号店网站上购买5种商品, 商品名称如表 1所示.实验二需要受测者在天猫超市网站上购买6种商品, 商品名称如表 2所示.实验购物时, 受测者审阅商品清单, 自己选择关键词, 并手动输入; 所有商品的购买数量为1, 受测者将所有的商品加入购物车即完成测试.所有的实验都在一台ThinkPad的笔记本电脑上进行, 利用Cute Screen Recorder软件对受测者的购物全程进行屏幕录像.


表 1 实验一商品清单 Table 1 Commodity list in experiment Ⅰ

考虑到用户对商品的熟悉度会对商品名称复杂度有影响, 并且商品名称的输入难易程度也会影响用户的网购效率, 在实验二增加了一部分问卷调查, 受测者在购物测试完成后对每一个商品名称的用户感知商品名称复杂度、用户感知商品熟悉度和用户感知输入关键词难易度进行评价.


表 2 实验二商品清单 Table 2 Commodity list in experiment Ⅱ

测试发现整个购物需要2~5 min, 根据作业周期法确定每次实验的观测样本量应大于15人.实验一测试人数为28人, 男生13名, 女生15名, 剔除无效数据后剩余24个有效样本数据, 其中男生11名, 女生13名.实验二测试人数为31人, 男生15名, 女生16名, 剔除无效数据后剩余26个有效样本数据, 其中男生12名, 女生14名.

3 数据统计与分析 3.1 商品名称信息熵

在实验中, 每名受测者根据自己的喜好进行关键词的选择和输入, 譬如在购买“多芬洗发水滋养水润洗发乳200 mL”商品时, 受测者可能会输入的关键词有“多芬”、“洗发水”、“润发乳”、“200”、“mL”, 通过记录不同受测者输入的关键词, 统计每个关键词出现的频次, 然后计算出每个关键词出现的概率Pi, 最后根据信息熵的计算公式(式(1)), 就可以计算出该商品名称的信息熵.以“多芬洗发水滋养水润洗发乳200 mL”为例的商品信息熵计算如表 3所示.


表 3 “多芬洗发水滋养水润洗发乳200 mL”信息熵统计 Table 3 Information entropy statistics of "Dove shampoo"

根据上述方法计算出每个商品的信息熵, 并统计实验中每种商品被选取的关键词数量, 如表 4所示.其中“BULL/公牛插座1.8 m GN-6074孔”的关键词数量最多(9个), 信息熵也最大(2.880 9), 说明用户在输入该商品名称时选择的关键词多而分散; 而“三只松鼠坚果大礼包2 659 g零食特产年货礼盒金色版”的信息熵最小(1.824 5), 被选取的关键词也较少(6个), 说明用户在输入该商品的关键词时选择的关键词种类少而集中.“奥利奥原味夹心饼干390 g”的关键词虽然最少(5个), 但是信息熵并不是最小的, 说明用户在选择该商品的关键词的时候, 虽然关键词种类少, 但是并不是很集中.


表 4 每种商品的名称信息熵和关键词数量 Table 4 Name information entropy and keyword numbers of every commodity
3.2 用户网购效率特征

根据实验录像, 统计了受测者5个用户网购效率的特征指标, 即用户购买每种商品时的购物时间、输入关键词数量、输入关键词时间、重新搜索次数和受测者浏览商品数量.由于商品名称复杂度会影响其在商品搜索结果中的排序, 进而影响用户的购买行为, 本研究还统计了商品在搜索结果中的排序, 即对同一商品, 不同的实验者每次输入不同的关键词, 该商品出现在搜索结果中的序列位置的平均值.上述指标的均值如表 5所示.为验证购买不同商品时这些指标是否具有显著差异, 对这些指标进行了单因素方差分析, 结果显示, 在购买不同商品时, 6个用户网购效率相关的指标都存在着显著的差异.


表 5 用户网购效率相关指标的均值统计 Table 5 Mean values of related indicators of user online shopping behaviors

接着对不同网络购物效率指标下的商品进行两两比较, 结果表明, 输入关键词数量这一指标上, 购买“奥利奥饼干”时输入的关键词数量与其他商品存在显著性差异, 输入关键词数量最少(2.36).在输入关键词时间这一指标上, 购买“乐事薯片”时输入关键词时间与购买其他商品相比存在显著性差异, 购买“乐事薯片”时输入关键词时间最短(7.85).在搜索结果排序方面, 每个商品之间都存在显著的差异, “乐事薯片”的搜索结果排序最为靠前(1.42), 然后是“维达卷纸”(1.7).“三只松鼠坚果”(5.23)和“奥妙洗衣液”(5.12)的搜索结果排序比较靠后.在浏览商品数量方面, 各种商品之间也都存在显著差异.购买“奥妙洗衣粉”时, 受测者浏览的商品数量最多(12.42), 其次是“小老板海苔卷”(7.59);购买“乐事薯片”时, 受测者浏览的商品数量最少(2.48), 其次是“费列罗巧克力”(3.12).在重新搜索次数方面, 购买“小老板海苔卷”(0.7)和“奥妙洗衣液”(1.09)时, 重新搜索次数与购买其他商品时存在显著差异, 重新搜索的次数都比较多.在购物时间方面, 各商品之间存在显著差异, 购买奥妙洗衣粉时用时最多(75.57), 其次是维达卷纸(53.28);购物时间最短的是蓝月亮洗衣液(26.04), 其次是多芬洗发水(26.58).

表 5的数据显示, 购买奥妙洗衣粉时, 其搜索结果排序、浏览商品数量、重新搜索次数和购物时间都是最大值, 而购买乐事薯片时, 其输入关键词时间、搜索结果排序和浏览商品数量都是最小的, 这说明用户网购效率的各指标存在一定的关联性.

3.3 商品名称信息熵对用户网购效率的影响

为了探索商品名称复杂度对用户网络购物效率的影响, 对商品名称信息熵和上述用户网络购物效率各指标进行了相关分析, 对具有显著相关关系的变量, 又根据购物行为先后的逻辑关系进行了线性回归分析, 结果如表 6所示.


表 6 商品名称信息熵与用户网购效率指标的线性回归结果 Table 6 Linear regression results of the commodity name information entropy and customer online shopping efficiency indicators

根据线性回归的结果, 绘制描述商品名称信息熵对用户网购效率的影响模式, 如图 1所示.图中, ******分别表示显著性水平为0.05, 0.01, 0.001.


图 1 商品名称信息熵对用户网购效率的影响模式 Fig. 1 Impact of the commodity name information entropy on the customer online efficiency

可见, 商品名称信息熵对输入关键词的数量(0.603)、重新搜索次数(0.48)和购买时间(21.596)都有正向的影响.商品名称信息熵越大, 用户可选择的关键词越多, 输入的关键词数量也越多.由于商品名称的复杂度大, 用户难以定位商品, 也会产生较多的重新搜索次数, 最终导致用户的购买时间增加.

输入关键词数量对搜索结果排序(-0.299)有负向影响, 关键词数量越多, 搜索结果会较为精准, 从而使得商品排序靠前.但是关键词数量多会导致商品名称信息熵大, 商品名称比较复杂, 用户不易在搜索结果中定位商品, 然后重新进行搜索, 因此输入关键词的数量对重新搜索次数(0.065)有正向的影响.

重新搜索的次数对浏览商品数量(1.813)和购买时间(16.513)具有正向影响.重新搜索的次数越多, 则浏览的商品数量越多, 搜索查找的时间也越久, 从而导致购买时间增加.

商品的搜索结果排序与浏览商品数量(1.228)和购买时间(0.917)具有正向影响, 商品的搜索结果排序越往后则浏览商品的数量越多, 购买时间也就越久.

浏览商品数量对购买时间(1.991)也具有正向影响, 因为浏览商品数量增多, 时间也增加, 进而增加购买的时间.

3.4 用户感知商品名称复杂度对用户网购效率的影响

对于用户感知商品名称复杂度的问卷调查包括3个问题:用户感知商品名称复杂度、用户感知商品熟悉度和用户感知的关键词难易度, 每个问题的答案选项只有“是”与“否”两个选项.

以上述3个变量作为分组变量, 用户网络购物效率指标作为检验变量, 进行独立样本检验.统计结果显示, 在p<0.05的水平上, 用户感知商品名称复杂度不同, 购买时间、重新搜索次数、搜索结果排序以及浏览商品数量4个指标都存在显著差异, 用户感知商品名称复杂的情况下, 这些变量都显著增加.用户感知商品名称复杂度对用户网络购物效率具有影响的指标不同于商品名称信息熵对于用户网络购物效率具有影响的指标, 原因可能在于用户感知与实际的用户操作之间还是有一定的差距.

用户感知输入关键词难易度不同, 输入关键词时间、购买时间以及重新搜索次数3个指标存在显著差异, 用户感知输入关键词有难度的情况下, 这些指标都显著增加.原因在于输入关键词难度增加的情况下, 输入时间就会增加, 用户也可能因此减少关键词的输入量, 从而导致重新搜索的次数增加, 这些都会导致购买时间的增加.

用户对于商品的熟悉度不同, 购买时间、重新搜索次数以及浏览商品的数量3个指标存在显著差异, 用户感知商品熟悉的情况下, 这些变量会显著降低.原因在于用户对商品熟悉, 则能够快速定位到商品, 从而减少重新搜索次数和浏览商品的数量, 最终减少购买时间.

根据上述统计结果绘制的用户感知商品复杂度对用户网络购物效率的影响模式如图 2所示.


图 2 用户感知商品名称复杂度对网购效率的影响模式 Fig. 2 Impact of the customer perceived commodity name complexity on the online shopping efficiency
4 讨论

本研究通过定量与定性的方法研究了商品名称复杂度对于用户网购效率的影响, 根据统计分析的结果, 对商品名称的定义有以下建议.

a. 简化商品名称.

商品名称信息熵的大小会受到商品名称中包含的关键词的数量的影响, 商品名称越复杂, 用户可选择的关键词越多, 商品名称信息熵也越大, 这会增加用户选择关键词的难度.譬如本研究中测试的商品中信息熵最大的是“BULL/公牛插座1.8米GN-607 4孔”, 受测者从中选择使用的关键词有9个之多.通过简化商品名称, 减少可选择的商品关键词, 则可以降低商品名称的信息熵, 进而提高用户网络购物的效率.

b. 提高关键词的辨识度.

本研究中发现, 有的商品名称虽然比较长, 但是关键词突出, 受测者从中选择的关键词较少, 则可以降低商品名称的信息熵.譬如受测者在购买“三只松鼠坚果大礼包2 659 g零食特产年货礼盒金色版”时, 选择使用的关键词只有6个, 这样就简化了受测者的选择和输入关键词的时间, 在浏览搜索结果的时候, 也会因为关键词突出而减少定位商品的时间.

c. 保证关键词输入的简易性.

研究发现, 输入关键词的难易度会影响用户输入关键词的时间、重新搜索次数和购买时间, 输入关键词难度增加的情况下, 输入时间也会增加, 用户也可能因而减少关键词的输入量, 从而导致重新搜索次数的增加, 这些都会导致购买时间的增加.因此, 定义商品名称时要保证关键词输入的简易性, 这样就会提升用户的输入体验, 进而提高其他用户网络购物行为的效率.

d. 通过市场营销增加用户对商品名称的熟悉度.

本研究还发现用户对商品名称的熟悉度会对浏览商品数量、重新搜索次数和购买时间具有影响, 这是由于用户对商品熟悉, 能够快速定位到商品, 从而减少重新搜索次数和浏览商品的数量, 最终减少购买时间.因此在市场营销中增强对商品名称的宣传, 提升用户对商品名称的熟悉度, 对于提升用户的网络购物效率具有积极的影响.

5 结束语

本研究从定性和定量两个角度, 研究了商品名称复杂度对用户网络购物效率的影响.研究发现基于信息熵评价的商品名称复杂度和用户感知的商品名称复杂度的增加都会对用户的网络购物行为产生负面影响, 降低用户的购物效率; 用户感知的商品名称的熟悉度和用户感知的输入关键词难易度也会对用户的网络购物效率产生影响; 基于上述研究结果, 对商品名称的定义提出了4项建议.

本研究对于用户感知的商品名称复杂度对用户网络购物效率影响的研究还比较浅显, 可以在后续研究中深入探索用户感知的商品名称复杂度、输入关键词的难度、商品名称熟悉度之间的关系及其对用户网络购物效率指标的影响模式.

参考文献
[1] 联商网. 2016中国电商消费行为报告: 电商交易将超20万亿[EB/OL]. [2017-01-12]. http://www.linkshop.com.cn/web/archives/2017/368179.shtml.
[2] 中国电子商务研究中心. 2016年中国电子商务市场交易规模达20. 2万亿元[EB/OL]. [2017-01-08]. http://b2b.toocle.com/detail——6379369.html.
[3] 易树平, 郭伏. 基础工业工程[M]. 2版. 北京: 机械工业出版社, 2014.
[4] KOYUNCU C, LIEN D. E-commerce and consumer's purchasing behaviour[J]. Applied Economics, 2003, 35(6): 721–726. DOI:10.1080/0003684022000020850
[5] 王友钊, 黄冬. 一种提高系统搜索效率的BM改进算法[J]. 计算机工程, 2014, 40(1): 63–67.
[6] 付真真, 陆伟. 基于关键词的搜索引擎优化策略及效果分析[J]. 现代图书情报技术, 2009, 25(6): 61–65. DOI:10.11925/infotech.1003-3513.2009.06.12
[7] 邢春晓, 高凤荣, 战思南, 等. 适应用户兴趣变化的协同过滤推荐算法[J]. 计算机研究与发展, 2007, 44(2): 296–301.
[8] 黄创光, 印鉴, 汪静, 等. 不确定近邻的协同过滤推荐算法[J]. 计算机学报, 2010, 33(8): 1369–1377.
[9] 李方, 葛列众, 刘玉丽. 单页和多页呈现设计对网页信息搜索效率及主观感受的影响[J]. 心理科学, 2013, 36(6): 1323–1327.
[10] 杨海波, 汪洋, 张磊. 电商手机APP界面背景和图片特征对消费者搜索效率影响的研究[J]. 包装工程, 2016, 37(20): 45–49.
[11] 杨锦锋, 吕新波, 关毅, 等. 基于购物网站用户搜索日志的商品词发现[J]. 计算机应用与软件, 2011, 28(11): 108–111. DOI:10.3969/j.issn.1000-386X.2011.11.028
[12] 孙军华, 南桂美, 黄怡婳, 等. 手机终端网络购物的动作标准和动作时间研究——以京东APP为例[J]. 上海理工大学学报, 2016, 38(4): 387–393.
[13] JANSEN B J, SPINK A. How are we searching the World Wide Web? A comparison of nine search engine transaction logs[J]. Information Processing & Management, 2006, 42(1): 248–263.
[14] 孙军华, 霍佳震, 苏强, 等. 基于时间研究及KANO模型的在线零售网站设计质量要素研究[J]. 工业工程与管理, 2014, 19(1): 91–97.
[15] 黄鹂强, 王刊良. 搜索引擎用户对商品搜索结果的点击行为研究[J]. 管理科学, 2012, 25(1): 76–84.
[16] 陈玉明, 吴克寿, 李向军. 一种基于信息熵的异常数据挖掘算法[J]. 控制与决策, 2013, 28(6): 867–872.
[17] 王兴兰. 摘要逻辑项中关键词抽取方法研究[J]. 农业图书情报学刊, 2016, 28(3): 18–22.
[18] 李丽双, 王意文, 黄德根. 基于信息熵和词频分布变化的术语抽取研究[J]. 中文信息学报, 2015, 29(1): 82–87.
[19] 陈科文, 张祖平, 龙军. 文本分类中基于熵的词权重计算方法研究[J]. 计算机科学与探索, 2016, 10(9): 1299–1309.
[20] 李圣文, 凌微, 龚君芳, 等. 一种基于熵的文本相似性计算方法[J]. 计算机应用研究, 2016, 33(3): 665–668.
[21] 界面. 快消品商们最喜欢的电商平台: 天猫京东领先[EB/OL]. [2016-12-22]. http://www.ebrun.com/20161222/207615.shtml.