【摘 要】 随着移动互联网的不断发展,海量移动互联网数据不断涌现,由于数据本身的价值,针对移动互联网数据的挖掘更为重要。分析了移动互联网信息价值,介绍了数据挖掘以及LBS在数据挖掘中的应用,最后从数据量、安全性和数据质量三方面对移动互联网数据存在的问题进行了阐述。 【关键词】 移动互联网 数据挖掘 信息价值 LBS 1 引言 随着各种移动设备、物联网和云存储等技术的发展,人和物的所有轨迹都可以被记录。与互联网不同的是,在移动互联网中的核心网络节点是人,不再是网页。随着数据大爆炸时代的到来,怎样挖掘这些数据,同样面临着技术与商业的双重挑战。对于数据挖掘来说,移动互联网的特殊性首先在于它能够锁定一个特定用户,其次在于它能够获取用户地理位置信息,再次是在于移动互联网上的时空信息等多样化的数据种类。而因为这三点,导致移动互联网上的数据数量会比传统互联网更大,形式也比传统互联网更加丰富,从而也有更高的价值。 2 移动互联网信息价值 2.1 移动互联网数据形式 移动互联网数据形式多种多样,在互联网上存在的各种数据类型只是移动互联网上的一个子集。同样的互联网信息,在移动端访问的方式也使内容变得更加丰满。同样是都是图片,但是在移动设备中存在的与位置相关的图片要比单存在于互联网上的图片价值高很多,或者说同样都是一句评论,但是有场景的评论和场景的评论相比前者更有挖掘的价值。 与传统互联网的数据不同的是,在移动互联网的数据中,文字以外的其他信息占到更加重要的比例。从数据的属性上来讲,移动互联网上的数据比传统互联网更加复杂,其中一个原因是这些数据包含了大量的时间和空间的信息,也就是需要把数据挖掘延伸到时空数据挖掘的领域(Spatio-temporal Data Mining)。因为多了一个维度,时空数据挖掘的复杂度比一般的数据挖掘又深了一层,虽然说研究方法和算法还是类似的。 2.2 移动用户价值 从本质上,在移动互联网上的挖掘的目的和传统互联网数据挖掘的目的是一样的:都是为了从原始数据上找出有用的信息,进而转化成可用的知识。但移动互联网有其特殊性,即移动互联网的某一个终端通常是由同一个个体使用的,所以用户在移动终端上的所有行为是具有一定延续性的,通过收集用户信息,可以建立用户档案(Profile)。 在移动互联网上,即使没有Cookie,依然可以锁定用户,即使因为隐私和用户规则等原因,我们不主动获取用户的个人信息资料,但至少可以知道用户是否和之前的某个访客是同一个个体。这样能够通过移动互联网应用获取用户当前的位置信息和参加活动的一些信息,并把这些信息记录收集下来,从而积累成关于某个用户的丰富档案信息。这些信息积累将是一大笔财富,从一些位置信息中可以分析出用户的大概活动范围,经常出差还是常住,甚至可以预测用户此刻需要什么。 2.3 移动互联网地理位置信息价值 通过分析移动互联网的数据,可以真正实现用户的行为定向,通过用户使用各种应用的习惯与场景,还原用户属性,了解用户兴趣和喜好,预测用户消费习惯和消费意图,实现真正的精准定向。基于移动互联网地理位置信息,可以推荐针对某一人群的服务,比如可以再节假日之前提供北京往返机票和优惠礼品券,在平时提供商务人员需要的个性化产品等。 |