快速一键发布
手机号码*
验证码*
联系方式只用于平台与您联系,牛选时刻保障您的隐私安全
需求描述*
确认发布
取消

大数据时代正扑面而来,做小数据研究要被淘汰了?

大数据产品设计与运营(gh_a9d6d925b696)  大数据产品设计与运营阅读:923赞:942020-08-05

鸟哥笔记文章,为什么大数据无法彻底取代小数据呢?"

曾记得2010年左右,当大数据(BigData)的概念横空出世时,身处传统市场研究公司的朋友们大都有些惶恐不安:大数据时代正扑面而来,做小数据研究的是不是要被淘汰了?

时至今日,大数据行业叱咤风云已十余载,回头再看处于“数据鄙视链”底层的传统市场研究公司并未完全消亡,新兴的大数据公司并未能彻底“消灭”传统的小数据公司。

相反的,我们还看到有些传统的市场研究公司在积极拥抱大数据后,摇身一变为“数据智能”服务商,找到了公司业务增长的新曲线,业务规模不减反增。人们不禁要问,为什么大数据无法彻底取代小数据呢?今天就来谈一谈小数据和大数据的关系。 

一、大数据与小数据的基本概念

大数据的概念向来都是众说纷纭、莫衷一是,近些年大家都开始比较务实了,不再纠结于大数据的概念,而是更加注重大数据的应用场景和价值了。为了行文的需要,在这里还是简单提一下基本概念。

关于大数据的定义,有两个相对权威的说法。其一,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征;其二,在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中指出,大数据是指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。此外,IBM提出的大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),也普遍被业内人士所认同。

什么是小数据(Small Data)呢?在百度百科上采用的是互联网研究员吕兰涛给出以下定义:“小数据”是指需要新的应用方式才能体现出具有高价值的个体的、高效率的、个性化的信息资产。比如:通过智能家电、手机、平板电脑、穿戴式产品等能收集到个人的一举一动,这些个人的信息资产就是富有个人色彩的小数据。

以上关于大数据和小数据的定义都有一定的道理。为了方便比较和表述,本人将大数据定义为:由结构化数据与非结构化数据组成的数据集合体,将小数据定义为:面向特定用户群体的结构化数据。

鸟哥笔记,数据运营,大数据产品设计与运营,大数据

二、大数据与小数据的差别比较

大数据与小数据到底有什么样的差别呢?下面从属性层面和应用层面进行比较和辨析。

1、 属性层面

数据获取方式:大数据一般通过爬虫、埋点、API等方式获取数据,数据获取几乎全部交给机器来处理,自动化程度较高。小数据通常会依赖于人工的方式进行数据采集,比如:通过问卷调查、电话调查、街头拦截调查等传统的实证调查方式获取数据,人工参与度高。

表现形态:大数据更多的是非结构化和半结构化数据,小数据则以结构化数据为主;

数据量级:大数据至少是TB及其以上级别的数据量,而小数据通常为MB级别的数据;

实时性:大数据中实时性数据所占比例较高,而小数据一般有一定的滞后性;

数据质量:大数据大多处于杂乱无章的状态,数据缺失、乱码、异常值等情况比较普遍,而小数据一般都经过了较严格的标准化和统一化处理,数据质量相对较高;

数据处理技术:大数据经常会采用较复杂的数据处理技术,比如:爬虫技术、埋点技术、分词技术、可视化技术、机器学习算法等,数据处理技术的难度大、技术要求高,一般需要搭建大数据平台来进行处理。小数据因其数据处理量较小,以结构化数据为主,数据处理起来比较简单,所以用到一些常用的数据分析工具就能轻松应对。 

2、 应用层面

范围与对象:大数据注重对全量用户的分析,分析的内容往往侧重于群体性的行为,即“面”上的数据分析,比如双11网络购物的大数据分析。小数据的对象通常为抽样用户,往往更加注重对单体用户的行为分析,即“点”上的数据分析,个性化是小数据的特色之一;

知识发现过程:大数据重在预测,小数据重在决策。大数据的分析方式是自下而上的知识发现过程,从纷繁复杂的数据中发现规律,从不确定性中找到确定性。小数据的分析通常采用统计学的方法,先找到特定用户群的规律,然后再具体分析单体用户的情况,分析方式是自上而下的;

数据分析深度:大数据擅长从整体上进行全局性的实时性感知与分析,比如:交通流量监测、舆情监测等应用。小数据因对象较明确,分析的更聚焦和有针对性,所以分析的内容更深刻、更精准。

分析导向性:大数据注重相关性分析,关注结果是什么而不纠结于为什么,通过相关性来给出问题的解决方案,所以,大数据分析的结果往往可解释性弱。小数据通常是结果导向的,注重因果关系分析,关注现象背后的内在机理和业务逻辑,因此,小数据的分析结果有较强的可解释性。

三、大数据与小数据共生于全数据

过去的十余年可谓是大数据与小数据的相爱相杀的一段时期,表面上大数据行业突飞猛进,小数据公司们日渐式微,实际上大数据行业的发展并非一帆风顺,而小数据行业也从不甘心被淘汰。

大数据固然有其优势,小数据也有其难以取代的特色。通过多年的实践我们不难发现:大数据并非万能的,小数据仍有其独特价值,利用数据的最佳方式就是“大小通吃,并驾齐驱”。未来的时代仍将是大数据与小数据共生共存的全数据时代,而能同时驾驭大数据和小数据的公司则会更有竞争力。如何才能做到同时驾驭大数据和小数据呢?笔者认为,至少有三种路径:从大变小,从小变大和大小结合。

1、从大变小:利用大数据维度全、变量多的特点,可以进行全量用户的行为聚类分析,得到一些具有典型特征的用户分组,针对这些分组用户可以再采用市场调研的方法进行深入研究和分析,这样既能从“面”上了解全量用户的全貌,也能从“线”上洞察分组用户群的情况,甚至能深入到具体“点”上单体用户的特征。另外,通过大数据对全量用户进行聚类和分组后,还能更有效的指导用户调研时的抽样策略,减少样本配额的偏差。

从大到小,就是从大数据中找到适合小数据的场景,用大数据的方法帮助小数据锁定要聚焦的用户,再用小数据的研究方法深入探究大数据分析结果出现的原因。 

2、从小变大:小数据在用户心理、态度和情感等方面的深入研究具有独特的优势,当我们针对少数用户通过深入访谈、群组座谈会等方式进行深入分析后,可以得到一些典型用户群的画像模型和特征标签。

比如:当我们需要面向更多的用户群进行定向广告投放时,可以将这部分用户视为种子用户,并在小数据方法所获得的种子用户标签的基础上,做相似人群的规模放大,从而找到更多的符合要求的用户群。针对用这种lookalike方法获得的新用户群,可进一步采取大数据的分析方法研究其行为特征、广告投放后的响应等。

从小到大,一方面指的是研究对象从个体或小范围扩大至更广泛的用户群,提高产品或营销的覆盖面,另一方面还指分析的维度能在小数据的基础上进一步扩充和丰富。 

3、大小结合:大数据和小数据各有所长,又各有其短。大数据重分析,轻情感;小数据重态度,轻行为。

大数据的挖掘靠电脑,小数据的挖掘则要靠个人能力。大数据弥补小数据实时性、维度较单一等方面的不足,而小数据不但能够对大数据形成有力的补充,更能够挖掘用户行为的深层动机。大数据与小数据可以深度融合,相辅相成。针对同类用户群,大数据负责行为数据的全面分析,小数据负责心理和态度等方面的点线式分析,这样就有利于更全面的进行用户洞察。从大数据中得到规律,再用小数据去匹配个人,将会是一种更为有效的数据运用方式。

总之,大数据时代的到来,并不意味着小数据时代的结束,大数据与小数据是对立的,但终将也是统一的。大数据与小数据不是颠覆与被颠覆,替代与被替代的敌对关系。相信不远的将来,大数据与小数据的边界终将模糊,大中有小,小中有大,大数据与小数据将会相逢和共生于全数据时代。数据也将完成从小数据到大数据,再到全数据的进化之路,全量用户、全域数据的智能时代终将来临。

标签:

作者:大数据产品设计与运营

来源:大数据产品设计与运营(gh_a9d6d925b696)

免责声明:本文仅代表作者个人观点,与本网站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不 作任何保证或承诺,请读者仅作参 考,并请自行核实相关内容。
侵权投诉反馈邮箱:service#hotniu.cn(#改成@)

  • 今日头条
  • 本周头条
  • 本月头条