跟着马云进入大数据的时代

科技工作者之家 2019-09-16

4ec973.png人类在拥有石油之前,从没想过自己真的能登上月球;人类在拥有数据之前,也想不到未来能企及的高度。

对于数据时代,很多人激动,更多的人恐惧。《数据之道》努力探究数据的规律,回答今天的发展之问,这是走向数据未来的我们真正需要的科学精神。

  ——马云

2019年9月10日,55岁的马云,正式辞去了阿里巴巴董事局主席一职。这一天,对马云来说尤其特别,阿里巴巴20周岁生日,教师节,他的55岁生日。

马云作为阿里巴巴主要创始人,起步阶段可谓艰辛,20年前想要说服超市、商场搞电子商务几乎不可能,而现在的他已然成为电商时代引领者的角色。马云曾说:“20世纪的工业、包括中东战争都是围绕着石油,谁掌握着资源就掌握着动力。而现在数据就是最大的资源,人类社会第一次开采着自己创造的能源,别的东西你用过卖给我就不值钱了,而数据是你用过交给我变得更值钱了。”

 “用数据说话”“让数据发声”,已成为人类认知世界的一种全新方法。世界是物质的,物质是数据的,数据正在重新定义世界的物质本源,并赋予“实事求是”新的时代内涵。我们必须善于用数据说话、用数据决策、用数据管理、用数据生活。

大数据作为一种新兴的生产要素、企业资本、社会财富,可谓取之不尽、用之不竭,而且能够重复使用、循环利用。可以说,大数据是一个信息和知识的富矿,蕴藏着无限的商机与巨大的收益,只要去深度分析和挖掘,总会有意想不到的收获。谷歌、亚马逊、Facebook、阿里巴巴、腾讯、京东等领军企业的成功实践和辉煌业绩,就是最生动、最有力的例证。

大数据里面的数据是什么样子的?

大数据里面的数据大体上分为两种类型:一种叫结构化数据,另一种叫非结构化数据。结构化数据是有固定格式和有限长度的数据,如国籍、民族、姓名、性别、表格里的数据等。非结构化数据量比较大,没有固定格式和长度,如视频数据、语音数据等。单纯看这些数据本身是没有用的,必须要经过一定的处理,从十分杂乱的数据中梳理和清洗关键信息,通常这些信息会包含很多规律,我们需要从信息中将规律总结出来形成“知识”,这才是数据的价值所在。

就拿阿里小贷为例。阿里小贷通过对贷款客户下游订单、上游供应商、经营信用等全方位的评估,就可以在没有见面的情况下给客户放款。其数据来源于大型的数据共享平台,它通过共享阿里巴巴旗下各子公司的数据资源来创造商业价值,大数据团队把淘宝交易流程各环节的数据整合互联,然后基于商业理解对信息进行分类储存和分析加工,并与决策行为一起分析挖掘后得出结果。

大数据是怎么被分析的?

在网购的时候,你是不是经常看到心仪物品的推荐链接?你知道电商是怎么做到精准推送的吗?这就要借助大数据技术了。

大数据处理技术就是从各种类型的数据中快速获得有价值信息的技术,其处理的过程一般包括:大数据采集、大数据预处理、大数据存储与管理、大数据分析与挖掘、大数据展现与应用等。

在商业应用中,如何挖掘消费者需求,从而高效整合供应链满足其需求的能力,成了是否能够获得竞争优势的关键要素。数据化运营逐渐成为主流,依托大数据“基因”,可以重新定义“人、货、场”。具体而言,基于充足的数据样本分析和处理(包括购买情况、消费偏向、用户活跃度、平台数据和流量,以及信息回馈等),调研关键词和属性,准确描绘出用户画像,从而有针对性地进行数据引流,并进一步实现服务升级。

用户画像,即用户信息的标签化,是企业通过收集、分析用户数据后,抽象出的一个虚拟用户,可以认为是真实用户的虚拟代表。用户画像的核心工作就是为用户匹配相符的标签,通过多维度对用户特征进行构造和刻画,包括用户的社会属性、生活习惯、消费行为等,进而揭示用户的性格特征。

有了用户画像,企业就能真正了解用户的所需,使企业对用户精准定位成为可能。在这个基础上,依靠现代信息技术手段建立个性化的顾客沟通服务体系,将产品或营销信息推送到特定的用户群中,既节省营销成本,又能最大化地发挥营销效果。

比如,从微信、微博、今日头条等用户数据,以及各种活动数据、线上数据库、客户服务信息等爬取数据,并进行清洗整理。在此基础上,通过分类、聚点、回归分析、关联分析等对整理好的数据进行分析,进一步明确他的兴趣、职业、爱好等标签,实现用户标签化,并通过数据建模,构建用户画像,实现数据可视化分析。

这样,通过大数据可以了解客户的消费喜好和趋势,商家就可以针对不同产品发送推荐信息,进行商品的精准营销,降低营销成本。例如,记录客户的购物习惯,在客户生活必需品用完之前,通过精准广告及时提醒客户补货。另一方面,依据客户消费行为,为客户推荐可能购买的其他产品。例如,通过客户购买记录,了解客户关联产品购买喜好,将与洗衣服相关的产品,如洗衣液、消毒液、柔顺剂、衣领净等放到一起进行销售,提高相关产品销售额。

电商是最早利用大数据进行精准营销的行业,电商网站内推荐引擎会依据客户历史购买行为和同类人群购买行为,进行产品推荐,推荐的产品转化率一般为6%~8%。

未来如何保障大数据的安全?

数据无处不在,数据泄露也随处可寻。根据上海社会科学院互联网研究中心发布的《大数据安全风险与对策研究报告》,自2013年以来,在企业或社会组织发生的数据安全事件,泄漏量动辄过亿条,既有外部攻击,也有内部泄密,既有技术漏洞,也有管理缺陷,极大地威胁了企业发展和个人信息安全。因此,只要有数据存在的地方,就应该建立安全机制。

在信息安全防护方面,需由政府牵头,社会各界联动响应,才能将信息安全落到实处。首先,在技术层面,亟须提高安全防护技术水平,在网络安全与个人隐私保护方面加强研究,增强防御信息安全事件风险的能力。同时,可由政府机构、行业组织和大型企业成立数据治理委员会、大数据管理局等专门的数据治理机构,引进第三方信息安全审计,对数据治理进行统筹管理。

此外,为了明确数据安全边界,建议起草和颁布《数据法》《信息保护法》《数据开放法》等,进一步完善相关法律法规和政策,使数据保护切实做到有法可依、依法治理。值得注意的是,在建设中国数据安全保障体系的过程中,需要在数据安全保护与信息开放共享之间找到合理的平衡点,在注重保护企业和个人信息安全的同时,

也需倡导数据的开放共享,使得数据这一新时代的生产资料能够流通起来,让公众共享大数据技术带来的社会进步和惠民福利。

想要了解更多有关大数据的内容,请关注马云倾情推荐、邬贺铨院士首部大数据科普著作《数据之道  从技术到应用》,图书将于2019年9月下旬在各大网店上架,详询有惊喜。

科界原创

大数据 马云 阿里巴巴

推荐资讯