爱普新媒成立于2010年,是一家专注于移动互联网产品研发和新媒体整合营销的高新技术型公司,旗下拥有100余款精品软件,内容涵盖日常生活、效率工具、文章资讯等多个方面,主营以天气预报、快游等综合自媒体矩阵为载体的推广业务和以云魔方DSP移动互联网广告分发平台为基础的广告投放业务。
客户介绍
爱普新媒成立于2010年,是一家专注于移动互联网产品研发和新媒体整合营销的高新技术型公司,旗下拥有100余款精品软件,内容涵盖日常生活、效率工具、文章资讯等多个方面,主营以天气预报、快游等综合自媒体矩阵为载体的推广业务和以云魔方DSP移动互联网广告分发平台为基础的广告投放业务。
项目背景及业务挑战
爱普新媒广告业务数据规模达到数百TB,日增长量为1TB左右,业务日常不固定的分析需求多,现有的大数据处理方案下,数据部门每月需投入大数据工程师20个人日,额外花费数千元维持一个数据仓库集群,且平均每次需求处理时长为1.8天。基于已有架构,数据部门将广告日志数据压缩后存放于对象存储UFile中,接收到业务分析师不固定的数据需求后,再将用于分析的原始数据,临时加载到数据仓库UDW中,完成SQL分析后实施清除操作。
-
数据规模达到数百TB,极大程度依赖大数据工程师;并且每次任务处理周期长,对分析结果存有疑问时,无法查看原始数据进行校验;
-
每月不固定数据分析需求多,占用数据部门的技术人力资源;需求变动返工次数多,会导致大量重复性工作;并且随着数据规模日增长量的不断提升,用于临时存放不固定需求数据的GreenPlum成本一直在增加;
-
在产品侧需支持数百TB规模的数据分析,业务分析师能够独立完成不固定需求分析工作,需要降低计算成本投入和运维投入。
云服务器哪家好解决方案
新架构中使用USQL替换原先用于临时加载数据的GreenPlum,省去数据从UFile导入到GreenPlum的过程,并使得业务分析师能够直接通过SQL分析UFile中海量数据,全程无需大数据工程师的参与。
数据湖分析(USQL)是一种可扩展性强、成本低廉的无服务器SQL分析计算引擎,可轻松完成面向海量数据的数据建模工作,SQL即可完成数据查询和分析,极大降低使用大数据的门槛,且无需数据库管理员和运维人员,大幅度减少对大数据工程师的依赖。
客户收益
相较于爱普新媒现在每月花费在数据仓库UDW(用于临时存放数据)的数千元,处理同样的数据,USQL可将成本控制在每月几十元,因为USQL按照实际分析数据量计费,每GB数据分析价格极低,且不使用时不计费。
爱普新媒现有架构下,处理不固定的数据需求,数据导入与分析平均处理时长为1.8天,而USQL可省去数据导入的步骤,减少运维工作量,大幅度缩短每次任务完成时间。
爱普新媒所有真实业务SQL均已落地,其中最耗时的SQL分析时间可从600秒降至118秒,整体明显提高SQL分析效率。
目前每月需投入大数据工程师20个人日,使用USQL产品,业务分析师可直接通过SQL在对象存储UFile中完成数据分析,极大减少对工程师的依赖,有限的人力资源可得到更好的利用。
“使用USQL产品,用户在原有的数据文件基础上进行数据建模,即可使用SQL进行业务数据的快速查询,此种方式对原有数据文件改动较小,用户不用关注大数据分布式处理的过程,业务迁移方便。对比我们现有的大数据处理方案,节省80%的服务器成本,提升50%数据分析速度,同时也缩短了新业务的开发周期,值得推荐。”
——爱普新媒CTO 牛德恒