大数据

平台技术架构

数据存储

支持结构化、半结构化和非结构化数据的存储;采用时下最流行的分布式存储,支持海量数据的存储,支持高并发的快速查询。

协作服务

基于zookeeper的协调服务机制,采用yarn的管理模式,支持同时运行多个计算框架,可同时部署hadoop、storm、spark等计算框架。

服务器监控

服务器监控是利用ganglia和nagios对集群机器进行资源监控,包括CPU、内存、硬盘、网络资源等进行实时监控,方便用户实时掌握集群机器资源的利用情况。

数据分析计算

使用Sqoop和Flume支持数据迁移和采集;
采用多计算框架模型,可满足不同数据的计算要求。既支持Hadoop离线大数据量的计算,也支持storm实时流式处理,还支持spark内存快速计算;
支持多语言的数据分析工作,支持SQL、JAVA、Python、Scala等。

机器学习建模

支持多种数据挖掘工作相结合,支持mahout、mllib自带的并行化的高性能机器学习算法库;同时也支持基于R自定义的编程算法(如:Rhadoop,SparkR);也有强大的主流数据统计和绘图语言R以及Web图形化开发界面R-Studio

行业应用

电商行业

面向用户个性化推荐,提高销售业绩

  • 基于用户在APP的浏览、购买行为数据,应用协同过滤推荐算法,搭建个性化推荐系统,根据每个用户的历史数据和偏好推荐不同的商品。
  • 将推荐系统的推荐结果展示在用户APP的合适位置,吸引用户点击,提升用户体验,拉升销售业绩。

社区O2O

盘活媒体企业的用户数据,助力O2O业务转型

  • 整合传统业务部门的用户数据,设计多维度的用户画像标签体系,建立用户数据管理中心。
  • 将用户画像数据与公司社区、餐饮、旅游等O2O新业务结合,建立精准营销体系,提升用户体验。
  • 盘活用户数据,实现数据资产变现,助力公司O2O业务的战略转型。

互联网金融

打造BI监控系统,提升业务运营效率

  • 梳理各业务部门的数据监控需求,设计相应的BI决策管理报表指标体系。
  • 整合用户、产品、运营等线下和网站、APP线上的用户行为数据,为企业量身定制BI报表平台。
  • 通过多维度指标分析和可视化图形展示,帮助企业快速决策,提升业务运营效率。

网络舆情

通过网络舆情分析进行口碑监测,提升传播影响力

  • 爬取并整合论坛、社交媒体、门户网站等主流媒体的网络舆情数据,进行舆情口碑监测。
  • 利用来源分析、音量变化、热点分析、情绪识别等方法,分析网络舆情变化,迅速助力客户看清舆论真相。
  • 利用舆情数据,了解口碑情况、正负面新闻跟踪,为营销决策提供数据分析依据和效率。

公共安全

利用大数据技术辅助公安部门优化警务处理能力

  • 整合公安系统各部门的数据,比如人口户籍、犯罪信息数据等。
  • 基于整合的数据信息,开发数据可视化应用,为警务处理能力提供指导和参考建议。




footer