找回密码
 立即注册
网站/小程序/APP/浏览器插件/桌面软件/脚本 定制开发·运营维护·故障修复·技术咨询
查看: 872|回复: 1

某知名数据科学家分享:如何快速的成为阿里云500K大数据架构师

[复制链接]
发表于 2018-1-26 02:15:06 | 显示全部楼层 |阅读模式
5b4d000604fb570586c4

全球数据


在现今的社会,大数据的应用越来越彰显他的优势,它占领的领域也越来越大,电子商务、O2O、物流配送等,各种利用大数据进行发展的领域正在协助企业不断地发展新业务,创新运营模式。有了大数据这个概念,对于消费者行为的判断,产品销售量的预测,精确的营销范围以及存货的补给已经得到全面的改善与优化。我是大数据程序员,弄一个大数据学习群593188212,里面每天分享学习大数据心得,还有学习资料分享“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。
5b51000373c82e6bd38b

数据工程师在调试


1. 需要构建数据架构

数据标准不一致(列名相同数据类型不同、列明相同数据类型相同长度不一、列名没有统一标准识别困难、列名定义不统一类型不一致长度不相同、中文名称相同英文缩写不同或英文缩写相同中文名称不同)数据标准化管理提些(构建动态单词库,标准遵循度自动检测,标准自动应用,标准管理流程化,构建知识库基础内容,为大数据应用提供统一标准)标准化管理实施成果,用语校验机制(申请、校验、标准知识库、检验结果报告)标准对象的自动应用(基于底层知识库将逻辑数据模型转换成相应的物理模型,自动转化)数据模型管理混乱(校验较差、逻辑结构不一样、反复增加相同表结构、表真正字段没有进行注释)——设计、校验、扩展数据模型骨骼数据模型优化方式(数据库参数优化10%、执行计划优化(hint)30%、索引和SQL优化50%、数据模型的优化80%);
5b5300001d70354fdf7d

SQL语句编写水平不高导致出现严重性能问题(对开发人员执行计划不熟悉);上线之前的审计体系(与上线之前测试工作并行进行,抓去SQL及执行计划)相对复杂的数据处理能力欠缺

数据质量查需要执行数据质量管理(质量标准及诊断对象定义、剖析、BR定义、数据质量诊断、数据质量改进);

2、如何构架数据架构
5b4e0005a3fd03dea37e

开发需求、应用架构、运维架构、技术规划-》数据架构、业务架构、技术架构、应用架构;

数据架构管理对象、数据架构管理流程、数据架构管理组织、管理系统(数据质量管理系统、配置管理系统);

数据架构各个角色及人员

数据架构部门的角色及工作(数据架构(构建数据架构、制定管理体系、标准化)、数据模型(概念、物理、逻辑模型设计、培训)、程序开发(开发技术支持、形状管理、编写核心SQL)、数据迁移(迁移技术支持)、测试及优化(TUNING、设计最优索引、提出问题解决方案))

3、数据架构管理体系
5b5300001dfd64bcdb34

薪资


规范、政策、管理、标准管理、结构管理、审核及管理、企业信息系统;

人员培养、组织形成、工具采购、管理认同(上层关注度);

来自开发(设计争执)、运维(技术反对)、领导方面阻力(短期难以见成效);

数据架构是企业架构中的一个重要组成部分(开发、应用、技术、数据);

内部工作流程(需求登录、适当与需求进行技术讲解、适当了解模型、进行数据需求进行数据模型进行重新设计及变更、数据架构师进行模型审计与审批、自动生成DDL(DBA)、基于业务规则校验数据质量影响、数据错误分析及清洗、相关程序分析):人+规则+技术;

4、数据架构师成长
5b510003706f33f38be0

认知(定义、从事工作、能力、位置与职业生涯);

学习(途径、培训及书籍、经验学习、相关活动);

实战(理论落地、扩大影响里、星星之火),可从模型审计及SQL优化着手;

成熟(稳定数据架构在企业系统设计、开发、运维地位,形成四足鼎立);

学习技术(企业架构、数据质量管理、数据需求分析、数据标准化、数据建模、数据库设计及应用);
5b500003e0ea4e0cb151

资料



本文版权归原作者所有,如有侵权请联系管理员删除,原文地址:https://www.toutiao.com/a6515010945138311687/
回复

使用道具 举报

发表于 2018-1-26 02:15:51 | 显示全部楼层
分享一下
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|服务条款|版权问题|手机版|小黑屋|手机版|滇ICP备13004447号-1|滇公网安备53032802000133号|神秘网

网站地图sitemapArchiver

GMT+8, 2024-11-1 19:21 , Processed in 0.081840 second(s), 23 queries , Gzip On.

基于Discuz! X3.5

辛树所有

快速回复 返回顶部 返回列表