总体来说,数据分析的应用主要包含以下几个步骤:
1、数据的获取:目前来说主要是来自企业自有数据,对互联网公司来说,主要就是数据库信息和用户使用日志。
2、数据的存储:这里指的是在数据分析平台上的存储,目前主要以HDFS为主。
3、数据的清洗:将数据库以及日志信息提取到分析平台的存储系统中后,理论上是可以进行数据分析工作的,但是在实际分析工作中,还需要对这些数据进行预处理,主要的就是数据清洗工作,比如:空值的处理、不一致数据的处理等。
4、数据的分析:包括建模、模型评估,以及使用模型进行分析工作等。
其中数据分析工作主要包括:
识别二维码,关注“格物课堂”微信公众号
2022-2023 Copyright © 深圳市意行科技开发有限公司 - All Rights Reserved. 深圳市南山区学苑大道1227号 粤ICP备17013574号