O'Reily官网上有大量关于数据分析的免费书籍,其中的《Analyzing the Analyzers》专门对数据分析从业者进行了分析。
书中提及,数据分析从业人员都应精通或熟悉数据分析的理念、数据分析流程以及大数据分析技术与技巧等,具体来说,可以将他们分为四类:
1、数据工程师
就是从大型数据集中发现有意义结果的工程人员,过去分析的数据来源主要是集合了众多数据库信息的数据仓库,分析的手段也主要是通过SQL语句来发现数据之间可能存在的关系模式。
随着数据量的增大,对此类人员的要求越来越高,一般都需要具备扎实的代码和算法基础,以及精于机器学习算法的调优技巧。他们精于技术,但是对业务知识了解尚少,通常需要与业务人员配合完成数据分析工作。
2、数据科学家
他们通常来自学术界,主要工作是发现问题,并找出解决问题的算法、方法。数据科学家通常是具备前瞻性的高学历人员,他们理论知识牢固,经验丰富,能快速发现数据分析中可能存在的问题,并通过改进算法或提出新算法的方式予以解决。
在遇到新的问题时,数据工程师往往需要依赖于数据科学家的工作,通过实现数据科学家给出的算法来解决问题。
3、框架架构师
框架设计师可以看作是数据工程师和数据科学家的合体,他们不仅精于通过程序来完成数据分析工作,在遇到新问题时大都也可以在短时间内找出解决问题的方案。
他们通常有多年的数据分析实践经验与理论基础,为了方便数据开发工作他们通常会打造一套完整的数据分析框架,类似于开源框架的开发。
4、领域专家
在数据分析领域,技术必须与业务相结合才能尽可能的发掘出其潜力。此时往往需要借助于领域专家。通常情况下,他们也是资深的数据科学家,通常还是数据分析团队的核心或领引者。他们不仅精通技术与算法,而且具备某一领域、行业的知识与丰富经验。
格物课堂专注于机器学习在企业的应用与推广,我们的培训与内训主要是培养数据工程师和数据科学家层次的高级数据分析人员。期待与您在数据分析领域共同进步。