技术博客

有现成的机器学习工具包,为什么还要学算法

机器学习是大数据、人工智能等技术的基础,近年来也随着大数据等概念的火爆而越来越成为IT领域的热门话题。

由于机器学习需要一定的数学基础,因此被一些人看作是可望不可及的“高大上”技术;同时,也有人认为,目前有许多现成的机器学习开发工具包,把数据直接导入到工具包就可以得到结果了,何苦花费大量的精力去学习机器学习算法呢?

那有没有必要去学习机器学习算法呢?

非常有必要!!

最简单、最容易理解的例子:如果不懂算法,你和其他人使用相同的工具包,拥有相同的数据,结果会怎样呢?

结果是:你们所有人都可以得到分析结果,但是结果是相同的!相同的!!相同的!!!此外,当数据分析结果不准确时不同算法的人也往往束手无策。

众多企业要去高薪聘请数据分析师原因就在于:企业所需的是精通算法的是专业的数据分析人员,他们精通算法,当遇到数据分析需求时,可以根据实际的问题来“订制”自己的工具。直观的说,这个“订制”主要是指:

  • 在使用数据时,是使用所有的数据,还是使用某些特定的特征,特征是否需要进行某些预处理等。
  • 机器学习算法往往非常精妙,有众多的参数,需要关注很多细小的细节;任何参数和细节的微小变化都可能导致分析结果有巨大的差异,此所谓“失之毫厘,谬以千里”。

因此,对数据分析从业者来说,精通或者熟悉算法是必要的,起码要熟悉常用的分析算法以及特征选择、特征映射等方法。

扫描二维码,关注“格物课堂”微信公众号

2022-2023 Copyright © 深圳市意行科技开发有限公司 - All Rights Reserved.
深圳市南山区学苑大道1227号 
粤ICP备17013574号