大数据

漫话机器学习与大数据

漫话机器学习与大数据

通俗地说,机器学习就是从大数据发现知识的一类算法。 传统的数据分析技术主要是从数据库中获取数据,并使用一定的统计方法(多采用sql语句)来对数据进行汇总,并将分析结果提交给管理人员用于决策支持等工作。 随着科技的发展,可分析数据的来源早已不局限于...

Hadoop 正在走下坡路(英)

Hadoop 正在走下坡路(英)

Three years ago, looking beyond Hadoop was insanity, and there was little else that could come close according to many in the media. However, the reality has been a little different. For a long period, Hadoop and big data were almost interc...

利用大数据防范金融风险

利用大数据防范金融风险

在互联网时代,洗钱等金融犯罪呈现交易量大、单笔交易金额少、地理位置分散的新特点,庞氏骗局假借互联网金融的名号进行诈骗,对传统的反洗钱预防、办理手段构成了挑战。如何将大数据技术运用于金融风险防范工作,值得深入研究。 目前,金融风险防范工作面临数据...

车来了城市公交大数据分析平台在嘉兴首例落地

车来了城市公交大数据分析平台在嘉兴首例落地

嘉兴2017年2月15日电 /美通社/ -- 今天,国内用户量最大、数据最精准的实时公交查询工具“车来了”在嘉兴发布了全新的“车来了城市公交大数据分析平台”,并与嘉兴市运管局共同宣布该大数据分析平台已经在嘉兴首例落地,将协助嘉兴推进公交行业精细化管理、提升公交服务...

2017年中国大数据发展的趋势

2017年中国大数据发展的趋势

2016年,我国大数据产业保持高速发展态势,各级政府和企业大力推进,技术创新取得明显突破,大数据应用推进势头良好,产业体系初具雏形,支撑能力日益增强。 展望2017年,大数据产业发展将迎来“黄金期”,产业集聚将进一步特色化发展,创新驱动仍将是产业发展主基调...

什么是网络爬虫

什么是网络爬虫

所谓的网络爬虫,本质上就是个应用程序,此程序可以下载互联网页面相关的信息。换句话说,可以将其理解为一个可以定位并下载互联网资源的程序。 网络爬虫的爬取对象一般是网页的内容,程序主要是通过url来完成资源的定位,然后通过解析相应资源信息,并最终获取到...

为什么使用Python来实现机器学习代码

为什么使用Python来实现机器学习代码

机器学习与预测分析正在改变企业和其他组织的运作方式。在充满挑战性的现代市场中,能够理解复杂数据中的趋势和模式是成功的关键,也是获得快速增长的关键战略之一。目前大多数用于大数据分析的机器学习系统都使用Python进行开发,或者预留了Python接口,使人不禁发...

Apache Flink 1.2对外发布

Apache Flink 1.2对外发布

Apache Flink 1.2已经宣布发布,新增特性包括动态缩放功能、安全性、可查询状态等等。本次发布解决了650个问题,维持了与所有公开API的兼容性,以及针对Apache Kafka 0.10和Apache Mesos的支持。 Flink的动态缩放允许更改流式作业的并行度或者工作操作符。此功...

2017年,告诉你一个真实的中国大数据现状

2017年,告诉你一个真实的中国大数据现状

从2014年开始接触大数据,两年多时间,我眼中的中国大数据行业已经发生了很大变化。罗胖在跨年演讲中说,算法、人工智能、大数据,最基础的还是数据,没有数据什么也没有。这两年的数据爆炸和技术成熟让大数据较之前有了飞速又落地的发展。见证时代的改变,于我们都...

老司机用十几年的职业阅历告诉你:如何成为一名优质的数据科学家

老司机用十几年的职业阅历告诉你:如何成为一名优质的数据科学家

数据科学家的定义 经历了一些不同阶段的大数据项目之后,我意识到,在“数据科学家”这个角色没定义好之前,“数据化”会遇到很多挑战。这个角色的定义相当模糊,造成很多混淆--很像对“数字化”本身的混淆。我翻阅了一下招聘网站上数据科学家的职责,有的专门通过...

2022-2023 Copyright © 深圳市意行科技开发有限公司 - All Rights Reserved.
深圳市南山区学苑大道1227号 
粤ICP备17013574号