《人工智能-机器学习开发工程师》项目

 

    人工智能开发工程师学习计划,全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。三个月完美掌握人工智能开发工程师的必备技能。实现从【程序猿】向人工智能/机器学习工程师的华丽转型。

112.jpg

适用人群

理工科0基础,逻辑思维能力强的小白

数据分析师

java/大数据有相关语言开发程序猿

数学/统计学/物理学专业人员

豪华讲师团队

宣晓华

华院数据董事长兼CEO

加州大学伯克利分校数学博士

复旦大数据学院特聘教授

中国工业和应用数学学会副理事长

上海大数据联盟副理事长

段勇

前杭州数云联合创始人兼CTO

前华院数据大数据挖掘技术总监

上海连尚网络(WiFi万能钥匙)AI技术和应用专家

杨晶晶

华院数据首席人工智能专家、计算机硕士

张帅

华院数据人工智能专家、人工智能博士

五层级能力训练示意图

113.jpg

我们的课程侧重于第2、3、4层次人才的培养,也是人工智能领域未来需求量最大的应用工程类层级的人才培养,课程侧重于快速上手、代码实现、工程应用

强大的课程体系

114.jpg

《人工智能-机器学习开发工程师》课程体系大纲

阶段一、代码级

Python是非常流行的数据科学和机器学习语言,是通向人工智能必须要过的第一关。通过本阶段的学习,学生将掌握python的编程语法和常用技巧,并系统学习python中用于数据分析和机器学习的常用工具,为后续进一步学习人工智能/机器学习更高级的内容打下坚实且必要的基础。

学完后能达到的水平:针对Python数据分析师工作岗位需求打造

重要程度:⭐⭐⭐

难度系数:⭐⭐

  1. 人工智能基础-Python核心编程

  2. 数据收集-Python爬虫技术

  3. Python科学计算库-Numpy

  4. Python科学计算库-Scipy

  5. Python数据分析库-Pandas

  6. Python数据分析可视化库-Matplotlib

  7. 综合项目实战-Python豆瓣电影分析系统

阶段二、应用级

此阶段侧重于机器学习的算法基础了解及算法的Python代码实现。通过对基本的数理统计知识的学习,了解机器学习必须掌握的算法原理及Python代码实现,达到利用Pyhton代码结合算法解决实际人工智能/机器学习业务分析预测的目的。

学完后胜任的工作岗位:数据挖掘/分析师、人工智能/机器学习开发工程师(初级)

重要程度:⭐⭐⭐⭐

难度系数:⭐⭐⭐

  1. 机器学习入门

  2. 机器学习基础-数理统计必知必会

  3. 机器学习十大经典算法原理与场景概述(入门篇)

  4. 机器学习框架:scikit-learn快速入门

阶段三、工程级

此阶段侧重于对人工智能/机器学习工作流程中最重要的几个环节,通过对数据准备、数据特征、数据模型的深入介绍及算法优化,结合深度学习和具体的经典案例,让学员对于机器学习上升到工程应用的级别,能够进行基本的算法评估与优化。

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(中级)、人工智能/机器算法工程师(初级)

重要程度:⭐⭐⭐⭐⭐

难度系数:⭐⭐⭐

  1. 机器学习数据预备、清洗与特征工程

  2. 机器学习之监督学习核心之分类算法原理与实践

  3. 机器学习之非监督学习算法 - 聚类与关联算法原理与实践

  4. 机器学习之协同过滤原理与实战

  5. 机器学习经典案例集:基于scikit-learn框架实现

  6. 机器学习之集成学习 多算法融合

  7. 机器学习之文本与图像数据挖掘方法

阶段四:算法级

此阶段会让学员对人工智能/机器学习算法有更进一步的深入理解,主要涉及深

度学习、自然语言等时下非常热门的机器学习领域的算法讲解,并结合相关机器学习框架/深度学习框架(Tensorflow 、Keras)简化人工智能-

机器学习、深度学习的代码实现 。

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(高级)、人工智能/机器算法工程师(中级)

深度学习应用开发工程师、人脸识别应用开发工程师

重要程度:⭐⭐⭐⭐

难度系数:⭐⭐⭐⭐⭐

  1. 深度学习入门篇:神经网络、深度学习入门

  2. 深度学习框架篇:TensorFlow从上手到项目实战

  3. 深度学习项目篇:基于Tensorflow的新闻阅读与个性化搜索

  4. 深度学习项目篇:基于Tensorflow深度学习实现的人脸识别系统

  5. 深度学习框架篇 -Keras从入门到实战(卷积、循环神经网络、图像识别、情感分析)

阶段五:专家级

此阶段偏大数据+人工智能及真实项目实战,大数据部分侧重于大数据快速入门

及大数据分析并结合人工智能的一些具体应用,项目主要对时下流行且主流的人工智能/机器学习的项目为主线进行讲解。直接拿阿里天池大赛、Kaggle数据竞赛数据,通过具体的项目实战机器学习、数据分析\挖掘,让学员对之前所学的知识得到充分应用,从而达到融会贯通、举一反三的目的。借助四大商业级项目实战,让学员对推荐系统、大数据下的人工智能应用有一个全面的理解与认识,让学员在工作中有机会冲击数据科学家工作岗位,从而成为这个领域的专家。

 

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(资深)、人工智能/机器算法工程师(高级)、数据科学家

重要程度:⭐⭐⭐⭐

难度系数:⭐⭐⭐⭐⭐

  1. 大数据分析Hadoop及Python实现

  2. 大数据分析框架PySpark基本使用

  3. PySpark分析某航天中心服务器日志

  4. 大数据Hive集成Python分析

  5. 大数据机器学习语言基础 – SCALA

  6. Spark MLlib机器学习

阶段六:综合项目演练

项目实战一:基于FP-growth算法实现的新闻网站流量点击分析系统

项目说明:在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。我们可以从各个角度,使用不同的方法来进行有价值的挖掘,并应用到不同的任务中去。本项目就是从用户点击的历史记录中,挖掘频繁项集,以便知道哪些新闻报道是经常关联在一起的。从而为网站的新闻版面排版,新闻推荐等提供科学的参考。主要涉及到FP-growth、FP-tree等算法的综合运用。

 

项目实战二:基于聚类(Kmeans)算法实现的客户价值分析系统

项目说明:客户价值分析其实就是一个客户分群问题。是以客户为中心,先从客户需求出发,搞清楚客户需要什么,他们有怎么样的一个特征,他们需要什么样的产品,然后我们再回头设计出相应的产品,以满足客户的需求。之所以要进行客户价值分析,就是商家为了避免闭门造车,主观臆断客户需要什么什么什么。随着数据量不断增大,传统的拍脑袋做决定的决策方式,变得越来越过时了。

那具体到我们这个项目呢,我们这个项目的背景是某电信运营商,该运营商需要以客户为中心,按照客户的需求,在对客户特点的了解上,推出不同的资费套餐和营销手段,以便更好地留住现有客户,吸引新的客户。

 

项目实战三:基于LVD、贝叶斯模型算法实现的电商行业商品评论与情感分析案例实战

项目说明:现在大家进行网购,在购物之前呢,肯定会看下相关商品的评论,看下好评和差评,然后再综合衡量,最后才会决定是否购买相关的商品。甚至有不少的消费者已经不看商品详情描述页了,而是直接看评论,然后决定是否下单。商品评论已经是用户决策最为核心的考量因素了。那么生产商或者卖家呢,其实他们也会根据评论里讲到的一些要点,比如说有哪些优点,可以继续发扬;又有哪些缺点,今后可以做继续的改善。那么我们这次的课程,也是对商品好评和差评的情况,做一个分析。并提取出关键词来,帮助我们快速地了解一件商品的好和不好的地方。课程涉及的经典算法是:LDA及贝叶斯模型

 

项目实战四:基于SVD协同过滤算法实现的电影推荐系统

项目说明:协同过滤推荐技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后 利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优 点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

 

项目实战五:基于OpenCV、随机森林算法实现的图像分类识别系统

项目说明:该系统针对图片分类问题进行分析和讨论,旨在提取图片中的脸部轮廓,利用图像的详细信息对比不同图片中的相似度,从而实现对相册图片的自动分类管理。利用OpenCV中提供的图像检测和图像识别的功能,即使用哈尔小波变换(Haar)和Adaboosting算法进行检测,找出图片中特定区域,进而使用局部二进制模式直方图(LBPH)对人脸进行预测,获得两张图片之间的相似度,依照目录整理后,可达到图片按图片分类的效果。在此基础上设计用户操作界面,实现简易、快捷的操作。软件测试结果表明,该软件图像检测和图像匹配的成功率

较高,为生活提供了便利。

 

项目实战六:基于NLP自然语言构建的文档自动分类系统

项目说明:随着互联网技术的迅速发展与普及,如何对浩如烟

海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本分类有着广泛的应用场景,例如:新闻网站包含大量报道文章基于文章内容,需要将这些文章按题材进行自动分类。在电子商务网站,用户进行了交易行为后对商品进行评价分类,商家需要对用户的评价划分为正面评价和负面评价,来获取各个商品的用户反馈统计情况。

电子邮箱频繁接收到垃圾广告信息,通过文本分类技术从众多的邮件中识别垃圾邮件并过滤,提高了邮箱用户的使用效率。媒体每日有大量投稿,依靠文本分类技术能够对文章进行自动审核,标记投稿中的色情、暴力、政治、垃圾广告等违规内容。

本项目属于文本挖掘(自然语言处理NLP)领域的一个经典应用案例,项目目标是开发一个算法,能自动的对给定的每一篇文章进行频道分类,例如分为“爱情类”,“武侠类”,“伦理类”等。涉及到的新技术会包含中文分词,TF-IDF算法,Word2Vec算法等,最后还是会通过机器学习的分类算法来实现自动分类。

 

项目实战七:Kaggle经典AI项目:预测房价系统全程实战

项目说明:这是一个基于Kaggle竞赛的一个实际项目。Kaggle 的房价预测竞赛从 2016 年 8 月开始,到2017 年 2 月结束。这段时间内,超过 2000 多人参与比赛,选手采用高级回归技术,基于我们给出的 79 个特征,对房屋的售价进行了准确的预测。我们课程主要介绍的是目前得票数最高的优胜方案:《用 Python 进行全面数据探索》,该方案在数据探索,特征工程上都有十分出色的表现。

 

项目实战八:基于RFM模型实现的零售精准营销响应预测系统

项目背景:零售行业中,商家可以搜集到顾客完整的消费记录,如何从中挖掘客户的消费特征和价值,以及如何有针对性的对客户进行精准营销,这是商家最关注的问题,也是CRM的核心应用场景。

业务目标:如何评估客户价值、如何筛选最优质的客户进行精准营销、预测客户的营销响应度涉及算法:

-逻辑回归

-决策树

-支持向量机

-随机森林

 

项目实战九:天猫、京东电商 双11实时商品推荐展示分析平台

项目说明:对于电商、金融、电信、交通等行业,需要对用户购物数据、现金消费数据、上网浏览数据及路况状态数据进行实时统计分析与展示,以便实时商品推荐和货量调度、实时交易风控及实时交通监控和疏导。由于此类数据产生快且多,业务本身需要数据产生之时就要进行实时快速的处理,以便进行展示。当前大数据分析技术框架中,实时流式计算框架Strom和SparkStreaming被逐渐使用,比如电商公司的销售营业额的实时统计(Storm/-JStorm),苏宁顺丰的物流实时追踪监控(SparkStreaming)等都是实时的数据分析处理。

 

项目实战十:基于Mahout、Spark Mlib实现的推荐系统(电影推荐、社交推荐)

项目说明:推荐系统是大数据中最常见和最容易理解的应用之一,最著名的应用恐怕就是亚马逊公司的推荐引擎,其为浏览Amazon.com网站的用户提供个性化的内容。但是不仅仅只有电子商务公司会用推荐引擎为用户提供额外的商品,推荐系统也可以被用在其他行业,以及具有不同的应用中使用,从推荐音乐、活动、产品到约会对象。本课程主要讲述了大数据环境的下推荐系统从零搭建的全过程,通过两个项目实现全程内容贯穿,主要课程目标如下:

目标一:掌握推荐系统的原理

目标二:能够基于mahout、spark MLlib进行推荐系统的开发

                                                            

商业项目实战-01:基于AI人脸识别技术实现的“仿美颜相机-自拍坊”企业级应用

项目说明:本项目模仿了:美颜像机自拍加特效的核心功能实现,是一个有料有趣的应用,项目虽小,但功能技术点确非常的多,包括但不限于:人脸识别技术应用、摄像头的控制、图像库的处理,GitHub的使用等 。代码略加改造即可应用在实际工业生产项目中,可以讲是一个集趣味,技术,算法与商业应用为一体的课程,具有很高的实用价值!

 

商业项目实战-02:基于深度学习的CT图像肺结节自动检测技术(深度学习在医疗行业的实践应用\CPU、GPU两套运行环境)

项目说明:传统医疗图像检测的问题:根据相关研究表明:中国每年医学影像增速达到了30%,而放射科医生的年增长率仅为4.1%, 远远低于影像数据的增长,需求缺口不断加大,医生数量的不足导致工作量繁重,超负荷工作也会导致误诊率和漏诊率提高。

AI的优势:高效性:人工智能能够快速完成初筛,交由医生进行判断,能够大幅缩短医生阅片时间。全面性。一张图片医生会根据经验挑重点可疑区域来现察.而机器可以完整地观察整张切片而无遗漏;稳定性。机器不需要休息,不会受到疲劳状态影响。其诊断结果能保持完全的客观、稳定和复现。

本课程是由一线的深度学习工程师结合实际商业医疗的应用场所景给出的一套解决方案,涉及大量的深度学习技术,并给出了CPU、GPU两套运行环境,具有非常强的学习与商业应用价值!

备注:课程的具体课时安排,老师根据学院和班级情况适当调整。

学习方式:

三种学习方式,可根据学生的实际情况进行灵活选择。三种学习方式价格不等。

方式一:在线点播(视频+直播答疑+作业+测试+就业推荐)

方式二:在线直播(线下面试课程同步直播)

方式三:线下面试

学习周期:

  1. 在线点播:学习时间低点不限根据个人情况选择,但平台学习时间为一年,一年后如果课程还没学完可根据自身情况向班主任申请延期。

  2. 在线直播:学习周期同线下面授

  3. 线下面授:全日制3个多月,周末约4个多月