10大免费机器学习项目,预测股市销售额
2022/12/30 来源:不详机器学习,听起来挺遥远的技术,其实它已经广泛应用在我们的工作、生活中了,比如物流机器人、Siri、Alexa语音助手、机器人客服等等。
如果你未来想要从事机器学习相关职业,你除了要掌握扎实的理论知识意外,亲身参与的实践项目也必不可少,网络上有不少免费的资源可供利用,今天世界顶级在线培训课程专家圣普伦和大家分享10个机器学习项目。
10大机器学习项目
1、Movielens
MovieLens是一个推荐系统。它由美国Minnesota大学计算机科学与工程学院的GroupLens项目组创办,是一个非商业性质的、以研究为目的的实验性站点。MovieLens主要使用CollaborativeFiltering和AssociationRules相结合的技术,向用户推荐他们感兴趣的电影。对初学者来说,这是一个很好的入门机器学习的项目,它简单且有趣,对新手非常友好,新程序员可以通过Python或R语言以及来自Movielens数据集的数据进行编码来练习。
2、TensorFlow
TensorFlow是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统,其中包含各种工具、库和社区资源,可助力研究人员推动先进机器学习技术,是初学者提高机器学习技能的绝佳起点。借助TensorFlow,初学者可使用该库创建数据流图和一系列应用程序,它还拥有用于Java的API。
3、Walmart
没错,是你想到的那个沃尔玛超市。沃尔玛为45个门店的98种产品提供数据集,因此开发人员可以访问各个地点或者各个部门每周的销售数据,并以这些数据来预测未来的销售额,此外,开发人员也可以通过机器学习帮助沃尔玛进行渠道优化或者库存规划。沃尔玛机器学习平台特别适用于致力于在零售业发展的学员。
4、Quantopian/Quandl股价预测
普通人购买基金或者股票的时候,往往不具备看趋势的能力,有的甚至没有这个意识,从而导致投资失败。但如果你通过Quantopian/Quandl平台下载市场数据,利用机器学习技术分析过去10年、20年的价格、波动指数、股票波动相关事件,那么你将能够对未来的股市进行更科学的预测,而不是盲买。
5、人类在手机上的活动数据
如今智能手机人手必备,每天我们在手机上产生大量的数据,社交数据、健康数据、交易数据、娱乐数据等等数不胜数,大家可以将这些数据收集利用,建立一个能够准确预测未来活动的分类模型。
6、葡萄酒质量预测
没想到吧,葡萄酒也是一个非常有趣的机器学习项目,尤其是对爱喝酒的人来说,可谓是幸福。自古以来,人类鉴定葡萄酒是否优质的手段比较原始,比如用眼看,用鼻子闻,用舌头品尝等等。但是,通过葡萄酒数据集,你可以通过数据探索、数据可视化、回归模型和R编程等技术来预测葡萄酒的质量。
7、乳腺癌预测
该项目使用的数据集有助于确定乳腺肿瘤是恶性还是良性的,它可以综合分析各种因素,包括肿块的厚度、裸核的数量和细胞有丝分裂。这也是新手练习R编程的绝佳方式。
8、IrisFlowers
IrisFlowers数据集是一个非常有名的数据集,也是最古老和最简单的机器学习项目之一。通过这个项目,初学者能够学会如何处理数值,掌握数据的基础知识。多重变量分析的数据集。它最初是埃德加·安德森从加拿大加斯帕半岛上的鸢尾属花朵中提取的地理变异数据,后由罗纳德·费雪作为判别分析的一个例子,运用到统计学中。
其数据集包含了个样本,都属于鸢尾属下的三个亚属,分别是山鸢尾、变色鸢尾和维吉尼亚鸢尾。四个特征被用作样本的定量分析,它们分别是花萼和花瓣的长度和宽度。基于这四个特征的集合,费雪发展了一个线性判别分析以确定其属种。
9、Twitter抓取
这个项目能够快速过滤包含特定单词和信息的推文,这也是一个非常适合初学者的机器学习项目,程序员可以通过创建一个算法来运行自然语言,从而抓取想要的推文内容,比如和某个主题、某个人物相关的推文。
10、将手写文档转换为数字化版本
这是一个图像识别项目,比如给你一本古籍,通过图像识别,你能够将古籍上的文字提取出来并做成电子版供更多人阅读。
如果你的理论知识不扎实,可能开启上述10种机器学习项目时间会有一定难度。基础薄弱的同学可以参加simplilearn圣普伦的机器学习训练营,课程包括58小时的应用学习、互动实验室、4个实践项目和指导,通过圣普伦机器学习认证培训,你将会掌握机器学习认证考试所需的机器学习知识,比如数据预处理、监督学习和无监督学习、时间序列建模、回归以及文本挖掘等。