人工智能中的项目流程

本文介绍了从ChatGPT热身后,通过实例探讨了人工智能项目中的房价预测流程,包括问题分析、数据构建、模型选择、部署以及优化,强调了数据和需求确定的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大家好我是木木,只从2022年11月30日发布ChatGPT后,大模型迅速火热起来,人工智能作为当下最火的行业之一,很多人对它充满了好奇,接下来由我通过房价预测项目为大家揭开人工智能中项目流程。

案例:房价预测项目流程

第一步:分析问题,搞定输入输出

      分析问题的本身,定义房价输入特征和输出的标签

      输入特征:输入一套房子

              特征:地段、价格、面积。。。

       输出标签:返回房子的价格

               标签:价格

第二步:根据输入、输出构建数据集

      收集基础数据,将基础数据特征列进行数字化,用于后续训练使用。数据可以创建一张数据采集表:尤采集人员进行数据采集,并将采集数据根据规定范围进行填写。    

      例如:要预测北京房价,可以进行分层采样数据:二环内房价信息采集5000套、二-三环内房价信息采集5000套、三-四环内房价信息采集5000套、四环-五环内房价信息采集5000套。

       将采集标中的数据进行数字化:连续量:直接使用原始数据即可;离散量:One-Hot Encoding编码。

       One-Hot Encoding编码是什么可能不了解AI的同学不清楚,简单说就是将一串文字转成数字,用于给算法进行训练。

       假设房价里面有一些特征:如二环内、房间类型(如一室一厅、两室一厅等)这些是离散的文字信息,在机器学习中算法无法直接使用这些离散特征中的数据进行算法训练,此时需要我们给这些特征转换成数字,转成什么数字需要我们自行在前期定义,如房间类型特征中的一室一厅,我们可以定义为11,两室一厅定义为21.

第三步:遴选模型

       通过选取不同算法完成模型训练进行验证和评估,最终选择最优模型作为模型使用。

       为什么要选取不同算法完成模型训练:主要的原因是不同的算法有不同的特色和优点,通过选取不同算法进行训练,选取最优的模型作为选择。

第四步:上线部署,做预测推理

       服务端部署:通过客户端请求服务器,得到推理结果。

       终端部署:边缘计算,部署在设备上,在本地进行算法推理。   

第五步:模型优化

       根据上线项目采集现场数据和实际情况,再对模型进行模型优化。

以上就是AI项目的整体流程,其中可能最难的就是数据的采集和需求

AI中没有数据就没有灵魂,想要训练一个好的模型数据是必不可少的,当然数据也是最难搞的,需要花费大量的人力和物力

需求听着简单,但是前期没有确定好需求,后期再做需求的调整,前期所有的工具基本白费,全部推翻重来,那时送你一个痛苦面具

最终提醒一句:人工智能不是万能的,它不能解决所有的问题,并且使用它的代价很高,所有从工程上的角度来说,能用简单的方法解决问题,坚决不用人工智能。

科普小知识:

服务器端部署:客户端请求服务器,服务器中进行算法的推理,将结果再返回给客户端。

边缘计算:将数据和目标的计算尽可能的靠近在终端设备,以提供更低的延迟、更高的带宽利用率与良好的用户体验。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mumu-hn

点击打赏,感谢一路同行❤️

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值