机器学习——感知机模型

本文介绍了感知机的基本概念,包括定义、学习策略(尤其是随机梯度下降法),并通过Python代码实现了一个二维数据集上的感知机模型。文章展示了如何构建数据、编写关键函数以及迭代过程,但提到了一些后续计划如数学解释和改进点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习系列文章

入门必读:机器学习介绍



前言

大家好,大家好✨,这里是bio🦖。这次为大家带来的是感知机模型。下面跟我一起来了解感知机模型吧!

感知机 (Perceptron) 是二类分类的线性分类模型 ,其输入为实例的特征向量 ,输出为实例的类别 ,分别为 +1-1。1957年,由康奈尔航空实验室(Cornell Aeronautical Laboratory)弗兰克·罗森布拉特 (Frank Rosenblatt)提出。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。在人工神经网络领域中,感知机也被指为单层的人工神经网络,以区别于较复杂的多层感知机。在这里插入图片描述


1. 感知机

1.1 感知机定义

感知器使用特征向量来表示二元分类器,把矩阵上的输入 x \mathcal{x} x(实数值向量)映射到输出值 y \mathcal{y} y 上(一个二元的值)。
f ( x ) = { + 1 ,    i f   w ⋅ x + b > 0 − 1 ,    e l s e f(x) = \begin{cases} +1,\,\, if\,w\cdot x+b>0\\ -1,\,\,else\\ \end{cases} f(x)={ +1,ifwx+b>01,else

w \mathcal{w} w 是实数的表示权重的向量, w ⋅ x \mathcal{w} \cdot \mathcal{x} wx 是点积。 b \mathcal{b} b 是偏置,一个不依赖于任何输入值的常数。


1.2 感知机学习策略

假设训练数据集是线性可分的 ,如下图所示。感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的直线 L \mathcal{L} L。 为了找出这样的超平而 , 即确定感知机模型参数 w \mathcal{w} w b \mathcal{b} b ,需要确定一个学习策略 , 即定义损失函数并将损失函数极小化 。

损失函数的一个选择是误分类数据点的数量 。 但是这样的损失函数不是参数 w \mathcal{w} w b \mathcal{b} b 的连续可导函数,不易优化 。 损失函数的另一个选择是误分类数据点到直线 L \mathcal{L} L 的总距离。感知机所采用的就是后者 。
在这里插入图片描述

  • 对于错误分类的数据点 ( x i , y i ) (\mathcal{x_i, y_i}) (xi,yi),总有:
    − y i ⋅ ( w ⋅ x i + b ) > 0 \mathcal{-y_i\cdot(w\cdot x_i+b) > 0} yi<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Bio大恐龙

您的打赏是我前进的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值