机器学习——感知机模型

Bio大恐龙

已于 2024-03-15 09:16:28 修改

阅读量5k

点赞数 56

CC 4.0 BY-SA版权

文章标签：机器学习人工智能数据可视化

于 2024-03-07 21:40:44 首次发布

本文链接：https://blog.csdn.net/ouyangk1026/article/details/136544394

本文介绍了感知机的基本概念，包括定义、学习策略（尤其是随机梯度下降法），并通过Python代码实现了一个二维数据集上的感知机模型。文章展示了如何构建数据、编写关键函数以及迭代过程，但提到了一些后续计划如数学解释和改进点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习系列文章

入门必读：机器学习介绍

前言

大家好，大家好✨，这里是bio🦖。这次为大家带来的是感知机模型。下面跟我一起来了解感知机模型吧！

感知机 (Perceptron) 是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，分别为 +1 和 -1。1957年，由康奈尔航空实验室（Cornell Aeronautical Laboratory）弗兰克·罗森布拉特（Frank Rosenblatt）提出。它可以被视为一种最简单形式的前馈神经网络，是一种二元线性分类器。在人工神经网络领域中，感知机也被指为单层的人工神经网络，以区别于较复杂的多层感知机。在这里插入图片描述

1. 感知机

1.1 感知机定义

感知器使用特征向量来表示二元分类器，把矩阵上的输入 $\mathcal{x}$ （实数值向量）映射到输出值 $\mathcal{y}$ 上（一个二元的值）。
$\begin{cases} +1,\,\, if\,w\cdot x+b>0\\ -1,\,\,else\\ \end{cases}$

$\mathcal{w}$ 是实数的表示权重的向量， $\mathcal{w} \cdot \mathcal{x}$ 是点积。 $\mathcal{b}$ 是偏置，一个不依赖于任何输入值的常数。

1.2 感知机学习策略

假设训练数据集是线性可分的，如下图所示。感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的直线 $\mathcal{L}$ 。为了找出这样的超平而，即确定感知机模型参数 $\mathcal{w}$ ， $\mathcal{b}$ ，需要确定一个学习策略，即定义损失函数并将损失函数极小化。

损失函数的一个选择是误分类数据点的数量。但是这样的损失函数不是参数 $\mathcal{w}$ ， $\mathcal{b}$ 的连续可导函数，不易优化。损失函数的另一个选择是误分类数据点到直线 $\mathcal{L}$ 的总距离。感知机所采用的就是后者。
在这里插入图片描述