文章目录
前言
随着AI大模型的不断发展,AI大模型应用开发这门技术也越来越重要,很多人都开启了学习AIGC,本文介绍了AI大模型基础之Embedding向量化处理。从本章开始正式启动AI大模型开发学习之旅
环境准备
环境变量:OPENAI_API_KEY :(配置好OpenAI账号的Api Key)
依赖包安装:pip install tiktoken openai pandas matplotlib plotly scikit-learn numpy
数据集准备:https://download.csdn.net/download/xiaobing259/89083028
一、Embedding介绍
1、嵌入/向量化:将对象转化为向量表示,Embedding之间的距离可表示两个对象之间的相似性
2、词嵌入(Word Embedding):将单词、文本转化为向量表示、可以通过向量捕获单词之间的语义关系;词嵌入算法模型:Word2Vec、GloVe和FastText等
3、图像嵌入(Image Embedding):将图片转换为低维向量,这些向量能够捕捉图像的视觉特征,如颜色、纹理、形状等。这样的嵌入通常用于图像识别、分类和检索任务;嵌入方法:卷积神经网络(Convolutional Neural Networks, CNN)
4、图嵌入(Graph Embed