本文以Google colab 环境,基于ollama+gemma2实现钓鱼邮件的分析,代码实现逻辑主要分为以下八步。
一、基础环境设定
本步骤主要包括ollama下载和作为本地服务器的设置,尤其是ollama服务作为子进程异步运行,并在单独线程中启动它,以确保代码继续执行而不会被阻塞。
二、安装必要工具
涉及11个库,涉及数据解析、交互设计、可视化等多种操作,主要方便后续的数据处理。
-
openai
:OpenAI 的官方库,用于访问 OpenAI API(如 GPT 系列模型)。安装此库意味着后续代码可能涉及到对 OpenAI 模型的调用和使用。 -
pydantic
:用于数据模型的定义和验证,特别是用于定义清晰的、可验证的数据结构。常用于构建具有严格类型控制的数据对象。 -
instructor
:这是 Hugging Face 出品的一个库,可以用于文本嵌入(text embedding),即将文本转化为向量表示,广泛应用于 NLP 任务中。 -
<