实现的目标
本项目使用Transformer模型对邮件进行垃圾邮件(spam)和正常邮件(ham)的分类。
数据集来源
数据集来自 SpamAssassin公共语料库
项目结构
data_processor.py: 处理数据加载和处理data_preprocessor.py: 为模型准备数据model.py: 定义Transformer模型trainer.py: 包含模型训练逻辑evaluator.py: 评估训练好的模型main.py: 协调整个处理过程environment.yml: 定义Conda环境