课程信息
课程介绍
课程目标:
1、掌握大模型环境配置
2、掌握Llama系列模型架构和原理
3、掌握大模型词表扩展,适配中文
4、掌握Qwen模型架构
5、掌握ChatGLM模型架构和原理
6、掌握大语言模型微调
7、掌握大模型推理优化策略
8、掌握大模型部署方案
9、掌握大模型用于文本摘要
10、掌握Text2SQL应用
11、掌握LLM角色扮演应用
12、掌握LLM生成PPT
13、掌握Agent技术
14、掌握RAG应用及优化
课程大纲:
时间 | 主题 | 内容 | |
第一天 | 上午 8:30-11:30 | 大模型环境配置 | 1、 Cuda安装 l Cuda l Cudnn 2、 Conda l Conda安装 l Conda环境创建 3、 Pytorch l GPU版本安装和测试 4、 Langchain l 安装Langchain l 构建简单应用 |
下午 13:30-16:30 | 大模型架构和原理 | 1、 Transformer 2、 Llama l 模型架构 l 不同版本比对 l 中文适配 3、 Qwen模型 l 模型架构 l 训练数据 4、 ChatGLM模型 5、 Tokenizer方法 | |
第二天 | 上午 8:30-11:30 | 大模型微调、部署 | 1、 LLMs微调 l 不同的微调方法 l 训练加速方法 l 训练框架 2、 LLM推理 l 推理优化方法 3、 LLM部署框架 l Ollama部署 4、 LLM微调框架 l Llamafactory微调
|
下午 13:30-16:30 | 大模型应用 | 1、 文档摘要 2、 Text2SQL 3、 角色扮演 4、 PPT生成 5、 Agent 6、 RAG应用及优化 |
相关推荐课程