📚 教程介绍
本教程专为有一定编程基础的开发者设计,从零开始系统掌握大语言模型开发的核心技术栈。从最基础的API调用开始,逐步深入到LangChain框架应用、RAG系统构建、Agent智能体开发,最终完成模型微调与私有化部署实战。每个模块均配套真实企业级项目案例。
🧰 核心开发工具
主流大模型API
OpenAI / Claude / Gemini / DeepSeek / Qwen / 通义千问 / DeepSeek
应用框架
LangChain / LlamaIndex / LangFlow / Dify / Coze
向量数据库
Chroma / Weaviate / Pinecone / 阿里云向量 / Milvus
Agent平台
AutoGen / CrewAI / LangGraph / MetaGPT
微调技术
LoRA / QLoRA / P-Tuning / SFT / RLHF / DPO
推理部署
vLLM / Ollama / LM Studio / Text Generation WebUI
📖 教程大纲
第一章:大语言模型API调用入门
- API Key申请、安全配置与成本控制
- 文本补全、对话接口、流式输出
- 多模态输入:图像识别与图像生成
- 结构化输出(JSON Mode)与Function Calling基础
- 实战:30分钟搭建你的第一个AI助手
第二章:LangChain / LlamaIndex应用框架
- 核心概念:Model / Prompt Template / Memory / Chain / Agent
- 自定义Prompt模板与Memory管理
- Chain链式调用与LCEL表达式
- Output Parser与结构化输出
- 实战:用LangChain搭建智能问答助手
第三章:RAG(检索增强生成)
- 为什么需要RAG?大模型幻觉与信息过时问题
- 文档解析:PDF/Doc/网页到Chunker分块
- 向量化与向量数据库选型与对比
- 检索优化:Query改写、重排(ReRank)、多路检索
- 高级RAG:Self Querying / Hybrid Search / 多模态RAG
- 实战:搭建企业私有文档问答系统
第四章:Agent智能体与自动化工具调用
- Function Calling / Tool Use 原理与实现
- Agent类型:ReAct / Plan-and-Execute / AutoGen多智能体协作
- LangGraph构建有状态Agent工作流
- 多智能体协作:CrewAI / AutoGen
- 实战:多Agent协作的任务处理系统
第五章:大模型微调(Fine-tuning)
- 预训练 vs 监督微调(SFT)vs RLHF vs DPO
- LoRA/QLoRA/Adapter轻量化微调:消费级显卡即可训练
- 数据准备、格式与质量控制
- 主流开源模型:Llama / Qwen / DeepSeek / Mistral
- 基于 Unsloth / Axolotl / PEFT 实战训练
- 效果评估与上线部署清单
第六章:私有化部署与推理加速
- 本地运行开源模型:Ollama / LM Studio 一键部署
- 生产推理加速:vLLM / SGLang / TensorRT-LLM
- 量化技术:GPTQ / AWQ / FP8
- 模型服务化与API暴露:FastAPI + vLLM
- 成本优化、缓存策略、监控与日志
- 实战:从零到上线一个私有化大模型服务