多模态大模型技术原理和实战

前言与导读

书籍定位与读者群
工程与研究结合的重要性

第一部分：基础理论与背景

大模型概述
深度学习基础回顾
多模态基础

第二部分：核心模型架构

Transformer 架构详解
大模型架构设计
多模态大模型架构

第三部分：训练方法与优化

数据准备与处理
大规模训练技术
强化学习与指令调优
高效推理与部署

第四部分：多模态应用与实战

证据化多模态 RAG
结构化抽取（表单 → JSON）
图文检索（CLIP）
指令式图像编辑
视频摘要系统

随笔（阅读笔记 / 日常思考，与本书主线不直接相关）

随笔
- 2026.01.15
- 2026.01.05
端到端模型是否适合医疗医嘱生成

多模态大模型技术原理和实战

索引

索引

© 版权所有 2025-2026, Xuyang Cao, newxuyangcao@gmail.com。

利用 Sphinx 构建，使用的主题由 Read the Docs 开发.