教师运营台课堂实训

43班级学生

207评分记录

11低分提醒

作业完成78%

复盘质量66%

知识覆盖92%

AI 分录草稿借贷平衡

摘要：采购原材料并取得增值税专用发票

方向科目金额

借1403 原材料28,600.00

借2221.01 进项税额3,718.00

贷1002 银行存款32,318.00

复盘评分 86 分

科目准确22/25

税额处理19/25

证据链23/25

学生复盘22/25

评分提示：复盘中需要补充进项税额抵扣条件与付款凭证对应关系。

教师评阅工作区

评分详情 · 本地运行截图

展示 AI 评分、维度判断与票据摘要的真实界面。

2026 人工智能赋能教育创新应用大赛 · 参赛作品

大模型赋能财务实训

以校企合作研发的 Nexora IPA 智能记账系统为原型，构建面向会计实训的教学平台。针对通用大模型在垂直领域成本高、精度不足的问题，基于 Qwen3-8B 开源模型，通过 QLoRA+SFT 轻量化领域优化与课程评分量规，形成"模型生成—规则校验—评分解释"的教学闭环，让 AI 大模型真正落地会计课堂。

今天要处理哪类会计实训任务？进入系统

查看教师后台

2年服务教学场景 持续课堂实训与交付验证

30万+ 处理真实业务 票据、凭证、分录与复盘样本

12个 校企合作单位 覆盖实践教学与业务案例来源

4500名 教育学生 面向会计实训与 AI 素养培养

平台背景

从企业级 IPA 原型到课堂教学平台

为顺应国家教育数字化战略与人工智能赋能教育教学的总体方向，我们团队依托学院与企业合作研发的 Nexora IPA（智能流程自动化）记账系统为原型，将企业级的财务 AI 能力迁移至教学场景，设计了面向高职会计实训的大模型教学平台。

我们的目标不是展示"AI 有多强"，而是让学生在真实的会计任务中理解 AI 能做什么、不能做什么、如何审慎地使用它，培养适应智能财务时代的复合型技能人才。

学生实训工作台

AI 分录草稿 借贷平衡

采购原材料并取得增值税专用发票。

借: 1403 原材料
借: 2221.01 进项税额
贷: 1002 银行存款

学生点评

我认为还要核对发票抬头、税号和供应商信息，确认进项税额能否抵扣。

教师运营台

43班级学生 207评分记录 11低分提醒

课堂讲评建议

优先处理低分与异常复盘，把教师注意力集中到教学薄弱点。

model_provider.yaml

provider: qwen3-8b
adapter: qlora
rubric: accounting_training
fallback: deepseek

模型服务与课程量规

维护模型供应商、评分规则与知识库来源，让课堂流程和模型优化保持同一套证据链。

问题与方案

从通用模型局限到会计实训闭环

在教学场景中逐步推广 AI 应用后，我们发现一个核心矛盾：大参数模型语义理解强、生成质量高，但单次推理成本高；小参数模型部署成本低、响应快，却容易在会计垂直知识上出现分录不规范、准确率偏低。

因此，本项目把「模型适配、课程量规、证据检索、评分解释」组织成可复核链路，让优化结果能够被教师理解，也能够被评审快速检视。

Research Report

通用大模型在会计实训中的局限

执行摘要

以课堂会计实训为边界，通用大模型的主要价值在于生成语言、整理线索与提供初步解释，但其短板同样清晰：一是事实性与依据绑定不足，模型可能生成看似流畅却未被票据或规则充分支撑的内容；二是对技术性会计任务的稳定性不够，尤其在分录、报表归集与细则判断等高约束环节，可靠度往往低于说明性问答；三是若缺少教学设计，模型容易替代学生思考过程，只提升表面完成度而不必然带来真实学习增益。

会计实训场景中的关键局限

会计实训并不是普通问答，而是围绕“票据—业务判断—分录—评分—复盘”的连续任务。学生上传真实票据后，系统若只给出一个直接答案，教师难以判断该答案究竟来自票据信息、课程规则，还是模型的参数记忆与概率补全。落实到会计教育，生成式 AI 对案例说明可能较强，但在技术性会计问题上表现更需谨慎，尤其涉及 journal entries 与 financial statements 的生成时， “可得答案”并不等于“可作教学依据”。

第二个局限在于评价机制。课堂实训关注的不只是学生是否写出了分录，更看重其是否能说明业务事实、辨认会计科目、复盘错误来源，并在教师讲评后修正理解。若把评分完全交给通用模型，学生可能只关注“得分结果”，而忽略“为什么这样记、为什么这样改”的学习过程。在会计实训中，AI 若不能把评分、解释与复盘连接起来，反而会削弱课堂诊断功能。

对项目设计的约束含义

因此，在“大模型赋能财务实训”这一项目边界下，通用大模型更适合被定位为“可复核的草稿引擎与反馈助手”，而不是“自动做账终局系统”。学生端先上传真实票据，再查看 AI 分录草稿、完成业务复盘、接收评分反馈；教师端则查看 AI 评分、复核学生复盘、进行讲评并回收教学薄弱点。这一路径的关键，不是追求一次性替代教师，而是把模型输出还原为可检查的教学证据链：票据是否支撑分录、量规是否支撑评分、解释是否能被教师复核。

Optimization Path

面向课堂实训的轻量化优化路径

执行摘要

面向课堂真实任务，优化路径不宜走“更大模型、更多参数、完全自动化”的方向，而应走“够用基座 + 轻量适配 + 检索与规则补强 + 教师复核”的组合路线。以 Qwen3-8B 作为底座，以 QLoRA + SFT 做领域适配，再叠加课程评分量规、知识库检索、规则校验与评分解释，能够把大模型从通用回答器收敛为课堂实训助手。其核心价值不在于制造更炫的自动化，而在于在有限成本下提升输出可控性，并把票据依据、分录草稿、复盘内容、评分理由和教师讲评连接成一个完整的教学闭环。

轻量化优化框架

从技术路线看，Qwen3 系列包含 8B 密集模型，整体设计目标强调性能、效率与多语言能力，这使其适合作为课堂级部署与课程语料适配的基础模型。QLoRA 通过量化与 LoRA 结合降低微调资源需求，再结合 SFT，模型可以围绕课程语境学习更稳定的输出习惯，例如票据描述方式、分录书写格式、复盘表达结构与评分解释口径。

01领域数据集围绕凭证生成、错账诊断、评分反馈整理课程样本。
02QLoRA + SFT在 Qwen3-8B 基座上完成低成本领域适配。
03量规与检索引入课程评分量规和知识库检索，校验生成依据。
04课堂反馈把学生复盘、教师点评与薄弱点讲评纳入闭环。

规则校验与评分解释

仅靠模型权重仍然不够，课堂实训还需要把“知识”和“规则”从模型内部拉回到外部。知识库检索适合承接课程规则、行业知识与典型案例；规则校验则承担借贷平衡、票据字段一致性、分录格式完整性等确定性检查。这样的设计能把学生端“上传真实票据—查看 AI 分录草稿—完成业务复盘—查看评分反馈” 与教师端“查看 AI 评分—复核学生复盘—给出讲评并反馈教学薄弱点”串成同一逻辑链。

面向课堂落地的设计价值

这一路径回应的不是抽象的 AI 能力，而是课堂管理者最关心的实施指标。第一，可复核。评分不再是黑箱结论，而是能够回看票据、量规、规则与解释链条。第二，可解释。系统输出的不只是“对错”，还应说明为什么建议该分录、为什么扣分、为什么需要复盘。第三，低成本。轻量基座与 QLoRA 适配降低了领域化落地门槛，使项目更适配校企合作和课程迭代。第四，教师可介入。课堂真正需要的不是“把教师拿掉”，而是把 AI 嵌入真实票据、真实业务和真实讲评之中，成为教师可调度、学生可反思的实训基础设施。

Technical References

公开方法如何用于本项目

下列公开方法用于说明本项目中每类技术选择对应的来源：DeepSeek-R1 用于理解推理与蒸馏路线， LoRA/QLoRA 对应低成本适配，RAG 对应课程规则与知识库检索，DPO 和 Self-Instruct 对应后续偏好优化与样本扩展。

年份方向参考材料本项目中应用于

2025ReasoningDeepSeek-R1 开源说明理解推理模型、蒸馏模型和公开评测口径。 2025RL / DistillationDeepSeek-R1 Technical Report对照推理强化、冷启动数据和蒸馏训练设计。 2021Parameter Efficient TuningLoRA对应本项目 QLoRA 轻量化适配路线。 2020RetrievalRetrieval-Augmented Generation应用于课程规则、行业知识库和证据链检索。 2023Preference OptimizationDirect Preference Optimization预留给教师反馈偏好和风险提示偏好的后续优化。 2022Instruction DataSelf-Instruct应用于任务样本扩展、场景指令构造和案例生成。

Model Report

会计实训模型表现

Qwen3-8B 后续模型

分录准确率92.32%

优化前 88.79% → 优化后 92.32%

业务事件 F189.3%

优化前 74.6% → 优化后 89.3%

ROUGE-L0.894

优化前 0.923 → 优化后 0.894，业务指标更贴近课堂评分目标。

单次推理成本≈￥0.02

优化前￥0.12 → 优化后 ≈￥0.02

教学应用

从课堂实训到教师评阅到持续优化

教师可以在课堂中直接使用本系统完成"发布作业→学生实训→AI 评分→教师复核→课堂讲评"的完整教学链条。大模型优化不是脱离教学的"黑盒"，而是融入每个教学环节的辅助工具。

课堂闭环 课堂实训

学生上传票据、查看 AI 分录草稿、完成业务复盘、查看评分反馈，形成"做中学"的完整实训体验。

我上传了一张真实业务票据，请先生成会计分录，并说明需要我重点复盘的判断点。

19:52

已处理 18m 44s ›

AI 分录回复 Qwen3-8B · 会计实训

会计分录草稿 借贷平衡

摘要：采购原材料并取得增值税专用发票，AI 初步识别为可抵扣进项税业务。

借	1403 原材料	28,600.00
借	2221.01 进项税额	3,718.00
贷	1002 银行存款	32,318.00

票据证据 23 / 25

行业理解 23 / 25

分录修正 28 / 30

表达完整 19 / 20

当前复核重点 票据证据

能否引用票据金额、日期、交易方和附件，支撑分录判断。

教师点评 票据证据

当前点评维度：票据证据

持续优化材料 数据集 · 规则 · 模型迭代

1课堂实训数据票据、分录、复盘

2教师讲评反馈错误类型与评分口径

3规则与模型迭代越用越准