摘要:采购原材料并取得增值税专用发票
评分提示:复盘中需要补充进项税额抵扣条件与付款凭证对应关系。
评分详情 · 本地运行截图
展示 AI 评分、维度判断与票据摘要的真实界面。
金额
税额
供应商
2026 人工智能赋能教育创新应用大赛 · 参赛作品
大模型赋能财务实训
以校企合作研发的 Nexora IPA 智能记账系统为原型,构建面向会计实训的教学平台。 针对通用大模型在垂直领域成本高、精度不足的问题,基于 Qwen3-8B 开源模型, 通过 QLoRA+SFT 轻量化领域优化与课程评分量规, 形成"模型生成—规则校验—评分解释"的教学闭环,让 AI 大模型真正落地会计课堂。
从企业级 IPA 原型到课堂教学平台
为顺应国家教育数字化战略与人工智能赋能教育教学的总体方向,我们团队依托学院与企业合作研发的 Nexora IPA(智能流程自动化)记账系统为原型,将企业级的财务 AI 能力迁移至教学场景, 设计了面向高职会计实训的大模型教学平台。
我们的目标不是展示"AI 有多强",而是让学生在真实的会计任务中理解 AI 能做什么、不能做什么、如何审慎地使用它,培养适应智能财务时代的复合型技能人才。
采购原材料并取得增值税专用发票。
- 借
- 1403 原材料 28,600.00
- 借
- 2221.01 进项税额 3,718.00
- 贷
- 1002 银行存款 32,318.00
我认为还要核对发票抬头、税号和供应商信息,确认进项税额能否抵扣。
优先处理低分与异常复盘,把教师注意力集中到教学薄弱点。
provider: qwen3-8b
adapter: qlora
rubric: accounting_training
fallback: deepseek
维护模型供应商、评分规则与知识库来源,让课堂流程和模型优化保持同一套证据链。
从通用模型局限到会计实训闭环
在教学场景中逐步推广 AI 应用后,我们发现一个核心矛盾:大参数模型语义理解强、生成质量高, 但单次推理成本高;小参数模型部署成本低、响应快,却容易在会计垂直知识上出现分录不规范、准确率偏低。
因此,本项目把「模型适配、课程量规、证据检索、评分解释」组织成可复核链路, 让优化结果能够被教师理解,也能够被评审快速检视。
Research Report
通用大模型在会计实训中的局限
执行摘要
以课堂会计实训为边界,通用大模型的主要价值在于生成语言、整理线索与提供初步解释,但其短板同样清晰: 一是事实性与依据绑定不足,模型可能生成看似流畅却未被票据或规则充分支撑的内容;二是对技术性会计任务的稳定性不够, 尤其在分录、报表归集与细则判断等高约束环节,可靠度往往低于说明性问答;三是若缺少教学设计, 模型容易替代学生思考过程,只提升表面完成度而不必然带来真实学习增益。
会计实训场景中的关键局限
会计实训并不是普通问答,而是围绕“票据—业务判断—分录—评分—复盘”的连续任务。 学生上传真实票据后,系统若只给出一个直接答案,教师难以判断该答案究竟来自票据信息、课程规则, 还是模型的参数记忆与概率补全。落实到会计教育,生成式 AI 对案例说明可能较强, 但在技术性会计问题上表现更需谨慎,尤其涉及 journal entries 与 financial statements 的生成时, “可得答案”并不等于“可作教学依据”。
第二个局限在于评价机制。课堂实训关注的不只是学生是否写出了分录,更看重其是否能说明业务事实、 辨认会计科目、复盘错误来源,并在教师讲评后修正理解。若把评分完全交给通用模型, 学生可能只关注“得分结果”,而忽略“为什么这样记、为什么这样改”的学习过程。 在会计实训中,AI 若不能把评分、解释与复盘连接起来,反而会削弱课堂诊断功能。
对项目设计的约束含义
因此,在“大模型赋能财务实训”这一项目边界下,通用大模型更适合被定位为“可复核的草稿引擎与反馈助手”, 而不是“自动做账终局系统”。学生端先上传真实票据,再查看 AI 分录草稿、完成业务复盘、接收评分反馈; 教师端则查看 AI 评分、复核学生复盘、进行讲评并回收教学薄弱点。 这一路径的关键,不是追求一次性替代教师,而是把模型输出还原为可检查的教学证据链: 票据是否支撑分录、量规是否支撑评分、解释是否能被教师复核。
Optimization Path
面向课堂实训的轻量化优化路径
执行摘要
面向课堂真实任务,优化路径不宜走“更大模型、更多参数、完全自动化”的方向, 而应走“够用基座 + 轻量适配 + 检索与规则补强 + 教师复核”的组合路线。 以 Qwen3-8B 作为底座,以 QLoRA + SFT 做领域适配,再叠加课程评分量规、知识库检索、 规则校验与评分解释,能够把大模型从通用回答器收敛为课堂实训助手。 其核心价值不在于制造更炫的自动化,而在于在有限成本下提升输出可控性, 并把票据依据、分录草稿、复盘内容、评分理由和教师讲评连接成一个完整的教学闭环。
轻量化优化框架
从技术路线看,Qwen3 系列包含 8B 密集模型,整体设计目标强调性能、效率与多语言能力, 这使其适合作为课堂级部署与课程语料适配的基础模型。QLoRA 通过量化与 LoRA 结合降低微调资源需求, 再结合 SFT,模型可以围绕课程语境学习更稳定的输出习惯,例如票据描述方式、分录书写格式、 复盘表达结构与评分解释口径。
- 01领域数据集围绕凭证生成、错账诊断、评分反馈整理课程样本。
- 02QLoRA + SFT在 Qwen3-8B 基座上完成低成本领域适配。
- 03量规与检索引入课程评分量规和知识库检索,校验生成依据。
- 04课堂反馈把学生复盘、教师点评与薄弱点讲评纳入闭环。
规则校验与评分解释
仅靠模型权重仍然不够,课堂实训还需要把“知识”和“规则”从模型内部拉回到外部。 知识库检索适合承接课程规则、行业知识与典型案例;规则校验则承担借贷平衡、票据字段一致性、 分录格式完整性等确定性检查。这样的设计能把学生端“上传真实票据—查看 AI 分录草稿—完成业务复盘—查看评分反馈” 与教师端“查看 AI 评分—复核学生复盘—给出讲评并反馈教学薄弱点”串成同一逻辑链。
面向课堂落地的设计价值
这一路径回应的不是抽象的 AI 能力,而是课堂管理者最关心的实施指标。第一,可复核。 评分不再是黑箱结论,而是能够回看票据、量规、规则与解释链条。第二,可解释。 系统输出的不只是“对错”,还应说明为什么建议该分录、为什么扣分、为什么需要复盘。 第三,低成本。轻量基座与 QLoRA 适配降低了领域化落地门槛,使项目更适配校企合作和课程迭代。 第四,教师可介入。课堂真正需要的不是“把教师拿掉”,而是把 AI 嵌入真实票据、真实业务和真实讲评之中, 成为教师可调度、学生可反思的实训基础设施。
Technical References
公开方法如何用于本项目
下列公开方法用于说明本项目中每类技术选择对应的来源:DeepSeek-R1 用于理解推理与蒸馏路线, LoRA/QLoRA 对应低成本适配,RAG 对应课程规则与知识库检索,DPO 和 Self-Instruct 对应后续偏好优化与样本扩展。
Model Report
会计实训模型表现
优化前 88.79% → 优化后 92.32%
优化前 74.6% → 优化后 89.3%
优化前 0.923 → 优化后 0.894,业务指标更贴近课堂评分目标。
优化前 ¥0.12 → 优化后 ≈¥0.02
从课堂实训到教师评阅到持续优化
教师可以在课堂中直接使用本系统完成"发布作业→学生实训→AI 评分→教师复核→课堂讲评"的完整教学链条。 大模型优化不是脱离教学的"黑盒",而是融入每个教学环节的辅助工具。
学生上传票据、查看 AI 分录草稿、完成业务复盘、查看评分反馈,形成"做中学"的完整实训体验。