南昌大学公共政策与管理学院
您现在所在的位置: 首页 > 本科生教育

智能数据工程与标注技术 微专业介绍


学制1

专业简介培养具有良好的道德与修养,遵守法律法规熟练运用LabelImgCVAT等标注工具及PythonPandas等技术工具,掌握图像、视频、文本等多类型数据的采集、清洗、标注等实际操作技能,能参与大模型训练数据构建、标注质量管控及智能系统运维适配数据标注工程师、AI训练师等岗位需求具有就业竞争力的高素质专门技术人才。无前置基础知识要求,适用于所有对智能数据工程与标注技术感兴趣的在校本学生。

课程简介:

1、《大数据与人工智能导论》(开课时间:2025年秋季学期,每周六早上9点到12点;上课地点:前湖北院)

本课程为面向“智能数据工程与标注技术”微专业的导论课,旨在帮助学生系统掌握大数据与人工智能的基本概念、核心技术、典型应用及伦理问题。通过32学时的课堂讲授与案例分析,学生能够:1.描述大数据的5V特征、技术栈与典型应用场景;2.解释人工智能的基本定义、发展脉络与主要分支;3.概述机器学习、深度学习、自然语言处理、计算机视觉的核心思想与代表性算法;4.分析大数据与人工智能融合的行业案例(如智慧城市、智能医疗、推荐系统);5.识别并讨论数据伦理与AI治理中的关键问题(隐私、偏见、可解释性、法律监管);6.建立进一步学习或从事交叉学科研究所需的知识框架。

2、《机器学习及Python应用》(开课时间:2025年秋季学期,每周日上午9点到12点上课地点:前湖北院)

课程旨在帮助学习者掌握利用Python语言实现机器学习算法解决实际问题的能力,课程内容涵盖机器学习的基本问题(分类、聚类、回归、降维)及经典算法介绍,深入讲解机器学习三要素(模型、学习准则和优化算法)和模型解释方法,重点包括人工神经网络、支持向量机、惩罚回归等核心知识点。本课程帮助学习者提升应用机器学习方法和工具进行研究的能力,包括提出研究问题、设计研究、收集数据、分析数据以及解释和呈现结果,通过实际案例和项目实践提升学习者的专业研究开发与创新能力。

3、《数据库原理与应用》(开课时间:2025年秋季学期,每周六下午2点到5点上课地点:前湖北院)

本课程是智能数据工程与标注技术专业的一门核心专业课程。该课程系统阐述数据库系统的基本概念、基本原理、关系模型、结构化查询语言(SQL)、数据库设计与规范化理论、事务管理与并发控制等核心知识与技术方法。本课程注重理论与实践相结合,通过系统的理论学习和相关的实验,旨在培养学生能较好地掌握数据库的基础知识、关系数据库的基本理论、数据库系统的分析设计方法,使学生掌握扎实的数据管理技术及具备分析问题、解决问题的能力。并特别关注数据库技术在数据标注、数据处理与管理等场景中的应用,为学生未来从事智能数据系统开发、数据平台运维和数据治理等工作奠定坚实的基础。

4、《数据质量控制与评估》(开课时间:2026年春季学期,每周六早上9点到12点上课地点:前湖北院)

课程内容涵盖数据质量的核心维度、控制方法学与评估指标体系,深入讲解从数据采集、处理、存储到应用各环节的质量保障技术,重点包括数据质量规则定义、异常检测算法、监控体系构建以及数据可靠性度量等核心主题。课程将系统讲解基于统计过程控制和机器学习技术的质量控制方法,以及数据新鲜度、完整性、一致性、准确性等维度的评估技术。课程采用案例驱动教学模式,通过金融、电商、物联网等领域的典型数据质量场景,帮助学习者掌握设计数据质量规则库、实施质量评估框架、编制质量评估报告的完整方法论。旨在培养学习者具备构建数据质量防控体系、执行系统性数据质量评估的专业能力,通过严谨的质量控制技术和科学的评估方法提升数据产品的可信度与价值密度。

5、《数据标注工程》(开课时间:2026年春季学期,每周六下午2点到5点上课地点:前湖北院)

本课程是人工智能领域一门至关重要的基础性与实践性课程。课程系统性地介绍数据标注的全流程,旨在培养学生成为具备扎实理论知识和熟练实操技能的数据标注专家。课程内容涵盖数据标注的核心概念、主流标注工具与方法、质量管理体系、团队项目管理以及前沿行业应用。课程将引导学生深入理解各类数据(如图像、文本、语音、视频)的标注规范与技巧,掌握数据清洗、标注、质检与验收的全套方法论。学生将通过大量实践项目,亲身体验从需求分析到最终交付的完整数据pipeline,培养严谨的工程思维和卓越的团队协作能力。本课程为学生未来从事人工智能、机器学习、计算机视觉、自然语言处理等领域的研究或职业发展奠定坚实的数据基础。无论是希望成为算法工程师、数据科学家,还是专注于数据策略与管理的专业人才,精通数据标注工程都是其不可或缺的核心竞争力。

6、《数据标注应用》(开课时间:2026年春季学期,每周日早上9点到12点;上课地点:前湖北院)

本课程是一门聚焦人工智能数据基石的前沿应用型课程,以“群智化”这一核心范式系统讲授数据标注的技术与实践。课程将深入探讨数据标注从专家模式向大规模、职业化众包与标注工厂模式的演进,涵盖文本、音频、图像、视频四类模态的标注关键技术。课程采用“理论奠基+平台实战+场景驱动”的一体化教学模式,学生将通过在百度众测、Amazon MTurk等主流群智化平台上完成自动驾驶场景下的2D/3D融合标注、智能客服多轮对话语音标注等真实工业项目,掌握数据标注项目的全流程管理、质量控制与标准化交付。同时,课程将引导学生围绕数据隐私、标注员权益与算法公平性等议题进行伦理思辨,撰写合规性评估报告。通过本课程的学习,学生将具备独立架构群智化标注任务、设计质量保障体系及跨角色协同管理的能力,树立“质量第一、隐私敬畏、科技向善”的职业伦理观,为未来从事人工智能数据工程、模型研发与治理奠定坚实的实践与伦理基础。


出品/公道传媒全媒体运营中心

供稿/刘春年

值班编辑/陈毅 曾雅宣 郑芷轩

责编/季亚萍

终审/周德忠



                        版权所有:南昌大学公共政策与管理学院    
地址:江西省南昌市红谷滩区学府大道999号)   邮编:330031   电话/传真: