安全场景数据标注实训教程

安全场景数据标注实训教程
作者: 刘辛越,黄继霈,黄平,常奕,潘峰
出版社: 法律
原售价: 66.00
折扣价: 54.72
折扣购买: 安全场景数据标注实训教程
ISBN: 9787519796945

作者简介

刘辛越 教授级高级工程师,密码行业标准化技术委员会委员,国家密码管理局密码应用技术体系研究总体工作组专家,工业和信息化部电信研究院研究生导师,北京创原天地科技有限公司董事长。曾任全国信息安全标准化技术委员会委员和中国通信标准化协会网络与数据安全委员会副主席。 具有20多年信息安全、密码技术、通信和计算机网络方面的工作经验,先后主持制定20多项国家和行业信息安全、密码应用技术标准和规范,主持并完成10多项国家级科技项目,主持开发三大电信运营商CA认证系统和50多项大型互联网信息安全、CA安全认证系统、金融移动支付系统、电信增值业务系统项目。主持研发的多项成果获密码科技进步奖,其中软件实现手机国产密码算法技术获2015年密码科技进步一等奖,并在金融支付领域、电信运营商领域、移动互联网服务领域、电子政务和企业信息化领域得到广泛应用。 黄继霈 在职研究生,历任四川省阿坝藏族羌族自治州马尔康县委常委、副县长,四川省和强集团规划处处长、创鑫公司董事长。获得中国高级职业经理人资格认证,先后荣获汶川县“抗震救灾、灾后重建”先进个人、司法部个人二等功等多项表彰。长期从事安全场景管理工作,具有丰富的实训实操经验,专注于数字代工产业特别是数据标注研究,主持并完成省部级、厅局级课题项目8项,获省局级理论研究一等奖3项。 黄平 1995年毕业于四川省邮电学校,2007年获四川省工商管理学院工商管理硕士学位。现任中国移动通信集团四川有限公司眉山分公司党委书记、总经理。2003年获四川省经济贸易委员会、四川省科学技术厅、四川省知识产权局、四川省科学技术协会“四川省优秀青年技术创新带头人”;2017年获中共甘孜州国资委党委“2016-2017年度国资系统优秀共产党员”;2020年获中华人民共和国应急管理部第五届“全国119消防先进个人”。 常奕 北京三五通联科技发展有限公司董事长,曾在多家上市公司担任高管,先后在中信二十一世纪有限公司、TOM Online (HK)Limited(TOM在线有限公司)、北京鸿联九五信息产业有限公司担任首席运营官。拥有20多年通信、移动互联网、云计算、人工智能和大数据等领域从业经验。 潘峰 计算机科学与技术专业。四川省司法厅“数字法治 智慧司法”联合实验室眉山片区创新实践基地和四川省创鑫公司人工智能物联网应用创新联合实验室主任,信息系统集成项目、通信与广电工程高级工程师,获聘四川省政府采购评审专家、省评标专家、省司法行政信息化专家等。从事安全场景信息化专业工作10余年,拥有丰富的理论和实战经验。曾多次承担司法部、省厅省局科研课题,主导多项科技创新项目研发、应用和产业化。主持并完成的“四川省远程视频会见探访系统”获评2021年中央政法委“智慧司法”十佳案例,申请和获得多项专利和软件著作权,多次参与司法部行业信息化技术标准修订,作为主要作者发表的论文获省级一等奖、二等奖。"

内容简介

书籍目录

安全场景数据标注术语和定义
第一部分 数据标注基础知识篇
第一章 数据标注概述
 1.1 什么是人工智能
 1.2 什么是数据标注
 1.3 数据标注行业状况
  1.3.1 国家政策
  1.3.2 行业需求
  1.3.3 组织业态
 1.4 数据标注企业
 1.5 数据标注应用场景
  1.5.1 出行行业
  1.5.2 金融行业
  1.5.3 医疗行业
  1.5.4 家居行业
  1.5.5 安防行业
  1.5.6 公共服务
  1.5.7 电子商务
 1.6 数据标注流程
 1.7 数据标注人员
 思考题
第二章 数据标注分类
 2.1 图像标注
 2.2 视频标注
 2.3 语音标注
 2.4 文本标注
 思考题
第二部分 安全场景标注产业篇
第三章 安全场景数据标注产业分析
 3.1 产业发展意义
 3.2 前期调研分析
 思考题
第四章 安全场景数据标注产业进程
 4.1 产业发展历程
 4.2 困难与解决措施
 4.3 培训试标与考核
 4.4 创新探索试生产
 4.5 正式规模达产
 思考题
第三部分 安全场景技术平台篇
第五章 安全场景数据标注技术路线
 5.1 系统概述
 5.2 系统架构与功能
 5.3 桌面轮巡管理子系统
 思考题
第六章 安全场景数据标注安全方案
 6.1 安全需求
 6.2 安全设施
 6.3 安全体系
  6.3.1 物理和环境层面
  6.3.2 网络和通信层面
  6.3.3 设备和计算层面
  6.3.4 应用和数据层面
 6.4 安全措施
  6.4.1 物理和环境安全
  6.4.2 网络和通信安全
  6.4.3 设备和计算安全
  6.4.4 应用和数据安全
  6.4.5 安全制度关键点
  6.4.6 密钥管理规定
 思考题
第七章 安全场景数据标注部署保障
 7.1 部署实施
  7.1.1 实施路线图
  7.1.2 进度计划
 7.2 保障措施
  7.2.1 组织保障
  7.2.2 人员保障
  7.2.3 经费保障
  7.2.4 质量保障
 思考题
第四部分 安全场景业务实战篇
第八章 安全场景数据标注组织构建
 8.1 组织架构
 8.2 岗位职责
 8.3 岗位等级要求
 8.4 团队沟通
 8.5 标注人员筛选
 8.6 标注人员培训
 思考题
第九章 安全场景数据标注业务流程
 9.1 任务流程
  9.1.1 标注任务创建
  9.1.2 标注任务分发
  9.1.3 标注任务开展
  9.1.4 标注任务回收
 9.2 质量管理
  9.2.1 内部质检要求
  9.2.2 质量控制流程
  9.2.3 质量监控措施
  9.2.4 质量等级分类
  9.2.5 质量检验方法
 9.3 进度管理
  9.3.1 数据标注秒时测定
  9.3.2 标注任务进度预估
  9.3.3 标注任务风险提醒
  9.3.4 制订标注进度计划
  9.3.5 标注任务进度管理
 思考题
第十章 安全场景数据标注生产管理
 10.1 生产流程
  10.1.1 线上标注生产流程
  10.1.2 线下标注生产流程
  10.1.3 任务对账结算流程
 10.2 新类别标注任务启动
  10.2.1 新类别标注任务引入
  10.2.2 试标考核认证
  10.2.3 标注服务合同
  10.2.4 技术规范示例
 10.3 任务生产管理
  10.3.1 爬坡达产计划
  10.3.2 周生产计划
  10.3.3 生产沟通协调
 10.4 工单管理
  10.4.1 试标通知单
  10.4.2 培训申请单
  10.4.3 项目启动单
  10.4.4 任务通知单
  10.4.5 生产监督单
  10.4.6 出工通知单
  10.4.7 故障反馈单
 10.5 生产情况分析
  10.5.1 日生产分析
  10.5.2 周生产分析
  10.5.3 月生产分析
 思考题
第十一章 安全场景数据标注运营经验
 11.1 经验总结
  11.1.1 管理人员总结
  11.1.2 研发人员总结
  11.1.3 业务人员总结
  11.1.4 标注人员总结
 11.2 生产指标
 11.3 标杆产值
 11.4 技能大赛
 11.5 标注技巧
 思考题
第五部分 安全场景标注实训篇
第十二章 安全场景数据标注实训案例
 12.1 线上视频审核标注实训
 12.2 线上手势21点骨骼标注实训
 12.3 线上2.5D标注实训
  12.3.1 标注员实训
  12.3.2 质检员实训
  12.3.3 2.5D标注要点
  12.3.4 标注技巧和标注效率提升策略
 12.4 线上3D点云标注实训
 12.5 线上4D车道线标注实训
 12.6 线下2D标注实训
 12.7 任务通知工单操作实训
 思考题
参考文献

试读内容

  前  言
  习近平总书记强调:“人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。”人工智能已成为国家战略的重要组成部分,也是未来国际竞争的焦点和经济发展的新引擎。
  人工智能的三大决定性因素,就是算法、算力和数据(指通过不同途径采集来的原始数据,经过加工即数据标注后,得到的符合要求的数据),目前,从国家层面来看,需要靠数据标注破局。
  《关于发布智能制造工程技术人员等职业信息的通知》(人社厅发〔2020〕17号)明确将人工智能训练师纳入新增职业,其工种包括但不限于数据标注员和人工智能算法测试员。人工智能训练师从概念发展为新职业,短短数年,从业人员发展到数十万,特别是以ChatGPT为代表的人工智能已进入产业级大模型时代,据工业和信息化部测算,至2025年我国人工智能人才缺口将突破1000万。人工智能作为一门实战性很强的学科,在其呈现金字塔形的人才资源模型中,科学家居塔尖位置,然而对其需求相对有限,反而是对数据标注相关人才的需求急剧上升,可以说后者占据了人工智能人才需求的90%以上。人工智能行业巨头纷纷寻找专业的数据标注人员,但目前接受过系统培训的数据标注人员少之又少,可谓供不应求,其作为近年来新兴发展的职业之一,正以茁壮的势头蓬勃发展。
  一方面,从数据标注行业及数据需求方的角度来看,有数据方面的安全需求,如一些保密数据、内部数据等,有的数据甚至要求不可篡改、可追溯等;另一方面,从特定行业及数据标注方的角度来看,有管理方面的安全需求,特别是对标注人员操作管理。
  因此,发展安全场景数据标注产业大有市场,并且是多方共赢的格局。
  对数据需求方、标注管理方而言,安全场景数据标注有三个方面的优势:一是保障了数据安全;二是数据不可篡改、可追溯,有利于对数据在标注全过程管理;三是知识产权得到了有效保护。
  对数据标注方特别是安全行业数据标注方而言,安全场景数据标注有五个方面的优势:一是有助于传统产业转型升级,特别是数据标注属于新兴产业,契合国家数字经济发展战略,可创建具有标识度的示范基地,树行业标杆;二是有利于管理人员现场管理,生产现场没有传统产业如服装加工的剪、刀、针等锐器,安全风险小,并能对标注人员的生产工具(电脑)实施桌面轮巡管理;三是“授之以鱼不如授之以渔”,不仅培训标注技能,而且教育培养人才,颁发技能证书,有利于就业、择业,实践后社会反响好,政治效应高;四是能实现较高产值,辅工少(如服装工艺有裁片、分片、后整等)、可返修(如服装物料一旦做坏易报废,造成损失和纠纷)、无物流;五是有伴生的信息化管理系统,生产数据实时统计分析一目了然,生产管理效率高。
  安全场景发展数据标注产业是推进产业数字化转型、践行《“十四五”数字经济发展规划》的重要举措,是实现高质量发展的最佳选择。
  长期以来,高性能智能芯片、高智能应用都是人工智能前台的闪耀明星,而高质量标注数据则是默默无闻的幕后英雄。而且,由于数据标注行业尚处于起步阶段,行业内至今缺少相应的系统性人才培养体系,导致标注人员水平参差不齐,严重制约了行业发展。社会对人工智能产业的数据环节关注太少,对优秀人才从业的吸引力也较弱,高质量教程特别是侧重实训的教程少之又少,安全场景更是空白,本教程恰恰是众多“少”中的典型代表。
  本教程的编写团队成员不仅有国内第一代互联网人、国家重大专项课题组组长、国务院特殊津贴专家、教授、博士等,而且均来自全面、权威的实战经验性单位,包括网络领域的通信运营商中国移动通讯集团四川有限公司眉山分公司、数据安全领域的北京创原天地科技有限公司、主营云支撑和安全场景数据标注生产运营系统及相关业务的北京三五通联科技发展有限公司、特定行业实战示范单位的四川省创鑫服装有限责任公司。本教程经过大量的市场考察与调研,深入了解数据标注行业,对数据标注各个环节进行调查整理,特别是参照2023年12月1日实施的国标——《人工智能 面向机器学习的数据标注规程》(GB/T 42755—2023),结合安全场景量身定制。自身依托“数字法制 智慧司法”联合实验室联合创新实践基地进行自主科技创新及其产业孵化,从“零”起步,独创的网络安全(运营商保障) 数据安全(国产密码算法,USBKey,达到行业高安全等级) 前台(数据标注方)通过中台(标注管理方)定制研发的安全场景数据标注生产运营系统再到后台(数据需求方)的“端到端”解决方案,填补了该领域国内乃至国际的空白点。本教程通过安全场景数据标注业务实训,总结经验和教训,成功实现了从科研到产业化跨越,做到了“技术牵引业务,业务驱动技术,两者良性互动”,具有很强的示范性。
  本教程首先从数据标注的基本概念开始,介绍数据标注的“前世今生”以及发展趋势,然后按新国标系统地梳理了数据标注分类及数据标注流程;其次对安全场景数据标注产业分析、产业历程、技术路线、安全方案、部署保障以及组织构建、业务流程、生产管理、工单管理、运营经验进行详细介绍;最后对重点热门标注项目进行标注实训。本教程独特之处在于,按照《人工智能 面向机器学习的数据标注规程》(GB/T 42755—2023)围绕数据标注产业相关方(包括数据需求方、标注管理方、数据标注方),结合安全场景量身定制,侧重阐述如何保障网络安全、数据安全及安全管理与建章立制,如何组织科研和工艺攻关,如何组织标注生产及有效安排标注人员,如何加强日常管理提升生产效率,包括日、周、月生产分析,培训和爬坡达产计划,周生产计划,工单管理以及标注相关方管理人员、技术人员、业务人员、标注人员经验总结等。
  本教程具有以下特色:一是理论与实践并重。以安全场景数据标注行业实践为导向,在理论与方法的阐释上均辅以案例。二是广度与深度融合。不局限于单一业务、单一技术,针对数据标注可能涉及的环节,结合安全场景实际尽可能地进行深入挖掘,以满足不同层次的需求。不仅适用于安全场景从业人员,而且适用于自建数据标注团队或公司的创业者。三是专业性与通俗性平衡。尽可能以通俗易懂的语言对数据标注人员应该具备的知识与技能进行讲解。
  本教程是集体智慧的结晶,感谢创鑫公司的雷浩、岳凉峰、张雨廷、罗勇、曾本金、高泽春、常传峰、杨大伟参与本教程编写,凌建华、方亮、周焱、彭峰、张渊、马静对本教程的贡献,邹永贵对本教程给予的指导。
  感谢眉山移动公司的陈晓娇、李自勇、伯晶参与本教程编写,蒋金洲、徐丰、王凯对本教程的贡献,刘肸对本教程给予的指导。
  感谢创原天地公司的周瑜、刘旭江、刘佳伟参与本教程编写,徐永辉、苏鹏、杜伟伟、康世明对本教程的贡献,肖青海博士给予的指导。
  感谢三五通联公司的黄剑涛、郑威、王洪涛、高扬参与本教程编写,高迅、武志军对本教程的贡献,王锋、易恢学对本教程给予的指导。
  衷心感谢叶兵为本教程作出的重大贡献,他提出和确定总体方案设计,并解决了安全场景数据标注实训开发、应用过程中的主要技术难关。
  还要感谢姚丰,爱奇艺的龚宇、陈赫,宋柯,戴和忠,王立新,郭晓岩,何丹,刘爱华,李佳,柯贤良,郑树勋,周海洋,宋涛,廖军,白云凯,李勇。特别感谢数据堂的何鸿凌、胡晓敏、姜平,龙猫数据的昝智,常双安,海天瑞声的吕思遥、郭泽奇、王克威,以及段兴国、覃海明、张卓瑞、刘镇涛、张港等。
  感谢一直关心和支持本教程编写的人士!特别感谢世杰、任芳已、杨亮纯、杨扩扩、裴红娜!
  随着人工智能技术的不断发展,安全场景数据标注的职业要求也在不断更新,本教程的内容选材还需要根据行业变化与反馈修改完善。希望本教程作为安全场景数据标注培训的精品教材,能为社会输送大批高水平的“合格”人工智能训练师人才。由于编者们水平有限,疏漏之处在所难免,欢迎读者提出宝贵意见。如有建议,请发送至邮箱victoryecw@hotmail.com。
  编写组
  2024年10月8日