杭州电信:创新成果成功入选国家数据局“数据标注优秀案例”
杭州电信:创新成果成功入选国家数据局“数据标注优秀案例”
近日,中国电信杭州分公司数改先锋创新工作室成功打造“视觉大模型自动标注一站式生产运营”创新案例,针对视觉领域数据质量低、人工标注效率低等痛点问题,创新性地引入 CV 预标注技术和多模态模型,实现了从数据预处理到模型上架的一站式生产与运营,成功入选国家数据局《数据标注优秀案例集》。
视谷落地:构建非结构化数据全周期管理运营体系
案例在“中国视谷”实际落地应用,建设“视觉可信数据空间”,打造集“非结构化数据汇聚、模型训练、产品加工、数据产品发布、数据资产评估、数据安全认证”等视觉数据一站式运营服务模式,支持灵活对接政府、企业、科研机构等不同主体,满足多样化的数据应用需求。
“中国视谷”是视觉产业发展规划重点部署园区,也是杭州市数据要素“一区一业一园区”的落地实例。杭州电信主导“中国视谷·视觉可信数据空间”的运营,坐落于杭州市中国视谷产业园,视觉行业龙头企业及产业生态聚集,有着活跃的供需市场氛围。
二开助战:星河底座与自研能力协同突破
在非结构化数据全周期管理运营体系中,案例创新引入集团AI公司“星河平台”的CV预标注技术和多模态模型,实现从数据预处理到模型训练的全流程自动化(如从视频流拉流抽帧、图片自动标注、人工辅助标注、模型训练优化全流程),有效提升效率、降低人工投入成本。常规需要万级数据样本训练的模型,基于大模型万物识别能力及自动标注,仅需500个有效样本即可达到95%以上准确率,若具备5000个有效样本,准确率可达98%以上。传统需10人用时一周完成的万级数据集标注任务,现单人仅需2-5小时,效率提升90%以上。这种“底座复用+场景创新”模式,形成可了一种可复制的科技创新路径。
先锋引领:以创新工作室为载体的成果探索
本次入选是杭州电信系统集成部解决方案中心“数改先锋创新工作室”的一个重大突破。
自2021年工作室成立以来,团队成员始终坚持冲在浙江省政府数字化改革及各行业数字化转型的第一线,紧紧把握科技前沿与应用创新方向,围绕着大模型、数据要素等技术领域进行科技创新探索,服务于数据局等各类政企客户,落地项目金额达数亿元。
2024年,工作室还主导研究了“数据要素流通可信互联互通平台”、“基于NLP大模型的金融行业合同风险智能防控系统”等若干科创项目,助力打造“中国·视谷”“中国·数谷”“中国·飞谷”等数据要素产业园区,为杭州市率先探索打造“全球数据要素治理引领区、应用场景示范区和数据要素产业集聚区”贡献一份力量。
未来,数改先锋创新工作室将在省市政府及公司的指导帮助下,携手各行业单位客户及产业链合作伙伴,加速科技创新,加强生态合作,力争成为科技智囊团、岗位创新源、项目攻坚队、人才孵化器和团队的方向标,铸造数字化改革的先锋战旗!
推荐文章
杭州电信:创新成果成功入选国家数据局“数据标注优秀案例”近日,中国电信杭州分公司数改先锋创
台州电信:助力三门核电智慧网络建设三门核电站坐落于台州三门湾,作为中国及全球核电行业首家“