中文在线集团股份有限公司本次登记的数据知识产权出版物有声书(小说有声书)数据集,数据规模与规格 总时长20 万小时,以有声书、有声小说为主,音频 + 文本逐段对齐,格式规范统一。 文本对齐规则 文本与音频内容高度一致、无错漏、无乱码,支持句级别 / 段级别对齐,适配序列建模。 清洗与质控规则 经过去噪、去静音、去重、去低质录音、去违规内容处理,音频清晰、文本准确。 算法适配 天然支持自监督语音预训练、ASR 端到端训练、TTS 建模、语音–文本跨模态对齐、对比学习等主流训练框架与算法。
关于中文在线集团股份有限公司,中文在线集团股份有限公司是一家多元化经营的企业,主要从事技术服务与开发、文化艺术交流活动的组织、数字文化创意软件开发等。公司也涉及网络出版物、电子出版物、广播电视节目制作和电影制片等多个领域。在数据方面,虽然具体数据集信息未提供,但可以预见其数据集可能涵盖文化艺术、数字创意内容以及出版物等多个领域,数据类型丰富,为相关业务提供数据支持。公司经营广泛,不仅在技术开发和服务上有所建树,还在文化艺术和影视制作方面有所涉猎。
关于贵州省数据知识产权登记平台,广州市数据知识产权登记平台公告列表页面





_1769672084863.jpg)