five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 数据产品上架 / 正文

大模型语料已成功在福建大数据交易所进行上架,应用在多模态数据、模型训练领域

五号数据雷达数据产品上架2025-01-08 00:4016
大模型语料 是 北京智汇启明科技有限公司 上架的数据产品,于 2025-01-07 首发在 福建大数据交易所

北京智汇启明科技有限公司 本次上架的数据产品 大模型语料, 用于训练大规模的文本、图片、视频等数据集合。(1)通用文本数据集:微信公众号、百度百科、知乎、CSDN等网页常见的文本数据。 (2)音频文本对数据集:普通话数据成品库(训练语音识别模型)。 (3)OCR数据集:数据涵盖中文手写、中文文档、中文试卷、盖章图片、中文表格、图表图片、中英文证照/票据类图片等

查看大模型语料

上架内容: 

 

关于 北京智汇启明科技有限公司 , 北京智汇启明科技有限公司是一家专注于数据智能和人工智能技术研发的公司,致力于为企业提供数据分析和智能化解决方案。其业务涵盖大数据处理、机器学习模型开发以及智能决策支持系统等领域。

关于 福建大数据交易所 , 福建省大数据交易所是一个大数据资源交易的平台,提供数据交易服务、数据资产管理以及数据产业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们