Trelis本次发布的数据集latent-space-train,这是一个名为latent-space-train的语音数据集,由Trelis Studio准备。数据集包含音频片段(16kHz)及其转录文本,以及开始时间、结束时间、单词级时间戳和原始音频文件名等信息。数据集共有9个训练样本,总时长为3.4分钟。
Dataset card内容:
Files and versions内容:
关于Trelis,Trelis Research 提供高级大型语言模型微调脚本、推理指南、API模板以及视觉和语音转录微调服务。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)