InternLM本次发布的数据集EndoCoT-Data,EndoCoT数据集是一个用于扩散模型中内生链式思维推理的专用数据集,基于Qwen-Image-Edit-2511基础模型开发。该数据集旨在支持逐步推理能力训练,在图像编辑任务中提供透明的中间推理轨迹。数据集包含训练所需的元数据文件(metadata.csv)和相关素材,使用时需保持文件与元数据的相对路径一致。数据集语言为英语,采用MIT许可协议,可通过HuggingFace平台获取(internlm/EndoCoT-Data)。实验表明,使用该数据集训练的模型在Qwen-Image-Edit任务上优于传统训练方法。
关于InternLM,InternLM 是由上海人工智能实验室主要开发,专注于开源高质量大型语言模型及全栈开发应用工具链的组织。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的开发与分享。它提供了丰富的资源,包括超过100万个模型、25万个数据集和40万个应用程序,支持文本、图像、视频、音频和3D等多种模态。此外,平台还提供企业级解决方案和开源工具,如Transformers、Diffusers等,以加速机器学习的研究和应用。





_1769672084863.jpg)