AI Center FEE CTU 本次发布的数据集 ask_library_cs, Ask the Library数据集包含从网页https://www.ptejteseknihovny.cz/抓取的问题和答案。问题涵盖了广泛的主题,如历史、语言、生物等。数据集由AIC FEE CTU策划,主要语言为捷克语,使用CC-BY-NC 3.0许可证。数据集可用于指令调优、问答和其他NLP任务。数据集包含一个训练集,包含以下字段:标题、问题、答案、图书馆所在地的Okres(NUTS4)、图书馆名称、问题类别、使用的来源、提问日期、问题URL、行ID和检测到的语言。数据集的创建动机是缺乏可用的捷克语指令调优数据集。数据来源是捷克图书馆的员工和用户。
Dataset card 内容:
Files and versions 内容:
关于 AI Center FEE CTU , AI Center FEE CTU是捷克技术大学电气工程系下属的人工智能研究中心,致力于人工智能领域的研究与教学,推动相关技术的创新与应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。




_1769672084863.jpg)