本次发布的数据集myanmar_idioms_lexicon,**缅甸习语词典**是一个高质量、语言学丰富的传统缅甸习语(**ဆိုရိုးစကား**)集合。虽然谚语(စကားပုံ)通常作为隐喻的道德寓言,但缅甸习语(ဆိုရိုးစကား)是描述社会规范、生物观察和历史智慧的传统说法。该数据集为NLP研究人员、语言学习者和文化历史学家提供了全面的资源,为那些难以通过字面翻译理解的表达提供了深层背景。 ### 主要特点 * **双注册缅甸语:** 每个习语都包括**书面(文学)**和**口语(口语化)**的解释,以弥合缅甸语双言现象的差距。 * **上下文叙述:** 每个条目都有一个5-10段的英文和缅甸语说明性故事,展示习语在现实生活中的应用。 * **词汇分解:** 详细的逐字分析,包括词性(POS)和英文注释。 * **语义元数据:** 标签包括语气、语域和文化主题(如因果报应、自然、社会行为)。 ## 数据集统计(版本1) * **总条目数:** 208个习语(V1) * **平均复杂度:** 每个条目约1800+字符。 * **目标增长:** 该数据集设计为迭代更新(V2、V3等),随着更多传统说法的数字化和丰富。
Dataset card内容:
Files and versions内容:
关于,国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)