MLP Group 本次发布的数据集 Equivalent Expressions Dataset, 该数据集包含了大约460万的数学等价表达式对,这些表达式对是通过使用SymPy从已知的一系列简单数学表达式中生成的。该数据集包括带有不同运算符的一元表达式,并排除了在解析时产生NaN结果的例子。这些表达式的序列长度平均为16.18,标准差为4.29。数据规模达到4,662,232个输入-输出对,包含2,744,809个独特的表达式。任务是对数学表达式生成向量表示(嵌入)。
查看Equivalent Expressions Dataset
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)