复旦大学 本次发布的数据集 FANNS 数据集, 本文介绍了一个名为FANNS的数据集,该数据集由复旦大学的研究人员创建,旨在为Filtered Approximate Nearest Neighbor Search (FANNS)算法提供一个统一的基准和系统性的实验研究。数据集包含6个不同规模和特性的真实世界数据集,用于评估FANNS算法的性能。这些数据集在维度、数据量和Tokens数上有所不同,来自不同的领域,如文本、图像和视频。数据集的创建过程涉及了参数调整、标准化过滤和索引构建等步骤。FANNS数据集的应用领域包括推荐系统、搜索引擎和AI系统等,旨在解决大规模、多模态非结构化数据的检索和处理问题。
README 内容:
关于 复旦大学 , 复旦大学是中国的一所综合性研究型大学,以其在多个学科领域的卓越表现和研究成果享誉全球。_simple
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)