佐治亚理工学院 本次发布的数据集 Congress Committee Hearing Dataset (CoCoHD), Congress Committee Hearing Dataset (CoCoHD) 是由佐治亚理工学院创建的一个全面的数据集,涵盖了从1997年到2024年美国国会86个委员会的32,697次听证会记录。该数据集包含32,435份听证会记录及其元数据,旨在帮助研究人员分析政策语言,特别是在医疗保健、LGBTQ+权利和气候正义等关键问题上。数据集的创建过程包括从GovInfo网站抓取听证会细节和记录,设计易于使用的数据结构,并过滤错误记录。CoCoHD的应用领域广泛,包括能源政策、气候变化、移民、种族正义和LGBTQ权利等,旨在通过自然语言处理技术提高对国会听证会的理解和透明度。
查看Congress Committee Hearing Dataset (CoCoHD)
README 内容:
关于 佐治亚理工学院 , 佐治亚理工学院是一所位于美国佐治亚州亚特兰大的顶尖公立研究型大学,以工程、计算机科学、商学和建筑学等领域的教育与研究闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)