five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】WebSight - 网页截图转换为HTML代码数据集

五号雷达开源数据市场2024-03-30 10:0483
该数据集可用于训练视觉语言模型,使其能够基于网页截图生成对应的HTML代码,这对于无代码开发和提高UI开发效率具有重要意义。

WebSight是由Hugging Face机构开发的一个网页截图转换为HTML代码的合成数据集。该数据集包含200万对HTML代码及其对应的截图,是开源社区中首次尝试将网页截图转换为可用HTML代码的重要资源。在构建过程中,研究人员首先使用一个小型语言模型来生成多样化的网站主题和设计,然后把这些网站主题和设计输入到一个代码大模型中生成最终的HTML代码,最后采用Playwright工具来可视化并捕获生成的HTML代码的输出。该数据集可用于训练视觉语言模型,使其能够基于网页截图生成对应的HTML代码,这对于无代码开发和提高UI开发效率具有重要意义。

详情请参见五号雷达:https://www.5radar.com/result?key=WebSight

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们