پایگاه دادهی SUT
پایگاه دادهی چندمنظورهی پردازش هوشمند سند.

SUT یک پایگاه دادهی مصنوعی و چندمنظوره برای تحلیل تصاویر اسناد فارسی است. این مجموعه شامل ۶۲٬۴۵۳ تصویر در ۲۱ کلاس مختلف است و برای سه وظیفهی اصلی طراحی شده است: دستهبندی تصاویر اسناد، تشخیص و بازشناسی متن، و بازیابی اطلاعات. تصاویر، اسناد هویتیِ شبیهسازیشدهای هستند که اطلاعات شخصیِ مصنوعی روی پسزمینههای گوناگون قرار گرفتهاند. برچسبها در قالب فایلهای CSV شامل مسیر تصویر و اطلاعات نهفته در هر سند ارائه میشوند. دسترسی به دیتاست از طریق تکمیل فرم درخواست و تماس با تیم پژوهشی امکانپذیر است.
SUT: a new multi-purpose synthetic dataset for Farsi document image analysis
E. Shabaninia, F. S. Eslami, A. Afkari-Fahandari, H. Nezamabadi-pour
13th Int. Conf. on Computer and Knowledge Engineering (ICCKE 2023), Mashhad, Iran, pp. 253–258 · 2023
به این دادهها علاقه دارید؟
برای همکاری پژوهشی یا دسترسی به جزئیات بیشتر با تیم به نثر تماس بگیرید.
تماس با ما