🧩 چندمنظورهSUT Dataset

پایگاه داده‌ی SUT

پایگاه داده‌ی چندمنظوره‌ی پردازش هوشمند سند.

پژوهشگر:اسلامی

درباره‌ی این پایگاه داده

SUT یک پایگاه داده‌ی مصنوعی و چندمنظوره برای تحلیل تصاویر اسناد فارسی است. این مجموعه شامل ۶۲٬۴۵۳ تصویر در ۲۱ کلاس مختلف است و برای سه وظیفه‌ی اصلی طراحی شده است: دسته‌بندی تصاویر اسناد، تشخیص و بازشناسی متن، و بازیابی اطلاعات. تصاویر، اسناد هویتیِ شبیه‌سازی‌شده‌ای هستند که اطلاعات شخصیِ مصنوعی روی پس‌زمینه‌های گوناگون قرار گرفته‌اند. برچسب‌ها در قالب فایل‌های CSV شامل مسیر تصویر و اطلاعات نهفته در هر سند ارائه می‌شوند. دسترسی به دیتاست از طریق تکمیل فرم درخواست و تماس با تیم پژوهشی امکان‌پذیر است.

مقالات مرجع