IDPL-PFOD۱ — متن چاپی فارسی
پایگاه دادهی تصاویر متن چاپی فارسی برای پژوهشهای تشخیص نویسه (OCR).

IDPL-PFOD۱ یک پایگاه دادهی بزرگ از تصاویر متن چاپی فارسی است که بهصورت مصنوعی تولید شده و برای آموزش و ارزیابی مدلهای تشخیص نویسه (OCR) فارسی طراحی شده است. این مجموعه شامل ۳۰٬۱۳۸ تصویر خط متن (با ابعاد ۷۰۰×۵۰ پیکسل و قالب TIF) و در مجموع ۴۵۲٬۰۷۰ واژه است. تصاویر با ۱۱ فونت فارسی، ۲ سبک، ۷ اندازه و ۱۲ الگوی بافت تولید شدهاند. از نظر پسزمینه: حدود ۵۰٪ زمینهی سفید ساده، ۴۰٪ زمینهی نویزی و ۱۰٪ زمینهی بافتدار هستند؛ همچنین حدود ۱۰٪ تصاویر دارای اعوجاجهایی مانند کجی، موج سینوسی و تاریاند تا به شرایط واقعیِ اسناد نزدیکتر باشند. برچسبها در یک فایل CSV (هر سطر متناظر یک تصویر) نگهداری میشوند.
IDPL-PFOD: An Image Dataset of Printed Farsi Text for OCR Research
F. S. Hosseini, S. Kashef, E. Shabaninia, H. Nezamabadi-pour
NSURL 2021 (co-located with ICNLSP 2021), Trento, Italy · 2021
به این دادهها علاقه دارید؟
برای همکاری پژوهشی یا دسترسی به جزئیات بیشتر با تیم به نثر تماس بگیرید.
تماس با ما