گزیر

::گاهنوشتهای حمیدرضا محمدی::



دربارهٔ من:

آخرین نظردهندگان:

مشترک شوید:

ایمیل خود را در جعبهٔ زیر وارد کنید و دکمهٔ اشتراک را بزنید.

جستجو:

Valid XHTML 1.0 Transitional RSS Feed

لطفاً چند دقیقه از وقت آنلاینتان را به من هدیه بدهید!

۸۹/۰۳/۱۷

۱- به این نشانی بروید.

بازبینی خروجیهای OCR گنجور

۲- بالای صفحه یک عکس بریده شدهٔ متنی می‌بینید. در کادر پایین آن یک یا چند دکمهٔ سفیدرنگ می‌بینید که حاوی متنهایی مشابه تصویر بالای صفحه هستند. اگر یکی از آنها متنش کاملاً شبیه متن تصویر است روی آن کلیک کنید، اگر نه در کادر متنی «خیر؟ تصویر درست را وارد کنید» متن درست را تایپ کنید و Enter بزنید.

۳- با هر بار کلیک بر روی یکی از دکمه‌های مرحلهٔ ۲ به صفحهٔ مشابهی هدایت می‌شوید و این کار را می‌توانید تا هر وقت که دوست داشتید ادامه دهید!

۴- بعضی از عکسها ممکن است ناخوانا باشند (بد اسکن شده‌اند)، در این موارد روی دکمهٔ «تصویر ناخواناست» کلیک کنید. بعضیها هم ممکن است حاوی هیچ متن قابل بازخوانیی نباشند (حروف تکه تکه و …)، در این موارد روی دکمهٔ «تصویر بد بریده شده» کلیک کنید.

با صرف چند دقیقه از وقت آنلاینتان به این صورت -ضمن لطفی که دارید به من می‌کنید 😉 – به گسترش دامنهٔ داده‌های بزرگترین سایت شعر فارسی دارید کمک می‌کنید. دوست دارید در این مورد بیشتر بدانید؟ اینجا را ببینید.






۱۸ نظر

عرفان:

تاریخ: ۸۹/۰۳/۱۸ ساعت: ۱۴:۴۰

ایده بسیار عالی
من که هرروز چند دقیقه را به این کار اختصاص خواهم داد.

سروش:

تاریخ: ۸۹/۰۳/۱۹ ساعت: ۸:۴۵

وقتمان را به شما دادیم
خیلی هم خوب بود

فرشاد:

تاریخ: ۸۹/۰۳/۱۹ ساعت: ۲۰:۵۵

با تشکر کمی از قبل و بعد از متن بریده شده را هم به صورت کمرنگ نمایش دهید تا اگر جالب بود بتوانیم کمی هم از آن مطلب بهره مند شویم

ITLine:

تاریخ: ۸۹/۰۳/۱۹ ساعت: ۲۱:۱۸

عالی، باید بگم خوب عمل میکنه و فقط بعضی وقت ها مشکل از فاصله بین کلماته

سیا:

تاریخ: ۸۹/۰۳/۱۹ ساعت: ۲۱:۲۳

۱٫ ممنون برای کاری که می کنید و زحمتی که می کشید
۲٫ تبریک واسه نوشتن همچین او سی آر ی؛ درصد خطاش خیلی پایینه.
۳٫ کاش راجه به فاصله (و نیم فاصله) هم چیزی می نوشتید؛ چون مثلا” من نمی دونم وقتی دو واژه (به دلایل قابل فهم، مثلا” نستعلیق نوشتن و جا کم داشتن و الخ) به هم چسبیده اند، ولی باید با فاصله از هم باشند، من باید گزینه اول رو کلیک کنم، یا تو گزینه دوم فاصله بگذارم و روی “ذخیره” کلیک کنم.
اگر این مورد معلوم بشه، احتمالا” تصحیح دستی نهایی وقت بسیار کمتری خواهد گرفت.
۴٫ بازم مرسی برای کاری که می کنید.

حمیدرضا:

تاریخ: ۸۹/۰۳/۲۰ ساعت: ۱۸:۵۳

ممنون از لطف دوستان

در مورد فاصله‌ها، بله می‌دونم در مورد فاصله مشکل داریم اما خوب، فعلاً این مورد رو واگذار کردم به دوستانی که بازبینی می‌کنن تا طبق سلیقۀ خودشون تصمیم بگیرن، خروجیهای سری اول که نهایی شد با توجه به اونها تصمیم بگیرم.
من خودم که بازبینی می‌کنم در مورد فاصله‌ها سعی می‌کنم بهترین رسم‌الخط رو انتخاب کنم و به تصویر چاپی وفادار نیستم.

MMJ431:

تاریخ: ۸۹/۰۳/۲۱ ساعت: ۰:۱۶

کارتون واقعاً جای تقدیر داره، خطا زیر ۱۰ درصد!
موفق باشید!

زهرا:

تاریخ: ۸۹/۰۳/۲۱ ساعت: ۱۱:۲۰

سلام، برای زحماتی که کشیدید متشکرم. من هم مشارکت می کنم و تا حالا چند تا رو تصحیح کردم.

جوانه:

تاریخ: ۸۹/۰۳/۲۲ ساعت: ۹:۱۶

سلام بر شما
اسم نرم افزار OCR شما چیست؟
معرکه است!
تا اونجایی که تونستم دارم تصحیح یا تایید میکنم اشعار رو
شاد باشید.

منصوری زاده:

تاریخ: ۸۹/۰۳/۲۲ ساعت: ۱۴:۵۲

سلام
چند تایی را انجام دادم. نکته ای که دیدم این است که این نرم افزار مثل اینکه از بانک لغت استفاده نمی کند. مثلا در یکی از نمونه ها، کلمه “دوش” در تصویر، به صورت ” دوفن” خوانده شده بود. نمی دانم کلمه “دوفن” لغت فارسی هست یا نه، اگر هم باشد تعداد تکرار آن در متون فارسی باید خیلی کم بوده باشد. در این صورت هرگاه شما کلمه ای در متن یافتید که در فرهنگ لغت وجود ندارد؛ می توانید نزدیکترین کلمه به آن را جایگزین کنید.

حمیدرضا:

تاریخ: ۸۹/۰۳/۲۲ ساعت: ۱۷:۲۴

@جوانه:
همونطور که احتمالاً خودتون با دنبال کردن لینکها فهمیدید آراکسه.

@محرم:
در صورتی که کاربر بخواد می‌تونه همین کار رو به صورت خودکار انجام بده، یعنی محیط نرم‌افزار فرمانی رو برای «غلط‌یابی دسته‌ای» در اختیار می‌گذاره که به طور خودکار برای تمام تصاویر، برای غلطهای املایی نزدیکترین جایگزینها رو انتخاب می‌کنه و به یک باره جایگزین می‌کنه. اما، این کار همیشه نتیجهٔ دلخواه رو نمیده، مثلاً خیلی وقتها فاصله‌گذاری توی چاپ طوری نیست که لزوماً دو تیکه‌ای که کنار هم قرار گرفتن متعلق به یک کلمه باشن (و خوب جزء مشکلات نرم‌افزار در حال حاضر تشخیص نه چندان خوب فاصله‌هاست که باعث تشدید این مشکل هم میشه)، خیلی وقتها شعرها رو مثلاً به صورت دوستونی و با حالت تراز شده (جاستیفای) چاپ می‌کنن و توی این نوع چاپ گاهی مجبور میشن کلمات رو با حذف فواصل بینشون به زور توی یه عرض ثابت جا بدن. اینجاها استفاده از غلطیابی املایی نتیجه رو خراب می‌کنه، برای همین توی نرم‌افزار انتخاب این که جایگزینی خودکار انجام بشه یا نه با کاربره.

لیلا:

تاریخ: ۸۹/۰۳/۲۳ ساعت: ۱۹:۵۹

سلام، در حال انجام وظیفه

حمیدرضا:

تاریخ: ۸۹/۰۳/۲۳ ساعت: ۲۰:۰۷

@لیلا:
ممنون از بزرگواری شما

فرهاد:

تاریخ: ۸۹/۰۳/۲۳ ساعت: ۲۰:۲۹

خوب کار میکنه، دارم کاری که گفتید رو انجام میدم

ميثم:

تاریخ: ۸۹/۰۳/۲۴ ساعت: ۷:۵۴

سلام
وقت گذاشتيم و ديگران را نيز دعوت كرديم. باشد كه با موفقيت به نتيجه برسيد

حسين ميري:

تاریخ: ۸۹/۰۳/۲۴ ساعت: ۱۷:۴۲

احسنت دوست عزيز و خسته نباشيد

محمد:

تاریخ: ۸۹/۰۷/۰۹ ساعت: ۱۸:۳۱

خیلی کار ارزشمندیه … اگه بشه چند تا افزونه فایرفاکسی و برنامه فیس بوک براش تهیه کرد هم بد نیست.

حمیدرضا:

تاریخ: ۸۹/۰۷/۰۹ ساعت: ۱۸:۴۱

@محمد:
افزونۀ فایرفاکسی فکر نمی‌کنم از لحاظ آمار استفاده کننده‌ها ارزش وقتی که براش گذاشته میشه رو داشته باشه، فیس‌بوک اما فکر خوبیه، حیف که مسدوده و حداقل برای من یکی دسترسی بهش انرژی زیادی می‌خواد!

ممنون از لطف سایر دوستان.

خروجی آر.اس.اس نظرات این نوشته:»

ارسال دنبالک:»

ارسال نظر برای این نوشته امکانپذیر نیست.