گزیر

::گاهنوشتهای حمیدرضا محمدی::



دربارهٔ من:

آخرین نظردهندگان:

مشترک شوید:

ایمیل خود را در جعبهٔ زیر وارد کنید و دکمهٔ اشتراک را بزنید.

جستجو:

Valid XHTML 1.0 Transitional RSS Feed

۹۹٪

۸۶/۰۸/۰۲

هر چه منتظر ماندیم که صاحابش اشاره‌ای به کشفش بکند دیدیم فایده‌ای ندارد. از این رو خودمان عرضه‌اش می‌کنیم!

«صخر» نام یک شرکت عربی (فکر می‌کنم مصری) است که در زمینه‌ی فناوریهای پردازش زبان طبیعی با تأکید بر زبان و خط عربی کار می‌کند. نرم‌افزار تبدیل تصویر به متن (اُ.سی.آر) این شرکت از جمله معدود نرم‌افزارهای ا.سی.آر موجود است که از ابتدا با هدف پشتیبانی تخصصی از خط و زبان عربی ساخته شده و به ادعای این شرکت علاوه بر زبان عربی از برخی زبانهای دیگر که با خط عربی یا مشتقات آن نوشته می‌شوند (فارسی، اردو و جوی) پشتیبانی می‌کند. در ایران شرکتی گویا قفل محصول ا.سی.آر این شرکت عربی را شکسته، محیط آن را فارسی کرده، دوباره روی آن قفل گذاشته و دارد به اسم «خودنگار واژه‌شناس» آن را به خلق الله قالب می‌کند! البته از آنجا که دست بالای دست بسیار است افرادی هم پیدا شده‌اند که قفل دوم را شکسته‌اند و محصول ایرانی‌نما شده را راهی خانه‌های ایرانیانی کرده‌اند که برایشان معنی ندارد برای یک نرم‌افزار چیزی بیشتر از دو یا سه برابر قیمت یک سی.دی خام پول بدهند!

در هر صورت نکته‌ی جالبی که کشف شده و می‌خواستم به آن اشاره کنم مربوط به یکی از بروشورهای تبلیغاتی نرم‌افزار ا.سی.آر صخر است. در این بروشور ادعا شده که دقت این نرم‌افزار در تشخیص متون عربی کتابها و روزنامه‌ها ۹۹٪ است:

۹۹٪

اما درستی این ادعا به راحتی و با نگاهی به گوشه‌ی همان بروشور تبلیغاتی زیر سؤال می‌رود. جایی که نرم‌افزار مذکور در بازشناسی متنی با یک قلم معمول عربی -در کنار تشخیص افتضاح کلمه‌ی انگلیسی- چندین حرف از چند کلمه‌ی ساده را به وضوح اشتباه تشخیص داده.

صخر

وضع بروشور تبلیغاتی که این باشد وضع نرم‌افزار در کاربردهای عملی کاملاً معلوم است. جالب اینجاست که در بروشور تبلیغاتی نگارش سبک‌تر همان نرم‌افزار (که ارزان‌تر است) این خطاها (به ظن قوی به صورت دستی) تا حدودی تصحیح شده‌اند.

بعدنوشت: طبق تذکر دوستان محصولی با نام «خودنگار» که اشتباهاً آن را قفل شکسته‌ی نرم‌افزار صخر معرفی کرده بودم، فی‌الواقع یک محصول تولیدی داخل است که در پژوهشکده‌ی پردازش هوشمند علائم تولید شده که به لحاظ ضعفهای عملکردی و ساختاری با اقبال عمومی مواجه نشده و هم‌اکنون هم توسط شرکت سیمیا نرم‌افزار به بازار عرضه می‌شود.

قفل شکسته‌ی ایرانی صخر توسط شرکت هوش مصنوعی رایورز و با نام «واژه‌شناس» عرضه شده.






۷ نظر

یک رهگذر:

تاریخ: ۸۶/۰۸/۰۴ ساعت: ۲:۳۶

سلام هموطن ايراني. سايت ياهو که آدرس ايميل من و شما در آن قرار دارد و روزانه با مسنجرش چت مي‌کنيم، نام کشور من و تو را از ليست کشورهايش در صفحه‌ي ثبت نام حذف کرده. اگر غيرت و عرق ملي‌ات اجازه نمي‌دهداين ننگ را بپذيري، با لينک دادن به صفحه‌ي http://helloyahoomail.net از طريق کليدواژه‌ي Yahoo mail به بمب درحال پيشرفت عليه ياهو کمک کنيد تا کوچکترين وظيفه‌ي ما به کشورمان ادا شده باشد و همانند بمب افتخارآميز فيلم سيصد و خليج فارس، بتوانيم يک موفقيت ديگر را نيز رقم بزنيم… متشکرم

منصوري زاده:

تاریخ: ۸۶/۰۸/۰۴ ساعت: ۲۱:۴۳

۱- ممنون از توجه و توضيحات مفيدت
۲- شنيده ام نرم افزار معروف finereader نسخه عربي هم دارد. در اين مورد اطلاعي داري ؟

حمیدرضا:

تاریخ: ۸۶/۰۸/۱۰ ساعت: ۱۵:۵۵

محرم جان:
۱- خواهش می‌کنم!
۲- والله منم فکر می‌کردم یا شنیده بودم که از عربی هم پشتیبانی می‌کنه، ولی الان رفتم توی سایتش نگاه کردم اسمی از عربی توی لیست زبانهای پشتیبانی شده توسط FineReader نیست:
http://www.abbyy.com/finereader8/?param=44927
(لیست زبانها مال فاین ریدر هشته ولی گویا نسخه‌ی نهش هم از همین زبانها پشتیبانی می‌کنه و نه چیزی بیشتر.)
توی صفحه‌ی فیدبکهاش هم دو سه نفر از این این نرم‌افزار از عربی و عبری پشتیبانی نمی‌کنه تعجب یا اظهار تأسف کردن:
http://www.abbyy.com/company/?param=5673
گویا موتور آی.سی.آرش از حروف گسسته‌ی عربی پشتیبانی می‌کنه:
http://www.abbyy.com/sdk/?param=60489
http://www.abbyy.com/sdk/?param=60493
که البته نرم‌افزار iReadDoc شرکت ما احتمالاً پشتیبانیش خیلی قوی تره.
اگه دنبال OCRی می‌گردی که از فارسی پشتیبانی کنه بد نیست یه نسخه از آیریس رو گیر بیاری:
http://www.irislink.com
و یا نسخه‌ی ایرانی شده‌ش رو که توسط برادران مؤمن و متعهد حسیب رایانه 😉 به سرقت رفته بخری:
http://www.hasibcom.com/pOCRFarsi.asp
که البته از لحاظ کیفیت کار و تشخیص فونتهای معمول فارسی خیلی وقتها کیفیت تشخیصش افتضاحه، سندی هم که برات درست می‌کنه حتی برای او.سی.آر انگلیسیش مشابهت زیادی با عکس سند نداره.
اگه بتونی چیزی کمتر از یک ماه منتظر بمونی، احتمالاً او.سی.آر شرکت ما به بازار میاد که اولاً کاملاً ایرانیه و از موتور او.سی.آر گرفته تا بیشتر کمپوننتهای رابط کاربریش رو خودمون نوشتیم (البته ایرانی بودنش از این نظر مزیته که مطابق با شرایط تولید سندها توی ایران، فونتهای متداول و عادات تایپیستهای ایرانی تهیه شده وگر نه در کل بیشتر وقتها ایرانی بودن یه محصول نه تنها مزیت که یه عیب محسوب می‌شه 😉 البته من با شناختی که از همکارام دارم می‌تونم تضمین کنم که در این مورد خاص ایرانی بودن این محصول مزیته، اونم فقط به خاطر ایرانیهای خاصش!) و دوم این که دقت بالایی داره و سندی هم که درست می‌کنه چینش (layout) عکس سند رو به نحوی حفظ می‌کنه که انگار یه تایپیست تایپش کرده (و سندت رو پر از جعبه متن و فریم نمی‌کنه) و سوم این که ویرایش پایه‌ش با قیمتی معقول و قابل خرید برای کاربرهای عادی نرم‌افزار عرضه می‌شه:
http://farsiocr.blogfa.com/post-92.aspx
http://www.farsiocr.ir

حسین:

تاریخ: ۸۶/۰۸/۲۳ ساعت: ۱۸:۳۰

خیلی با حالی

مدیر فنی حسیب رایانه:

تاریخ: ۸۶/۱۰/۱۰ ساعت: ۸:۱۱

دوست عزیز من به عنوان مدیر فنی شرکت حسیب رایانه لازم می دانم مطالب زیر را ذکر کنم :

۱٫ اگر به بسته بندی CD های ما نگاه کنید متوجه می شوید که ذکر کردیم که نرم افزار خارجی است و ما فقط برای آن آموزش تهیه کردیم و آپدیت ها و پچ ها را عرضه می کنیم ، پس کلمه سرقت از بی توجهی شما است.

۲٫ تمامی خریداران حق تست قبل از خرید را از طریق ارسال یک صفحه از متن خود به ایمیل شرکت دارند و در صورت تمایل تهیه کنند.

۳٫ قبل از اینکه به دیگران تهمت بزنیم بد نیست تحقیق کنیم.

پویا:

تاریخ: ۸۷/۰۳/۰۱ ساعت: ۱۵:۰۸

باسلام خدمت دوستان و همکاران گرامی:
می خواستم محبت کنید و یک OCR فارسی معرفی کنید که Sdk داشته باشه یا اینکه بشه از Activex ش تو برنامه نویسی (دلفی) استفاده کنم باتشکر

مرتضی:

تاریخ: ۸۸/۰۹/۰۵ ساعت: ۳:۴۹

ای بابا؛ شما قبل از اون هایلایت قرمز رو توجه نکردی که نوشته Up to؟ یعنی فوق فوقش ۹۹% دقت داشته باشه 🙂

خروجی آر.اس.اس نظرات این نوشته:»

ارسال دنبالک:»

ارسال نظر برای این نوشته امکانپذیر نیست.