گزیر

::گاهنوشتهای حمیدرضا محمدی::



مشترک شوید:

ایمیل خود را در جعبه زیر وارد کنید و دکمه اشتراک را بزنید.

جستجو:

Valid XHTML 1.0 Transitional RSS Feed

لیستهای مرتب با اعداد فارسی

۸۸/۱۰/۱۵

تگ ol (لیست مرتب) در html در CSS ویرایش ۲ توانایی نمایش اعداد به صورت فارسی را ندارد (از اعداد لاتین، رومی و ارمنی(!) پشتیبانی می‌کند اما اعداد را به صورت عربی یا فارسی نمی‌تواند نشان دهد). استایلهای انواع لیستها را در این استاندارد اینجا می‌توانید ببینید. در استاندارد جدیدتر گویا قرار است پشتیبانی از شکل اعداد فارسی هم اضافه شود.

چند وقتی است استقبالهای شاعران را از هم (حافظ از سعدی، حافظ از سلمان، سلمان ساوجی از سعدی و …) را با توجه به میزان مشابهت کلمات ابیات و همینطور با توجه به وزن و قافیهٔ اشعار استخراج کرده‌ام و در گنجور در دسترس قرار داده‌ام. دیروز به نظرم رسید بد نیست این فهرستها را با کمک تگ ol شماره‌گذاری کنم. اما با توجه به نکته‌ای که در پاراگراف قبل گفتم امکان نمایش درست اعداد در متن فارسی وجود نداشت. جستجویی کردم و به این صفحه رسیدم. نویسندهٔ مطلب به کمک جاوا اسکریپت مشکل را حل کرده. با کمک اسکریپت او، اسکریپت ساده‌ای نوشتم که امکان نمایش اعداد لیستهای مرتب را به صورت فارسی در اختیار می‌گذارد:

ادامه »

نوشته شده در ساعت ۲۲:۱۰

خط فارسی در کامپیوتر: انتخاب میان زیبایی و کارایی؟

۸۸/۰۷/۱۷

ه‌ی چسبان

در صفحه‌کلید پیش‌فرض فارسی ویندوز (XP، ویستا، ۷ و احتمالاً ۲۰۰۰) با کلید ترکیبی Shift+G می‌توانید نویسه‌ی «ۀ» را (برای فونت تاهوما) تایپ کنید. من تا مدتی «ه»های چسبان را بدون نوشتن کسره‌ی تبدیل شده به «ی» تایپ می‌کردم: «کسره اضافه». تا مدت نسبتاً زیادی هم این «ی» را به طور کامل در حالی که با نیم‌فاصله از کلمه‌ی اصلی جدا شده تایپ می‌کردم: «کسره‌ی اضافه». اما اخیراً با کشف نحوه‌ی تایپ «ۀ» (به یاد کتابهای درسی ابتدایی) خیلی جاها از این نویسه کمک گرفته‌ام: «کسرۀ اضافه». راه حل آخری (علی‌رغم زیبایی ظاهری) برای وب به نظرم اصلاً مناسب نیست (برای جستجو مشکل ایجاد می‌کند، علی‌رغم آن که برای چاپ راه حل خوبی است) و راه حل منطقی‌تر (کسره‌ی اضافه) به نظرم نازیباست.

پی‌نوشت: در صفحه‌کلید استاندارد ایران که با دریافت این برنامه و نصب آن در دسترس قرار می‌گیرد نویسهٔ «ٔ» را می‌توان با کلید ترکیبی Shift+N تای‍پ کرد که راه‌حل نهایی هٔ چسبان است، چون هم مشکل زیبایی را حل می‌کند و هم با توجه به این که یک نویسهٔ اضافی است برای جستجوپذیری متن مشکلی ایجاد نمی‌کند. نحوهٔ چینش حروف در این صفحه‌کلید را اینجا ببینید.

اعداد فارسی

ترجیح زیبایی نحوه‌ی نمایش بر جستجوپذیری و آسانی انتقال، در جای دیگری هم احتمالاً مشکلات زیادی برای خط فارسی در وب ایجاد کرده و آن نحوه‌ی تایپ اعداد است. بسیاری از وب‌نویسان به کمک ابزارهای موجود و در بعضی موارد -در مورد کسانی مانند من- به هر سختی که شده اعداد را به شکل فارسیشان تایپ می‌کنند (۰۱۲۳۴۵۶۷۸۹ به جای 0123456789، اگر شما هم به نوع مشابهی از این مازوخیسم مبتلا هستید توصیه می‌کنم این ابزار را امتحان کنید). مرورگرها و ابزارهای موجود، اغلب توانایی نمایش شکل درست اعداد در میانه‌ی متون فارسی را ندارند و استفاده از شکل یونیکد نویسه‌های عددی فارسی مشکل نازیبایی اعداد لاتین در متون فارسی را حل کرده. اما آیا این راه حل درست است؟ شما اگر بخواهید در متن صفحه‌ی وبی که اعداد آن با این شیوه تایپ شده اعداد را جستجو کنید در جعبه‌ی جستجو چگونه اعداد را تایپ می‌کنید؟ آیا می‌توان اعداد تایپ شده به این شیوه را از جداول به مایکروسافت اکسل برد و جمع ستونهای آنها را به راحتی به دست آورد. علی‌رغم این مشکلات بنیادی، من و احتمالاً بسیاری دیگر از طرفداران این شیوه به این کار خود ادامه می‌دهیم!

ایران نستعلیق

یکی دو باری کاربران گنجور رومیزی از من خواسته‌اند که «ایران نستعلیق» را فونت پیش‌فرض نمایش شعرها قرار دهم. چند سالی هست که این فونت با حمایت شورای عالی اطلاع‌رسانی به صورت رایگان در اختیار فارسی‌زبانان قرار گرفته و یکی دو سالی هست که قرار است «به زودی» نگارش جدید آن عرضه شود. در هر صورت، علی‌رغم زیبایی، این فونت مشکلات زیادی دارد. بریده شدن بالا و پایین کلمات از مشکلات معمول آن است. ایراد جالب دیگری که من دیدم آن است که «اعتصامی» را «اغتصامی» نمایش می‌دهد:

یکی از ایرادهای فونت ایران نستعلیق

به همین دلایل، حداقل تا چند سال بعد که احتمالاً نگارش بدون ایرادی از این فونت عرضه شود (یا به احتمال قوی‌تر، یک علاقمند زبان و خط فارسی بدون استفاده از بودجه‌های دولتی و صرفاً از روی دلسوزی و علاقه نگارش بهتری از چنین فونتی را ارائه کند) استفاده‌ی عملی از آن امکانپذیر نیست.

نوشته شده در ساعت ۱۰:۵۲

رومیزی نو

۸۸/۰۵/۰۲

کمی روی گنجور رومیزی کار کردم. حالا بالایش یک نوار ابزار دارد با چند دکمه، پایینش یک نوار وضعیت و خوب! یک کارهایی هم می‌کند ;) . برایش یک نصاب ساختم و پروژه را به سایت سورس فورج منتقل کردم. تصویری از آن را ببینید:

گنجور رومیزی

دوستانی که آن فایل ۲۱ مگابایتی پیشین را دریافت کرده‌اند کافی است فقط این فایل اجرایی را دریافت کنند و آن را در پوشه‌ای که برنامه را در آن باز کرده‌اند جایگزین فایل قبلی کنند. باقی دوستان، در صورت تمایل برنامه را از اینجا دریافت کنند.

نوشته شده در ساعت ۱۵:۲۶

نیم‌فاصله‌ی غلط / نیم‌فاصله‌ی درست

۸۸/۰۳/۱۰

من تا یکی دو سال پیش برای تایپ نیم‌فاصله در ویندوز ایکس‌پی Alt را نگه می‌داشتم و اعداد ۰۱۵۷ را تایپ می‌کردم. بعداً از یکی از دوستان میانبر بهتری یاد گرفتم که سریع‌تر و بهتر به نظر می‌رسید (Ctrl+Shift+4). پیش‌تر متوجه شده بودم که در بعضی از متون نیم‌فاصله‌هایی هست که با این نیم‌فاصله فرق دارند (در پنجره‌ی جستجو نیم‌فاصله‌ی خودم را تایپ می‌کردم، آن نیم‌فاصله‌ها را پیدا نمی‌کرد). همین چند روز پیش متوجه شدم که با کلید ترکیبی Ctrl+Shift+2 هم می‌شود نیم‌فاصله تایپ کرد و اتفاقاً نیم‌فاصله‌ی درست و اصلی همین است نه آن.

گفتم بنویسم تا اگر شما هم با Ctrl+Shift+4 نیم‌فاصله تایپ می‌کنید بدانید که اشتباه است و باید با Ctrl+Shift+2 تایپش کنید. همین!

نوشته شده در ساعت ۱۷:۴۱

زمینی که از اول گرد بود

۸۷/۰۶/۰۸

چند روز پیش (شاید بیش از چند روز پیش) ماه‌گرفتگی داشتیم و احتمالاً هنوز هم مثل من می‌توانید در خبرخوانتان ردپاهایی از این پدیده را بیابید. احتمالاً ماه‌گرفتگی و کشف عامل این پدیده (افتادن سایه‌ی زمین بر روی ماه) یکی از نشانه‌هایی بوده که قدما را به گرد یا کروی شکل بودن زمین رهنمون شده. نقل قول معروفی هست که به ماژلان (کاشف و دریانورد پرتغالی همعصر کریستف کلمب) نسبت داده شده که می‌گوید:

کلیسا می‌گوید زمین تخت است، اما من می‌دانم که زمین گرد است. چرا که من سایه‌ی زمین را روی ماه دیده‌ام و من به «سایه» بیشتر ایمان دارم تا «کلیسا»!

جالب اینجاست که این نقل قول در واقع به احتمال خیلی زیاد از آن ماژلان نیست و قدیمی‌ترین منبعی که این گفته را از زبان ماژلان نقل کرده کتابی است که در اواخر قرن نوزدهم میلادی نوشته شده، گویا موضوع آن رد عقاید کلیساست و البته در آن، این نقل قول با تردید به ماژلان نسبت داده شده (با این لحن که «… فکر می‌کنم ماژلان باشد که گفته است: …»)(نکاتی به انگلیسی در مورد این نقل قول). نکته‌ی دیگری هم در این مورد هست و آن این است که دانشمندان قدیمی (و از جمله وابستگان به کلیسا) (حداقل از قرن چهارم پیش از میلاد، با توجه به مستندات بازمانده از یونانیها) می‌دانستند که زمین کروی شکل است و روی همین اطلاع بود که کاشفان قرن پانزدهم تصمیم گرفتند با رفتن به سمت غرب به هند (که عملاً در سمت مخالف مسیری بود که در پیش گرفته بودند) برسند (حقیقتی که کلیسا با آن مشکل داشت و امثال گالیله را به واسطه‌ی اعتقاد به آن به دادگاه تفتیش عقاید کشاند «گردش زمین به دور خورشید» بود نه «کروی بودن زمین»).

نشانه‌های اعتقاد به کروی بودن زمین در ادبیات کهن ما هم دیده می‌شود. دوستان، پای بعضی از شعرهای مرتبط با این قضیه در گنجور حاشیه نوشته‌اند و به این قضیه اشاره کرده‌اند. مثلاً دوستی در پای قصیده‌ای از عطار که با این بیت شروع می‌شود:

نه پای آنکه از کره‌ی خاک بگذرم

نه دست آنکه پرده‌ی افلاک بر درم

علاوه بر اشاره به این موضوع، از کتاب کیمیای سعادت غزالی گفته‌هایی را نقل کرده که دلالت بر اطلاع دانشمندان ما از حجم خورشید و ستاره‌ها دارد (به نظر من البته، این نکته هم که شاعر شاکی، سفر از کره‌ی زمین به مقصدی دیگر را هم به عنوان یکی از گزینه‌های ممکن در نظر داشته و متأسف بوده از این که توان این کار را ندارد نکته‌ی جالبی است، شاید اگر راجع به این قضیه کمی جدی‌تر فکر می‌کرد الان یوری گاگارین اولین انسانی نمی‌بود که به فضا رفته ;) ). نمونه‌های دیگر اشاره به این موضوع را به لطف دوست گرامی «رسته» در پای این شعر از سنایی (بیت ۲۹)، این تکه از لیلی و مجنون نظامی (ابیات ۷۶ تا ۸۶) و این قصیده از ناصرخسرو بخوانید (برای شماره‌گذاری ابیات از عنوانی که به همین منظور در داخل کادر «حاشیه‌ها» در نظر گرفته شده استفاده کنید). اما بیت اول ِ این مورد آخری را بخوانید:

گنبد پیروزه‌گون پر ز مشاعل

چند بگشته‌ست گرد این کره‌ی گل؟

همچنان که می‌بینیم قدمای ما نیز همانند قدمای کلیسا به گردش خورشید و ستارگان به دور زمین معتقد بودند. در جای‌جای ادبیات ما اشاره به «گنبد گــِــرد گـــَــرد» در واقع نشأت گرفته از همین اعتقاد است. البته شواهدی نیز وجود دارد از این که برخی دانشمندان ما به گردش زمین به دور خورشید معتقد بوده‌اند: اینجا را ببینید.

توصیه می‌کنم سرگذشت پرماجرای ماژلان در ویکی‌پدیا را بخوانید، این قسمت از این مقاله‌ی ویکی‌پدیا را در نظر داشته باشید:

ماژلان و یارانش همچنین نخستین اروپاییانی بودند که:

به ضرورت ایجاد یک خط تاریخ بین‌المللی پی بردند؛ بدون وجود این این خط فرضی دریانوردانی که از سمت غرب دوره کره‌ی زمین می‌گردند یک روز از تقویم واقعی عقب می‌مانند.

اگر کتاب دور دنیا در هشتاد روز ژول ورن را خوانده باشید یا مثل همسنهای من کارتونش را دیده باشید می‌دانید که همین جریان (یک روز عقب ماندن از تقویم در حین دور زدن زمین از غرب به شرق) باعث شد قهرمان داستان در پایان سفر اشتباهاً تصور کند دیر رسیده. جالب اینجاست که این بیت از انوری:

زمانه سیری کامروزش ار برانگیزی

به عالمی بردت کاندرو بود فردا

بنابر نظر ابوالحسن فراهانی -یکی از شارحان دیوان انوری و از سخنوران قرن یازدهم- دلالت بر این دارد که انوری (که بنا بر حکایت معروفی از برجستگان زمان خود در علوم ستاره‌شناسی و طالع‌بینی مبتنی بر ستارگان بوده) از حقیقت یاد شده آگاهی داشته است. برای اطلاع بیشتر در این زمینه این نوشته‌ی دکتر محمدرضا ترکی را بخوانید.


این نوشته را تقدیم می‌کنم به مجید عزیز و همینطور دوستانی که در پای این صفحه نسبت به من اظهار لطف کرده‌اند.

نوشته شده در ساعت ۱۹:۰۶

تحقق یک رؤیا : او.سی.آر فارسی

۸۷/۰۳/۲۸

او.سی.آر (OCR) یا نویسه‌خوان نرم‌افزاری است که به کمک آن می‌توان از روی تصویر متن (نسخه‌های اسکن شده، عکسبرداری شده و مانند آن) به فایل متنی قابل ویرایش یا جستجو (فایل ورد، پی.دی.اف) رسید.

سالهاست که فارسی‌زبانان انتظار عرضه‌ی یک او.سی.آر سازگار با زبان فارسی را می‌کشند. بخش دولتی در طول سالهای اخیر تلاش کرد با حمایتهای مالی از شرکتهای فعال در حوزه‌ی فناوری اطلاعات، زمینه را برای عملی کردن این خواسته فراهم آورد، که از این رهگذر جز خبرهای مثبت خبرگزاریها مبنی بر به نتیجه رسیدن این پروژه‌ها چیزی عاید کاربران نهایی نشد و محصولات این پروژه‌ها هیچگاه آماده‌ی عرضه به بازار نشدند. تنها محصول ایرانی تولید شده در این راستا با نام «خودنگار» که توسط «پژوهشکده‌ی هوشمند علائم» عرضه شد به لحاظ محدودیتهای فرمت تصاویر ورودی و عدم ارائه‌ی حداقل امکانات مورد نیاز برای یک نرم‌افزار او.سی.آر نتوانست پاسخگوی نیاز کاربران باشد. برخی از شرکتهای خارجی همانند IRIS و صخر محصولات او.سی.آر فارسی عرضه کردند که کیفیت پایین بازشناسی آنها اغلب، کاربر را وادار به آن می‌کرد که به اندازه‌ی زمانی که برای تایپ متن باید صرف کند، برای تصحیح خروجی بازشناسی وقت بگذارد.

در این میان، شرکت هدی سیستم با عرضه‌ی محصول نویسه‌خوان آراکس خود مدعی است رؤیای عرضه‌ی یک او.سی.آر تمام عیار برای زبان فارسی را تحقق بخشیده است. «نویسه‌خوان آراکس» یک او.سی.آر فارسی/انگلیسی است که نگارش حرفه‌ای آن توانایی تشخیص متون فارسی تایپ شده با ده قلم پرکاربرد و متون انگلیسی با پنج قلم مشهور را با دقت بالای ۹۷ درصد داراست (دقت به دست آمده برای اسناد نمونه در سطح کلمه ۹۷ درصد و در سطح نویسه ۹۹ درصد بوده است). قابلیتهای این محصول کاملاً ایرانی -که یک پروسه‌ی زمانی دو ساله صرف تولید آن شده- قابل مقایسه و رقابت با قابلیتهای معروفترین و پرسابقه‌ترین او.سی.آر های جهانی است. این فهرست را برای نمونه از نظر بگذرانید:

- دریافت و بازشناسی متن تصاویر با فرمتهای مختلف (JPG، TIFF، PNG و …)، به صورت تک قاب یا چند قاب، بدون محدودیت در رنگبندی با رزلوشن حداقل ۱۵۰ دی.پی.آی (نسخه‌ی سازمانی این محصول که جهت استفاده‌ی سازمانهای بزرگ طراحی شده از ورودی PDF نیز پشتیبانی می‌کند)

- مدیریت و بازشناسی دسته‌های تصویری بزرگ (مثلاً دو یا سه هزار تصویر در هر بار) بدون برخورد به مشکل حافظه، با امکان مرتب‌سازی دستی یا خودکار و ذخیره و بازیابی این دسته‌ها در حداقل زمان ممکن

- توانایی تشخیص خودکار فونت

- تقیسم‌بندی خودکار تصویر سند به ناحیه‌های متنی، تصویری و جدولی (انواع جدولها بدون ادغام یا با ادغامهای پیچیده) با امکان ناحیه‌بندی دستی

- ارائه‌ی تمامی اطلاعات فنی لازم جهت بررسی دقت نتایج به کمک رابطهای ویژوال کاربرپسند

- ویرایشگر متن با امکانات لازم جهت تطبیق اصل تصویر با متن بازشناسی شده

- غلط‌یاب املایی فارسی و انگلیسی که امکان غلط‌یابی املایی و جایگزینی با نزدیکترین پیشنهاد را با فشردن یک دکمه در اختیار می‌گذارد

- سازگاری کامل با استاندارد یونیکد با ارائه‌ی امکانات لازم جهت تولید خروجیهای سازگار با نرم‌افزارهای غیریونیکد

- تولید خروجی RTF (با چینش مطابق اصل تصویر بدون استفاده از جعبه‌های متنی) قابل ویرایش توسط مایکروسافت ورد

- تولید خروجی PDF به صورت «اصل تصویر + متن» که ضمن حفظ اصل تصویر ورودی، آن را قابل جستجو می‌کند

- ویرایشگر تصویر قوی جهت رفع مشکلات گرافیکی تصاویر ورودی

- راهنمای کامل روش استفاده و پیکربندی نرم‌افزار

- …

قابلیتهای ذکر شده تعدادی از مهم‌ترین قابلیتهای نویسه‌خوان آراکس هستند و هدی سیستم شرکت تولیدکننده‌ی این محصول با توجه به قابلیتهای بعضاً منحصر به فرد آن، در گامهای بعدی توسعه‌ی آن بازارهای بین‌المللی (محدوده‌ی کشورهایی که از خط و زبان لاتین و عربی استفاده می‌کنند) را هدف گرفته است. برای آشنایی بیشتر با شرکت هدی سیستم به سایت رسمی آن به نشانی www.hodasystems.com مراجعه کنید و برای آشنایی با نویسه‌خوان آراکس، سایت اختصاصی آن با نشانی www.farsiocr.com را از نظر بگذرانید.

نمای کلی نویسه‌خوان آراکس

نمای کلی نویسه‌خوان آراکس

امکانات بصری آراکس امکان سنجش کیفیت بازشناسی را به آسانی در اختیارتان می‌گذارند

امکانات بصری آراکس امکان سنجش کیفیت بازشناسی را به آسانی در اختیارتان می‌گذارند

آرایش مدیریت دسته در نویسه‌خوان آراکس

آرایش مدیریت دسته در نویسه‌خوان آراکس

آرایش ویرایش متن به همراه تصویر کمکی در نویسه‌خوان آراکس

آرایش ویرایش متن به همراه تصویر کمکی در نویسه‌خوان آراکس

پیمانه‌ی بهبود تصویر آراکس (تصویر از راهنمای نرم‌افزار)

پیمانه‌ی بهبود تصویر آراکس (تصویر از راهنمای نرم‌افزار)

نمونه خروجی آراکس برای ورد

نمونه خروجی آراکس برای ورد

خروجی پی دی اف آراکس

خروجی پی دی اف آراکس

نوشته شده در ساعت ۹:۳۴

گنجور

۸۶/۱۱/۰۵

(۱)

گنج ادب را یادتان هست؟ مدتی است (فکر کنم چیزی حدود یک ماه) که آن را منتقل کرده‌ام اینجا. البته با تفاوتهای مهمی: مهم‌ترین تغییر این که منبع اشعار موجود دیگر درج نیست، بلکه تمامی اشعار از ری‌را وارد مجموعه شده‌اند. شش شاعر هم شده تقریباً تمامی شاعران موجود در ری‌را (سی و چند تا، تقریباً یعنی دقیقاً همه به استثنای دقیقی که چون فکر کردم تنها اثری که ری‌را از او دارد همان گشتاسپ‌نامه است و گشتاسب‌نامه هم جزئی از شاهنامه است، نقل مکرر آن ضرورتی ندارد). نحوه‌ی بخش‌بندی مثنوی، شاهنامه و اشعار نظامی را هم از حالت نامناسب قبل خارج کردم و حالا تمام بخش‌بندیها مطابق ری‌راست (به غیر از رباعیهای شاعران که در گنجور هر کدامشان یک صفحه و نشانی یکتا دارند). تغییرات دیگری هم دارد، مثلاً فهرست پرحجم غزلیات شمس را که پیش از این یک صفحه‌ی سیصد/چهارصد کیلوبایتی بود بخش‌بندی کردم و برای خیلی از آثار شاعران دیگر هم فهرستهای الفبایی به ترتیب حروف روی درست کردم. از آنجا که حالا برای این مجموعه فضا و دامنه‌ی جداگانه خریده‌ام، در ِ آن را هم به روی موتورهای جستجو باز کردم.

گنجور
ادامه »

نوشته شده در ساعت ۱۸:۳۸

استانداردهای رابط کاربری برای نرم‌افزارهای فارسی

۸۶/۰۳/۲۹

(۱)

تا به حال شده احساس کنید ویرایش جدید نرم‌افزاری که معمولاً از آن استفاده می‌کنید ظاهری عجیب، غیر متعارف یا حتی آزاردهنده پیدا کرده است؟! ظاهری که استفاده از آن را سخت کرده و شما نمی‌توانید به راحتی گزینه‌های لازم برای کار با نرم‌افزار را پیدا کنید؟! به عنوان نمونه اگر کاربر اینترنت اکسپلورر ۶ بوده باشید احتمالاً در اولین مواجهه با ظاهر ویرایش جدید آن (۷) از این که منوی اصلی آن حذف شده (در واقع پنهان شده) تعجب خواهید کرد و مدتی طول می‌کشد تا بتوانید جای گزینه‌های نرم‌افزار را در ویرایش جدید پیدا کنید.

اینترنت اکسپلورر ۷
ادامه »

نوشته شده در ساعت ۱۹:۰۸

کاری که باید انجام شود

۸۵/۰۵/۰۵

خط فارسی به گونه‌ای نوشته می‌شود که حرکات حروف (کسره، ضمه و فتحه) در آن نمایش داده نمی‌شود، همچنین در مواردی املای کلمات با نحوه‌ی تلفظ آنها متفاوت است. این مسأله باعث می‌شود که تهیه‌ی بسیاری از ابزارهای نرم‌افزاری مرتبط با این زبان نیازمند وجود یک بانک اطلاعاتی کامل از تلفظ کلمات آن باشد. ایده‌ها و نرم‌افزارهای اینچنینی که من الان در ذهن دارم یکی نرم‌افزار تبدیل متن به صحبت یا بازخوانی متن فارسی است و دیگری یک نرم‌افزار تشخیص کامپیوتری وزن عروضی اشعار فارسی.

از طرف دیگر تولید چنین بانکی نیاز به حجم بالایی از کار نیروی انسانی برای جمع‌آوری، دسته‌بندی، ورود و تضمین صحت اطلاعات دارد که انجام آن از عهده‌ی اشخاص و حتی شرکتهای خصوصیی که ممکن است از تولید چنین بانکی سود ببرند خارج است. حتی اگر شرکتی هم چنین بانکی را تولید کند، مطمئناً به واسطه‌ی انگیزه‌های مالی از عرضه‌ی باز، عمومی و رایگان این محصول خودداری خواهد کرد.

این کار، کاری است که به نظر من باید توسط دولت انجام شود و محصول نهایی نیز به صورت رایگان و با ساختار باز در اختیار عموم قرار گیرد. حتی به نظر من دولت موظف است این کار را برای سایر زبانهای خاص محدوده‌ی جغرافیایی کشور نیز با اولویت‌بندی مناسب به انجام برساند که البته بعید است حتی برای زبان فارسیش هم کسی به این زودیها به فکر بیفتد.

بد نیست نهادهای دولتی ِ مرتبط با فناوری اطلاعات، به جای جنبه‌ی ملی بخشیدن به طرحهایی که از اساس در مورد آنها بحث و سؤال وجود دارد (سیستم عامل ملی، کامپیوتر ملی و مانند آنها) به فکرها و ایده‌هایی بپردازند که انجام هر چه زودترشان برای حفظ و تقویت بنیانهای ملی کشور (که زبان یکی از مهم‌ترین آنهاست) ضروری است.

نوشته شده در ساعت ۲۳:۳۴

کشتم شپش شپش کش شش پا را!

۸۵/۰۵/۰۴

مسابقه در تکرار سریع جملاتی که تکرار حروف همسان یا همجنس، ادای آنها را سخت کرده، یکی از سرگرمیهای بچگی فارسی زبانهاست (در زبانهای دیگر هم مشابه دارد؟). به هر صورت جالب است ببینیم این سرگرمی دوران بچگیمان حتی در شعرها و ادبیات قدیمی فارسی نیز نمود پیدا کرده و نمونه‌هایی دارد (برای این به اصطلاح صنعت ادبی اسامی واج‌آرایی و نغمه حروف را انتخاب کرده‌اند).

چند تاییش را که من می‌شناسم اینجا می‌آورم، بد نیست اگر شما هم از ادبیات کهن فارسی نمونه‌هایی را سراغ دارید عنوان کنید.

الف- حافظ (تکرار حرف سین):

رشته‌ی تسبیح اگر بگسست، معذورم بدار!

دستم اندر ساعد ِ ساقیّ ِ سیمین ساق بود!

این که می‌گویم فقط یک حدس است: خواندن مصرع دوم این بیت مخصوصاً به صورت آرام و نامفهوم و با تأکید بر روی حرف سین، تکرار متوالی و سریع ذکر «سبحان الله» را به ذهن متبادر می‌کند و من احساس می‌کنم حافظ عمداً قصد داشته با خوانده شدن این بیت چنین احساسی به شنونده دست دهد، یعنی این تصویر را در ذهن شنونده بسازد که راوی، تسبیح گویان دارد به استقبال ساقی سیمین ساق می‌رود!

ب- حافظ (تکرار حرف خ):

خیال ِ خال ِ تو با خود به خاک خواهم برد

که تا ز خال تو خاکم شود عبیرآمیز

«خ» از آن حروفی نیست که بدون دقت کافی تکرارش تشخیص داده شود، بنابراین احتمال دارد شنونده‌ی این بیت تکرار زیاد این حرف را در آن تشخیص ندهد.

چیزی که در این بیت به نظر من جدای از این صنعت ادبی خیلی قشنگ است این است که اگر مصرع اول را به صورت یک جمله‌ی کامل بخوانید به صورتی که احساس نشود بقیه دارد، یک شعر عاشقانه‌ی ناامیدانه‌ی کامل را دارید (به تو نمی‌رسم، عشقت را با خودم به گور می‌برم :( )! به همین دلیل می‌توانید با خواندن ِ به جای ِ مصرع دوم شنونده‌ی غمزده از مصراع اول را متعجب کنید، به او بفهمانید که مصرع اول یک جمله‌ی عاشقانه‌ی تراژیک نیست، بلکه یک جمله‌ی عاشقانه‌ی سرافرازانه و شاهدی بر یک انتخاب آگاهانه است (عشقت را با خودم به خاک می‌برم تا خاک گورم بوی تو را بگیرد!).

ج- سعدی (تکرار حرف ش):

شب است و شاهد و شمع و شراب و شیرینی!

غنیمت است چنین شب که دوستان بینی

به نظر من تکرار واضح و مصنوعی حرف شین تنها مشخصه‌ی قابل توجه این بیت است.

د- حافظ (تکرار حرف چ):

سرو چمان من چرا میل چمن نمی‌کند

همدم گل نمی‌شود، یاد سمن نمی‌کند

البته تعداد تکرار حرف «چ» زیاد نیست ولی «چ» از آن حروفی است که تکرار کمش هم خودش را نشان می‌دهد.

ه- حافظ (تکرار حرف ک):

که آگه است که کاووس و کی کجا رفتند؟

که واقف است که چون رفت تخت جم بر باد؟

این بیت را اینجا پیدا کردم. البته به نظرم تکرار حرف «ک» خیلی تکرار جذاب و قشنگی نیست. در واقع حتی به نوعی کریه و زشت هم هست (البته فقط به خاطر نوع بیان این حرف و نه مسئله‌ی دیگر ;) ). به هر حال مصرع اول این بیت به نظرم از آن جملاتی است که آدم اگر چند بار به صورت سریع و متوالی (به شیوه‌ی همان مسابقه یا رو کم کنیها) تکرارش کند تعداد «ک» هایش بیشتر هم می‌شود ;) .

و- حافظ (تکرار حرف ش):

رسم عاشق کشی و شیوه‌ی شهرآشوبی

جامه‌ای بود که بر قامت او دوخته بود

 

نوشته شده در ساعت ۱۸:۳۸