فاجعهٔ وب فارسی
یا
چرا «فیزیک» با «فیزیک» فرق دارد؟!

یک روز بعدازظهر توی سایت دانشکده نشسته‌اید و دنبال یک سایت خوب به زبان فارسی دربارهٔ فیزیک می‌گردید. به گوگل می‌روید و در آن‌جا کلمهٔ «فیزیک» را جستجو می‌کنید. درست همان اولین سایتی که گوگل پیدا کرده است، به نظرتان جالب می‌آید و به آن وارد می‌شوید. هنوز خوب سایت را سیاحت نکرده‌اید که مسئول سایت می‌گوید وقت تمام شده و تا پنج دقیقهٔ دیگر سایت تعطیل می‌شود. کارتان را نیمه‌کاره رها می‌کنید و می‌روید.

حالا شب شده و در خانه (یا خوابگاه) پشت کامپیوتر نشسته‌اید و می‌خواهید یک بار دیگر همان سایت را ببینید. آدرس سایت یادتان نیست؛ پس یک بار دیگر به گوگل می‌روید و «فیزیک» را جستجو می‌کنید. ولی این بار نتایج جستجو کمی فرق کرده است. آن سایت قبلی نه تنها دیگر اولین یافتهٔ گوگل نیست، بلکه در صفحهٔ اول نتایج جستجو هم هیچ خبری از آن نیست. در صفحهٔ دوم و سوم هم پیدایش نمی‌کنید. با خودتان می‌گویید: «یا گوگل قاطی کرده، یا از بعدازظهر تا حالا اینترنت کلاً عوض شده!» ولی این بار هم یافته‌های گوگل طبق معمول چیزهای خوبی هستند. سایت دیگری را انتخاب می‌کنید و به آن وارد می‌شوید...

داستانی که تعریف کردم به هیچ وجه تخیلی نیست! این اتفاقی است که هر روز برای هر کسی که در وب فارسی دنبال چیزی می‌گردد اتفاق می‌افتد. بهتر است بگویم که در کمال تأسف، اینترنت به زبان فارسی در دو نسخه وجود دارد: در یک نسخهٔ آن از حروف «ی» و «ک» فارسی استفاده می‌شود و در نسخهٔ دیگر «ي» و «ك» عربی به کار می‌رود. حرف «ی» در «فیزیک»ای که در دانشگاه تایپ کردید، کاراکتری است با کُد 06CC و در آن که در خوابگاه تایپ کردید، کاراکتری است با کد 064A. حروف «ک» و «ك» هم وضع مشابهی دارند. وقتی که دو کاراکتر کدهای مختلفی داشته باشند، کامپیوترها (از جمله کامپیوترهای گوگل که اینترنت را برایتان می‌گردند) هیچ ربطی بین آن‌ها احساس نمی‌کنند. در نتیجه، هیچ‌کدام از سایت‌هایی را که در دانشگاه پیدا کردید، در خوابگاه نمی‌توانستید ببینید، زیرا شما در حال جستجوی دو کلمهٔ مختلف بودید! اگر نمی‌دانستید حالا بدانید: فیزیک با فیزیک فرق دارد!

مشکل کجاست؟!

مشکل از تنظیمات صفحه‌کلید کامپیوتر است. چیزی که تعیین می‌کند که با فشردن هر کلید، چه کاراکتری تایپ شود، آرایش صفحه‌کلید (Keyboard Layout) است . دقت کنید که این موضوع ربطی به فونت ندارد؛ فونت فقط شکل ظاهری هر کاراکتر را مشخص می‌کند و کد هر کاراکتر را نمی‌تواند تغییر دهد.

کاراکترهای «ك» (کاف بدون سرکش) و «ي» (یِ نقطه‌دار) مخصوص الفبای عربی هستند. برای خط فارسی، کاراکترهای «ی» و «ک» با کد ویژه‌ای وجود دارند، همان طور که کاراکترهای «پ» و «ژ» و «گ» و «چ» هم کد مخصوص به خود را دارند. مشکل از اینجا پیش می‌آید که در بعضی از کامپیوترها با فشردن کلید D روی صفحه‌کلید، کاراکتر «ی» (با کد فارسی) تایپ می‌شود و در بعضی دیگر «ي» (با کد عربی) تایپ می‌شود.

چه شد که این طور شد؟

مشکل استفاده از کاراکترهای عربی در متن فارسی، از همان سال‌های آغازین استفاده از زبان فارسی در کامپیوتر ایجاد شد. اولین فارسی‌سازهای ویندوز که در ایران ساخته شدند، بر پایهٔ ویندوزهای عربی شکل گرفتند. کار این فارسی‌سازها این بود که چهار حرف مخصوص فارسی (پژگچ) را به تنظیمات صفحه‌کلید اضافه کنند، ولی فراموش کردند که کاراکترهای «ي» و «ك» عربی را با مشابه فارسی‌شان جایگزین کنند. این طور شد که بیشتر متن‌های فارسی که از آن زمان نوشته شدند، اشتباهاً با کاراکترهای «ي» و «ك» عربی تایپ شدند.

پیشامد بدِ بعدی این بود که وقتی ویندوز ایکس‌پی تولید شد (که صفحه‌کلید فارسی را به طور پیش‌فرض در خود داشت) آرایش صفحه‌کلیدش را بر اساس همین استاندارد غلط که بین فارسی‌زبانان رایج شده بود بنا کرد. نتیجه این شد که همهٔ کسانی که از ویندوز ایکس‌پی استفاده می‌کردند، ناخودآگاه از همین شیوهٔ غلط برای تایپ استفاده کردند. نامه به مایکروسافت و درخواست از این شرکت برای اصلاح صفحه‌کلیدِ پیش‌فرض ویندوز هم بی‌فایده بود، زیرا مایکروسافت از کاربران ایرانی خود پولی نمی‌گرفت که برای راحتی آن‌ها کاری انجام دهد!

چه باید کرد؟

هم‌اکنون حدود نیمی از محتوای فارسی روی اینترنت به خط فارسی غیراستاندارد نوشته شده است و نیم دیگر به خط فارسی استاندارد. (نسبت این دو را می‌توان با جستجوی کلمه‌های مختلف در گوگل و دیدن تعداد نتایج به دست آمده، تخمین زد.) هم‌اینک استفاده از صفحه‌کلید استاندارد فارسی رو به افزایش است. مثلاً دانشنامهٔ ویکی‌پدیا به زبان فارسی از کاراکترهای کاملاً فارسی در متن مقاله‌هایش استفاده می‌کند. سیستم‌عامل لینوکس هم که استفاده از آن روزبه‌روز بیشتر می‌شود، صفحه‌کلید استاندارد فارسی را به طور پیش‌فرض در خود دارد.

برای اصلاح صفحه‌کلید در ویندوز راه‌های مختلفی وجود دارد. یکی از آسان‌ترین روش‌ها دانلود و اجرای یک فایل از اینترنت است که آرایش صفحه‌کلید استاندارد فارسی را به ویندوز اضافه می‌کند. آن وقت شما می‌توانید صفحه‌کلید خود را روی آرایش جدید تنظیم کنید. برای این کار به صفحهٔ زیر مراجعه کنید و طبق دستورات آن عمل کنید:

ویکی‌پدیا: فارسی‌نویسی

برای راهنمایی بیشتر دربارهٔ اصلاح صفحه‌کلید خود، می‌توانید این صفحه را هم ببینید:

ویکی‌پدیا: خط فارسی را پاس بداریم!

این نکته را هم اضافه کنم که «استاندارد» نامیدن صفحه‌کلیدی که در اینجا معرفی شد، چندان هم بی‌ربط نیست: این کاراکترها  را کنسرسیوم جهانی یونی‌کُد برای زبان فارسی تصویب کرده است و سازمان استاندارد و تحقیقات صنعتی ایران نیز آن را به عنوان استاندارد ملّی ایران (ISIRI 6219:2002) ثبت کرده است.

مراجع

۱. متن استاندارد فنّاوری اطلاعات تبادل و شیوهٔ نمایش اطلاعات فارسی بر اساس یونی‌کُد (فایل PDF) نسخهٔ کامل، ولی غیررسمی استاندارد ملی ایران (ISIRI 6219:2002)

۲. خط فارسی را پاس بداریم، دانشنامهٔ آزاد ویکی‌پدیا


محتویات این صفحه تحت اجازه‌نامهٔ مستندات آزاد گنو در دسترس است.