موفقیت یونی‌کُد در یکپارچه نمودن کدبندی کاراکترها سبب استفاده‌ی گسترده‌ در جهانی‌سازی و بومی‌سازی نرم‌افزارها شده‌است. امروزه اکثر شرکت‌های بزرگ دنیای کامپیوتر از این استاندارد استفاده می‌کنند و همچنین می‌توان گفت که تقریبا تمام برنامه‌های کاربردی جدید با این استاندارد کدگذاری شده‌اند. گسترش استاندارد یونی‌کُد موجب شده فرایند ایجاد وبسایت‌ها و برنامه‌های فارسی زبان بسیار آسان‌تر و کم هزینه‌تر باشد تا تمامی فارسی زبان‌ها هم بتوانند در دنیای اینترنت مطالب خود را عرضه کنند.

همانطور که در مطلب “یونی‌کُد چیست؟” گفته شد هر کاراکتری اعم از اعداد و حروف، یک نقطه کد منحصربه‌فرد در یونی‌کُد دارد. در استاندارد یونی‌کُد نقطه کدهای زبان فارسی و عربی به دلیل تشابه در رسم الخط در یک مجموعه یا بلاک Block قرار داده شده‌اند. نقطه کدهای U+0600 الی U+06FF مربوط به بلاک عربی و فارسی می‌باشد. این لیست را می‌توانید از “اینجا” دانلود و مشاهده کنید. از آنجا که نقطه کدهای زبان فارسی با نقطه کدهای عربی ترکیب شده‌اند در این مطلب به صورت اختصاصی نقطه کدهای زبان فارسی را بررسی و لیست می‌نماییم.
ابتدا نکاتی در مورد زبان فارسی را یادآوری می کنیم:
اساس الفبای فارسی با الفبای عربی یکی است، اما الفبای فارسی دارای چهار حرف است که واج‌های متناظر آن‌ها در عربی وجود ندارد، از آن طرف «ة» (تاء مربوط) در الفبای فارسی وجود ندارد. یک خوش‌نویس به نام خواجه ابولمال، سه حرف “پ”، “ژ” و “چ” را به الفبای عربی اضافه کرد و حرف “گ” نیز پس از چندی دگرگونی، به شکل کنونی درآمد.
برخی از حروف فارسی با حروف متناظر خود در عربی متفاوت هستند؛ مثلاً حرف «ک» در فارسی در حالت پایانی یا به‌طور تنها، با سرکش نوشته می‌شود درحالی‌که این حرف در عربی در این دو حالت بدون سرکش به صورت «ك» نوشته می‌شود. همچنین حرف «ی» در حالت پایانی در فارسی بدون نقطه است، اما در عربی با دونقطه در پایین («ي») نوشته می‌شود.
همزه (ء) در میان حروف سی‌ودو گانه‌ی الفبای فارسی شکلی از ملحقات حرف «الف» (صامت) است. شکل جدای آن (ء) و در حالت‌های گوناگون با ترکیب دیگر اشکال به صورت (آ - أ - ئ - ؤ) نوشته می‌شود. برای اطلاعات بیشتر به مطلب “املای درست همزه در فارسی” مراجعه نمایید.
حروف فارسی به ترتیب زیر در استاندارد یونی‌کُد وجود دارند:

حرفنقطه کدتوضیحات
ءU+0621Arabic Letter Hamza
آU+0622Arabic Letter Alef with Madda Above
أU+0623Arabic Letter Alef with Hamza Above
ؤU+0624Arabic Letter Waw with Hamza Above
إU+0625Arabic Letter Alef with Hamza Below
ئU+0626Arabic Letter Yeh with Hamza Above
اU+0627Arabic Letter Alef
بU+0628Arabic Letter Beh
پU+067EArabic Letter Peh
تU+062AArabic Letter Teh
ثU+062BArabic Letter Theh
جU+062CArabic Letter Jeem
چU+0686Arabic Letter Tcheh
حU+062DArabic Letter Hah
خU+062EArabic Letter Khah
دU+062FArabic Letter Dal
ذU+0630Arabic Letter Thal
رU+0631Arabic Letter Reh
زU+0632Arabic Letter Zain
ژU+0698Arabic Letter Jeh
سU+0633Arabic Letter Seen
شU+0634Arabic Letter Sheen
صU+0635Arabic Letter Sad
ضU+0636Arabic Letter Dad
طU+0637Arabic Letter Tah
ظU+0638Arabic Letter Zah
عU+0639Arabic Letter Ain
غU+063AArabic Letter Ghain
فU+0641Arabic Letter Feh
قU+0642Arabic Letter Qaf
کU+06A9Arabic Letter Keheh
گU+06AFArabic Letter Gaf
لU+0644Arabic Letter Lam
مU+0645Arabic Letter Meem
نU+0646Arabic Letter Noon
وU+0648Arabic Letter Waw
هU+0647Arabic Letter Heh
یU+06CCArabic Letter Farsi Yeh

اعداد فارسی نیز به ترتیب زیر در استاندارد یونی‌کُد وجود دارند:

عددنقطه کدتوضیحات
۰U+06F0Extended Arabic-Indic Digit Zero
۱U+06F1Extended Arabic-Indic Digit One
۲U+06F2Extended Arabic-Indic Digit Two
۳U+06F3Extended Arabic-Indic Digit Three
۴U+06F4Extended Arabic-Indic Digit Four
۵U+06F5Extended Arabic-Indic Digit Five
۶U+06F6Extended Arabic-Indic Digit Six
۷U+06F7Extended Arabic-Indic Digit Seven
۸U+06F8Extended Arabic-Indic Digit Eight
۹U+06F9Extended Arabic-Indic Digit Nine