Unicode: Di sebalik tirai

Konsortium Unicode merayakan ulang tahun ke -25nya tahun lepas. Sebenarnya walaupun semua kerja Unicode tidak dapat memastikan teks dari bahasa di seluruh dunia bekerja – kebanyakan kita tahu Unicode sebagai kumpulan yang meluluskan emojis baru.
Apa yang mungkin tidak begitu jelas adalah mengapa konsortium besar diperlukan, atau kerumitan tersembunyi Unicode. Atau bagaimana emojis muntah yang ditunjukkan dalam kartun XCKD di atas sudah dianggap “sah (tetapi tidak disyorkan)”.

Mark Davis, pengasas bersama dan presiden UNICODE semasa, telah berusaha untuk menjelaskan bagaimana emoji sesuai dengan Unicode dalam gambaran keseluruhan peringkat tinggi ini yang melihat apa yang Unicode, dan bagaimana jawatankuasa kecil Unicode emoji (“emoji sc”) ia.
Davis mencatatkan bahawa emojis hanya membuat sebahagian kecil daripada jumlah aksara dalam standard unicode.Anda hampir tidak boleh membuatnya dalam carta ini:

Watak sahaja tidak menceritakan setengah cerita. Sejumlah glyph perlu menggabungkan apabila dipaparkan dalam pesanan atau kombinasi tertentu.

Gabungan yang akan menjadi biasa kepada banyak adalah bagaimana nada kulit emoji dilaksanakan.
Kerja -kerja ini dengan mengesan apabila watak pengubahsuaian dipaparkan selepas emoji manusia, seperti ๐Ÿ‘ง girl. Ini menggabungkan pada platform yang disokong untuk menunjukkan emoji tunggal:

Pelaksanaan yang lebih rumit melibatkan menyertai dua atau lebih emojis bersama -sama ke dalam urutan emoji ZWJ.
Ini digunakan untuk membuat profesion seperti hakim wanita ๐Ÿ‘ฉโ€โš–๏ธ. Emoji ini dicipta menggunakan ๐Ÿ‘ฉ wanita dan โš–๏ธ Emojis skala keseimbangan dalam urutan.
A “ZWJ” (sifar lebar joiner) berdiri di antara kedua -dua emojis ini, dan merupakan gam yang tidak kelihatan yang bergabung dengan pelbagai emojis menjadi satu (di mana disokong).

Lain -lain jenis urutan ZWJ menyenaraikan emoji sedia ada seperti detektif ๐Ÿ•ต๏ธ dengan simbol jantina โ™€๏ธ tanda wanita ditambah selepas itu.
Urutan ZWJ jenis ini biasanya digunakan jika emoji sudah ada. Sebagai contoh: pelari, surfer, atau banyak gerak isyarat.

Dan ya, anda boleh menggabungkan pengubah dan ZWJS untuk membuat urutan yang lebih lama.

Unicode tidak mengawal urutan ZWJ dengan cara yang sama seperti emojis baru yang memerlukan titik kod mereka sendiri.
Unicode disyorkan urutan yang harus disokong untuk konsistensi silang platform. Walau bagaimanapun vendor bebas untuk menggabungkan mana -mana emoji dengan yang lain, seperti yang mereka lihat patut.
Microsoft mempunyai enam kucing Ninja yang terdapat di Windows yang bukan sebahagian daripada senarai yang disyorkan Unicode. ๐Ÿฑ muka kucing dan ๐Ÿš€ roket digabungkan pada Windows 10 untuk menunjukkan emoji untuk ๐Ÿฑโ€๐Ÿš€ astro kucing.
Astro Cat adalah sah (kerana ia menggunakan struktur urutan yang betul) tetapi tidak disyorkan seperti profesion dan jantina lain.

XKCD mencadangkan bahawa muntah harus menjadi watak pengubah untuk membuat “koboi muntah”.
Davis menegaskan bahawa muka topi koboi ๐Ÿค  ๐Ÿค  dapat digabungkan dengan ๐Ÿคฎ wajah muntah untuk membuat urutan ZWJ yang sah:

Jenis urutan lain wujud untuk emoji, termasuk urutan bendera, urutan tag dan urutan keycap. Anda harus menyemak keseluruhan set slaid untuk melihatnya dengan lebih terperinci.
Akhirnya, lihat garis masa (semasa, 2017) untuk bagaimana emoji baru dilahirkan:

๐Ÿšจ Kemas kini April 2020: Garis masa semasa untuk bagaimana emoji baru dicipta telah terjejas dengan ketara oleh pandemik Covid-19. Anda boleh membaca lebih lanjut mengenai jadual yang disemak semula untuk 2020 dan seterusnya di sini.
Sudah tentu Unicode masih banyak yang perlu dilakukan di luar sokongan emoji:

“Terdapat kira-kira 7,000 bahasa manusia yang hidup, dengan pelbagai tahap daya hidup. Kurang daripada 100 bahasa ini disokong dengan baik di komputer, telefon bimbit, dan peranti lain, sementara semua risiko lain yang kurang bernasib baik”

Unicode mempunyai program mengamalkan watak. Dana yang dibangkitkan dari pengangkatan pergi ke arah penyelidikan untuk menyokong bahasa -bahasa yang kurang bernasib baik ini.
Lebih:

Unicode Emoji oleh Mark Davis
Unicode mengamalkan watak
Emojis Baru untuk 2017
Hacks emoji yang menyeronokkan

Search Emojis: