您现在的位置是:首页 > 行业发展
「干货」阿拉伯语、阿拉伯字母、阿拉伯符号的区别及关联
智慧创新站
2025-03-05【行业发展】79人已围观
简介一、阿拉伯语阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约4亿+。1.分布图示如下2.字符集阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,WindowsCP1256,Unicode等;ISO8859-6WindowsCP1256Unicode说明:1...
一、阿拉伯语
阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约4亿+。
1.分布图示如下
2.字符集
阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,WindowsCP1256,Unicode等;
ISO8859-6
WindowsCP1256
Unicode
说明:
1.ISO8859-6是国际标准化组织内ISO/IEC8859的其中一个8位字符集,供现代阿拉伯语使用,它等同于阿拉伯标准ASMO-708。
2.CP1256是由Microsoft制定的一个8位字符集,主要应用于Dos,Windows系统,其扩展性有限。
3.Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
总结:1,2由于很多阿拉伯语使用的字母都未能支援,故现已被Unicode逐步取代。若要实现阿拉伯语的显示,首要根据平台需求(选择编码方式),否则推荐Unicode方式,便于后期扩展。
二、阿拉伯字母
阿拉伯字母为阿拉伯语的书写形式。除了阿拉伯语,还有其它语言也使用阿拉伯字母,如:波斯语(伊朗)、乌尔都语(巴基斯坦,印度)、普什图语(阿富汗)、哈斯克语(哈萨克)、维吾尔语(维吾尔族)等。每个字母都有唯一对应编码,书写方向从右至左,无大、小写之分,但有印刷体、手写体和艺术体之别,且书写时均有独写与连写之分。
分布图示如下:
扩展补充字母(unicode)
ArabicExted-A
根据字母分类
说明:Unicode针对不通语言或特殊需求,做的一些字符补充。
三、阿拉伯符号
阿拉伯符号即展示形态(或样式),有些字母存在多形态,需根据前后字母,择其形态。很多小语种都存在这种多形态现象,有些符号在矢量字库中甚至没有映射编码。阿拉伯符号主要分如下3种:
1.独立形态(1个符号对应1个编码)
在前面展示的字符图形中的小图片,都属这类符号。
2.含映射编码的独立、连写,合成形态。(1个符号对应1个编码)
在unicode中,包含了阿拉伯文特有的2个编码段。
阿拉伯表達形式A(ArabicPresentationForm-A)
阿拉伯表達形式B(ArabicPresentationForm-B)
说明:根据当前字母(编码)的前后字母(编码),决定当前字母的显示形态(即符号),解决方法:生成点阵信息,建立映射关系。
注意:这些符号的编码不会出现在信息存储或传递中。
3.不含映射编码的独立、连写,合成形态。(符号没有对应编码)
说明:点阵方式,这类符号在某些场景中也会需要显示,不同字体,由于处理方式不同,字符数也会不同,故解决方案亦不一样。解决方法:自定义编码,生成点阵信息,建立映射关系。
建议:要实现这类需求,首要确定字体,再考虑进一步动作。
四、阿拉伯语与其它语言的关系
如西欧国家,德语,法语,西班牙语等,都共用拉丁文字母,但是彼此却各不相同。阿拉伯语与波斯语,乌尔都语等,虽说同使用阿拉伯字母,但使用方法,表达的意思各有不同,甚至都未必同源。参阅如下图述:
总结:一套字库可以支持多种语言,多种语言可以共用字母,但是语言未必能共用。
很赞哦!(157)