您现在的位置是:首页 > 行业发展

「干货」阿拉伯语、阿拉伯字母、阿拉伯符号的区别及关联

智慧创新站 2025-03-05【行业发展】79人已围观

简介一、阿拉伯语阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约4亿+。1.分布图示如下2.字符集阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,WindowsCP1256,Unicode等;ISO8859-6WindowsCP1256Unicode说明:1...

一、阿拉伯语

阿拉伯语是联合国六种工作语言之一,主要分布于西亚,北非,使用人口约4亿+。

1.分布图示如下

2.字符集

阿拉伯语针对不同的标准,字符集(编码方式)也不同。例如:ISO8859-6,WindowsCP1256,Unicode等;

ISO8859-6

WindowsCP1256

Unicode

说明:

1.ISO8859-6是国际标准化组织内ISO/IEC8859的其中一个8位字符集,供现代阿拉伯语使用,它等同于阿拉伯标准ASMO-708。

2.CP1256是由Microsoft制定的一个8位字符集,主要应用于Dos,Windows系统,其扩展性有限。

3.Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

总结:1,2由于很多阿拉伯语使用的字母都未能支援,故现已被Unicode逐步取代。若要实现阿拉伯语的显示,首要根据平台需求(选择编码方式),否则推荐Unicode方式,便于后期扩展。

二、阿拉伯字母

阿拉伯字母为阿拉伯语的书写形式。除了阿拉伯语,还有其它语言也使用阿拉伯字母,如:波斯语(伊朗)、乌尔都语(巴基斯坦,印度)、普什图语(阿富汗)、哈斯克语(哈萨克)、维吾尔语(维吾尔族)等。每个字母都有唯一对应编码,书写方向从右至左,无大、小写之分,但有印刷体、手写体和艺术体之别,且书写时均有独写与连写之分。

分布图示如下:

扩展补充字母(unicode)

ArabicExted-A

根据字母分类

说明:Unicode针对不通语言或特殊需求,做的一些字符补充。

三、阿拉伯符号

阿拉伯符号即展示形态(或样式),有些字母存在多形态,需根据前后字母,择其形态。很多小语种都存在这种多形态现象,有些符号在矢量字库中甚至没有映射编码。阿拉伯符号主要分如下3种:

1.独立形态(1个符号对应1个编码)

在前面展示的字符图形中的小图片,都属这类符号。

2.含映射编码的独立、连写,合成形态。(1个符号对应1个编码)

在unicode中,包含了阿拉伯文特有的2个编码段。

阿拉伯表達形式A(ArabicPresentationForm-A)

阿拉伯表達形式B(ArabicPresentationForm-B)

说明:根据当前字母(编码)的前后字母(编码),决定当前字母的显示形态(即符号),解决方法:生成点阵信息,建立映射关系。

注意:这些符号的编码不会出现在信息存储或传递中。

3.不含映射编码的独立、连写,合成形态。(符号没有对应编码)

说明:点阵方式,这类符号在某些场景中也会需要显示,不同字体,由于处理方式不同,字符数也会不同,故解决方案亦不一样。解决方法:自定义编码,生成点阵信息,建立映射关系。

建议:要实现这类需求,首要确定字体,再考虑进一步动作。

四、阿拉伯语与其它语言的关系

如西欧国家,德语,法语,西班牙语等,都共用拉丁文字母,但是彼此却各不相同。阿拉伯语与波斯语,乌尔都语等,虽说同使用阿拉伯字母,但使用方法,表达的意思各有不同,甚至都未必同源。参阅如下图述:

总结:一套字库可以支持多种语言,多种语言可以共用字母,但是语言未必能共用。

很赞哦!(157)