综合百科

超全阿斯克码表大公开,轻松掌握编码秘诀!

然而,在长期的写作实践中,差评君也发现了一些单纯依靠打字速度无法解决的问题,例如输入那些在电脑编码体系中根本不存在的字。

这里提到的字,可能有些读者朋友觉得非常熟悉,也有些读者朋友可能从未见过,它就是“biáng”——也就是“biáng biáng面”中那个独特的字。

每当感到饥饿时,总会想起这道美味的陕西特色面食▼

然而,“biáng”字由于仅用于表示著名的陕西面食,使用频率极低且过于生僻,导致电脑的字符编码库迟迟未能将其收录,因此我们无法在电脑上正常输入这个字。

为了验证这一点,大家可以尝试在评论区输入“biáng”字,差评君保证,绝大多数情况下都无法成功。

不过,最近网络上流传着一个消息:Unicode组织已经将“biáng”字纳入了“CJK统一表意汉字”的扩展G区中,并从今天起正式生效。

这样一来,我们是否能够在电脑上输入“biáng”字了呢?陕西的朋友们是否可以在微信中教别人书写“biángbiáng面”了呢!

然而,事情并非如此简单。我们需要明确一点:电脑中能够显示的字符,并不意味着输入法就能够识别并输入。

换句话说,电脑的字符编码和输入法并不完全一致。

要深入理解这个问题,差评君需要先向大家解释一下电脑中文字编码的原理。

众所周知,现代计算机是由美国人发明的,为了方便处理文字,他们为26个英文字母设定了一套编码标准。

简单来说,就是规定电脑中的第一个字符是“ A ”,第二个字符是“ B ”。

不过,这两个字符在电脑中的表示形式是二进制的“ 0100 0001 ”。

这就是著名的ASCII码——即美国信息交换标准代码。ASCII码表在当时的计算机领域的重要性不亚于现在的九九乘法表,它是计算机处理文字的基础。

然而,ASCII码也存在一个问题:由于当时硬盘容量有限,即使1MB的存储空间也被认为相当不错,因此整个ASCII码表只能定义256个字符。

所以,当电脑逐渐走向世界,那些不使用英语的国家的人们开始感到不满——ASCII码表根本没有为其他语言预留足够的空间。

如果我们仍然使用ASCII码表,那么电脑中能够使用的汉字数量将非常有限(会缺少很多常见字符)。

面对这种情况,各个国家开始制定自己的文字编码标准,其中比较著名的有西欧的ISO-8859系列标准、微软的Windows-12xx系列标准,以及中国的GB 2312文字编码标准。

虽然这些不同的文字编码标准解决了不同语言文字在电脑中存储的问题,但它们也带来了一个新的问题:不同标准之间的兼容性差。就好像在没有USB充电口之前,功能机和山寨机各自使用着不同的充电头,谁也不兼容谁。

为了解决这个问题,就像充电宝上附带了好多种插头的万能线一样,电脑上的排版软件需要集成尽可能多的文字编码规范,才能自动识别文档的文字编码,并正确显示字符。

然而,这种方法也不是长久之计。如果大家都使用统一的USB线该多好啊。

于是,在上世纪80年代,万国码(Unicode)组织在微软、苹果、Adobe、惠普、IBM等科技巨头的推动下成立了。

ASCII码的不足之处在于序列位数不足,只能存储256个字。而Unicode码则直接将序列位数提升到了16位。

如果从“ 0000 0000 0000 0000 ”开始,到“ 1111 1111 1111 1111 ”结束,将所有可能的组合都填满字符,那么可以存储65,536个字。

这还不算完,Unicode码后来又将字符编码扩展到了32位,40多亿个字的存储空间不仅能够容纳全世界的文字,甚至可能在未来的某一天,当人类发现外星文明时,这个空间依然足够使用。

资源丰富之后,Unicode码在过去的20年里不仅陆续收录了全世界所有主要的文字,还顺手将古代汉字以及象形字等也收录了进来。

《康熙字典》和《四库全书》都在收录之列▼

我们平时使用的Emoji表情,也属于Unicode文字编码的一部分:

在Unicode内部,还有一个专门的小组,负责与表情设计师讨论下一次应该增加哪些新的表情。

收录的内容既丰富又全面,操作系统和文字排版工具自然就不再需要与文字编码进行繁琐的斗争,反正选择Unicode编码就对了。

而这次所谓的Unicode 13版本更新中,除了“biáng”字之外,还新收录了4,939个生僻的汉字。

反正这些生僻字,没一个认识的 ▼

( 这一段没有出Bug )

其实,差评君在这段文字的左上角已经复制了一个“biáng”字,但现在可能只能看到一个“口”字,或者一个黑底的大问号。

虽然从今天起,Unicode 13标准已经正式发布,但我们还无法立即使用。

这是因为文字编码是内置于操作系统中的,因此今天只是意味着厂商们可以开始着手集成,距离我们正式体验还有一段距离。

等到大家更新完系统后,如果发现那个“biáng”字可以正常显示了,就代表着操作系统已经更新到了最新的13.0版本Unicode文字编码。

然而,即使是这样,这个“biáng”字依然无法被我们输入。

因为在我们的拼音规范中,没有“biáng”的拼音,权威字典中也没有收录这个字。

实际上,“biáng”是由“bi”(读作bai)和“áng”两个音节组合而成的合音,属于关中地区的方言发音,不能单独作为一个拼音来使用,因此无法被拼音输入法输入。

而“biáng”字的性质与“招财进宝”类似,属于民间为了这个发音而创造的一种臆造字(野字)。

此外,“biáng”字本身在陕西的不同地区存在较大的差异,不同的地区有着不同的写法,如果把某一种写法收录进字典,其他地区的朋友可能都不会同意,因此干脆不费这个劲,让它在民间继续流传。

孔乙己,你知道“biáng”有几种写法吗?▼

所以,即使以后电脑中可以正常显示“biáng”字,我们也依然无法通过拼音输入法输入它,只能到百科等地方复制粘贴。

不过,今年也有陕西民俗学家在推动“biáng”字进入字典的事情,有了Unicode的先例在前,也许再过几年,这件事真的能够迎来一个大的反转。

到那时,我们或许就能正常地用“biáng”字进行输入了。

如果你看完了这篇文章,觉得有所收获,但又不太明白其中的奥妙,那就点个赞,加个关注再走吧!!