Unicode 近日宣布了 14.0 版本的标准,其中包括核心规范、附件和数据文件。此版本新增 838 个字符,共计达 144697 个字符。新增内容还包括 5 个新脚本,目前共计 159 个脚本,最后还增加了 37 个新的 emoji 表情符号。
Unicode 官方中文名称为统一码,是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。14.0 版本中的新脚本和字符增加了对波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦和菲律宾的现代语言组以及非洲和北美的其他语言的支持,包括:
- 阿拉伯文字,包括用于古兰经的敬语和字符,以及用于书写非洲、巴尔干、南亚和东南亚语言的字符
- 历史上的维特库其 (Vithkuqi) 字母,曾经用来书写阿尔巴尼亚语,当前正对其进行现代复兴
- 坦撒 (Tangsa) 字母:用于书写坦撒语,在印度和缅甸使用
- 托托 (Toto) 字母:用于编写印度东北部托托语的字母
- 为扩展 IPA 添加了许多拉丁文脚本
此版本新增加了 37 个表情符号字符, 包括几个用于情感和手势的新表情符号(笑脸、手势、 动物和自然、食物和饮料、交通和活动)。14.0 版更新了五个重要的 Unicode 附件:
- UAX #14,Unicode 换行算法
- UAX #29,Unicode 文本分割
- UAX #31,Unicode 标识符和模式语法
- UAX #38, Unicode Han 数据库 (Unihan)
- UAX #45, U-Source 象形文字
更新了三个重要的 Unicode 规范:
- UTS #10, Unicode Collation Algorithm — 对 Unicode 文本进行排序
- UTS #39,Unicode 安全机制 ——减少 Unicode 欺骗
- UTS #46, Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。详情查看发布公告:http://blog.unicode.org/2021/09/announcing-unicode-standard-version-140.html
Total Page Visits: 562 - Today Page Visits: 2