一覧に戻る
このページの最下段に移る
JIS X 0221:2007
国際符号化文字集合(UCS)
2014改正●2007制定
番号
用語
定義
対応英語
4.1
基底文字
結合文字でない図形文字。
注記1 図形文字の多くは,基底文字である。基底文字を表示するときに,文脈に依存した様々な形を用いたり,合字(ligature)の一部にしたりすることを,結合文字でないということが排除するものではない。
注記2 基底文字は,先行する文字と図形的に結合しないことが普通だが,幾つかの複雑な書記系では例外がある。
base character
4.2
基本多言語面●BMP
UCS符号空間の面00。
basic multilingual plane●BMP
4.3
ブロック
共通の特性をもつ文字の集合(例えば,用字)が割り当てられた符号位置の連続する範囲。ブロック同士は,重なり合わない。ブロック中には,文字が割り当てられていない符号位置が一つ以上あってもよい。
block
4.4
基準形式
この符号化文字集合の文字を,UCS符号空間中の一つの符号位置を用いて表現する形式。注記 基準形式を,UCS符号位置と一つ以上の符号単位との関係を意味する符号化形式と混同してはならない(4.23参照)。
canonical form
4.5
文字
データの構成,制御又は表現に用いる要素の集合の構成単位。注記 図形記号は,一つ以上の符号化文字の列によって表現されることもある。
character
4.6
文字境界
符号化文字の最後の符号単位と次に続く符号化文字の最初の符号単位との間の(符号単位列の)境目。
character boundary
4.7
符号表
UCS符号空間のある範囲に割り当てた符号化文字群の表現を,長方形に配置して示したもの。
code chart●code table
4.8
符号化文字
文字と符号位置とを結びつけたもの。
coded character
4.9
符号化文字集合
符号化文字の集合。
coded character set
4.10
符号位置
UCS符号空間中の値。
code point●code position
4.11
符号単位
処理又は交換用の符号化テキストの単位を表現できる,最小のビット組合せ。注記 符号単位の例として,UTF-8符号形式で用いるオクテット(8ビットの符号単位),UTF-16符号形式で用いる16ビットの符号単位及びUTF-32符号形式で用いる32ビットの符号単位がある。
code unit
4.12
符号単位列●CCデータ要素●符号化文字データ要素
符号化文字集合に関する特定された一つ以上の規格に適合して,符号単位の並びを構成するように仕様決めされた,情報交換の単位。
注記1 この列は,どのような種類の符号位置に対応付けられる符号単位をも含むことができる。
注記2 この規格では,この規格の以前の版と異なり,もはや実装水準を用いない。その符号単位列の定義は,以前の実装水準3(制限のない水準)に対応する。従来,水準1又は2として知られていた符号単位列の定義は,廃止された。これらの従来の版との互換性を維持するために,JIS X 5605及びJIS X 5606のような規格の中の符号化表現を識別する文脈においては,その実装の方針は,“実装水準3”として参照できる。附属書N参照。
code unit sequence●CC-data-element●coded-character-data-element
4.13
組
番号及び名前が付けられたものの集合。
注記1 拡張組(4.25参照)でない組は,符号位置が一つ以上の識別された範囲に含まれるような符号化文字だけからなる集合である。
注記2 識別された範囲のいずれかに文字の割り当てられていない符号位置があり,将来この規格の改正によってそのどこかの符号位置に追加文字が割り当てられたときには,組のレパートリが変わる。しかし,組の番号及び名前は,この規格の将来の版においても変えないことを意図している。
collection
4.14
結合文字
一般分類の値が,Spacing Combining Mark (Mc),Non Spacing Mark (Mn)又はEnclosing Mark (Me)のいずれかである文字。注記 結合文字は,先行する,結合文字でない図形文字と組み合わせるか,又は結合文字ではない文字の後に結合文字の列が続いた形のものと組み合わせることを意図している(4.17参照)。
combined character
4.15
結合クラス
結合文字の図形文字に対する作用及び結合文字の並びの中での基準順序を決定するために,個々の結合文字に対応付けた値。
combining class
4.16
互換用文字
主として既存の符号化文字集合との互換性のため,この規格に符号化文字として含めた図形文字。
compatibility character
4.17
合成列
基底文字とそれに続く一つ以上の結合文字,ZERO WIDTH JOINER又はZERO WIDTH NON-JOINERとからなる図形文字の列(4.14参照)。
注記1 合成列からなる図形記号は,通常,その合成列を構成する各文字の図形記号の組合せからなる。
注記2 合成列は,この規格のレパートリとして符号化されていない文字を表現するために用いることができる。
注記2A ZERO WIDTH JOINER及びZERO WIDTH NON-JOINERについては,F.1.1を参照。
composite sequence
4.18
制御文字
その符号化表現が一つの符号位置からなる制御機能。注記 制御文字は,DELETE,FORMFEED,ESCなどの名前のようなものを用いて呼ぶことがあるが,これらの呼び名は,正式な文字の名前ではない。JIS X 0211が制御文字に対応させている長い名前の一覧は,箇条11を参照。
control character
4.19
制御機能
符号単位列によって表現され,データの記録,処理,伝送又は解釈に影響を及ぼす動作。
control function
4.20
分解写像
一つの文字を,基準等価又互換等価な一つ以上の文字の一つの列に写す写像。
decomposition mapping
4.21
既定状態
状態が明示的に指定されていないときに,想定する状態。注記 F.2.2〜F.2.4参照。
default state
4.22
装置
符号単位列内の符号化情報を送信及び/又は受信できる情報処理機器の一部分。注記 装置は,通常の入出力機器であってもよく,応用プログラム又はゲートウェイ機能のような処理であってもよい。
device
4.23
符号化形式
UCSの文字を表す個々のUCS符号位置を,その符号化形式が用いる一つ以上の符号単位によって表す方法を決定するもの。注記 この規格は,符号化形式としてUTF-8,UTF-16及びUTFー32を規定する。
encoding form
4.24
符号化方式
符号化形式を構成する符号単位をオクテットの並びに直列化する方法の規定。注記 UCSの符号化方式には,符号化形式と同じ呼び名をもつものがある。しかし,符号化方式の呼び名と符号化形式の呼び名とは,異なる文脈で用いる。UCSの符号化形式は,メモリ上及び応用インタフェースでのテキストデータの表現に言及する。UCSの符号化方式は,オクテットの並びに直列化されたテキストデータに言及する。
encoding scheme
4.25
拡張組
正規形NFCである符号位置の列を含んでもよい組。
注記1 3 LATIN EXTENDED-A,4 LATIN EXTENDED-B,15 ARABIC EXTENDEDなどのように“extended”(拡張)という語を名前に含む組が多数あるが,組の名前に“extended”という語が含まれていることとその組が拡張組であることとの間には,関係がない。
注記2 正規形NFCについては,箇条21参照。
注記3 符号位置の列は,名前付きUCS列識別子(箇条25参照)によって参照される。
extended collection
4.26
確定組
識別された範囲に含まれる全ての符号位置に文字が割り当てられている組であって,この規格の将来の版においても(その組に含まれるレパートリが)変わらないことを意図しているもの。
fixed collection
4.27
書式文字
周囲の文字の配置又は処理に作用することを主な機能とする文字。注記 書式文字は,通常,それ自身の可視化表現をもたない。
format character
4.28
一般分類●GC
字,句読点,記号類などの文字の重要な分類を決定するために,個々のUCS符号位置に割り当てた値。
注記1 実際の値は,ユニコード標準の2文字省略形を用いた一般分類特性として定める(箇条3に示す最新のユニコード標準の一般分類を参照。)。
注記2 最初の文字が同一であるような全ての一般分類をまとめて扱うときには,一般分類の値の最初の文字だけを用いて表すことがある。例えば.“L”は,“Lu”,“Ll”,“Lt”,“Lm”及び“Lo”という字に関する一般分類の全体を表す。
General Category●GC
4.29
図形文字
制御機能でも書式文字でもない文字であって,通常は,手書き,印字又は表示の可視化表現をもつもの。
graphic character
4.30
図形記号
図形文字又は合成列の可視化表現。
graphic symbol
4.31
上位サロゲート符号位置
UTF-16で用いるために保留されているD800〜DBFFの範囲の符号位置。
high-surrogate code point
4.32
上位サロゲート符号単位
UTF-16でサロゲートペアの先頭の符号単位として用いるD800〜DBFFの範囲の16ビットの符号単位。注記 9.2参照。
high-surrogate code unit
4.33
誤った形式の符号単位列
UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合しないもの。例 対をなさないサロゲート符号単位は,誤った形式の符号単位列の例である。
ill-formed code unit sequence
4.34
誤った形式の符号単位列部分集合
ある符号単位列の空でない部分集合であって,その符号単位列の,正しい形式の符号単位の最小列であるようなサブセットに属する符号単位を含まないもの。注記 誤った形式の符号単位列部分集合は,正しい形式の符号単位の最小列と重ならない。(★「部分集合」と「サブセット」★)
ill-formed code unit sequence subset
4.35
交換
通信手段又は交換可能な媒体によって,ある利用者から他の利用者に文字の符号化データを転送すること。注記 交換は,データを直列化し,UCSの符号化方式を用いる。
interchange
4.36
相互動作
それぞれ異なる符号化文字集合を採用している二つ以上のシステム間で,意味のある文字符号化データの交換ができるようにすること。注記 二つの符号の間での変換を含むこともある。
interworking
4.37
ISO/IEC 10646-1
この規格の対応国際規格が以前に部編成であったときに,体系及び基本多言語面(BMP)を規定していた部。
注記1 ISO/IEC 10646の第1部とも呼ぶ。
注記2 ISO/IEC 10646-1には,第1版と第2版とがあった。
ISO/IEC 10646-1
4.38
ISO/IEC 10646-2
この規格の対応国際規格が以前に部編成であったときに,追加多言語面(SMP),追加漢字面(SIP)及び追加特殊用途面(SSP)を規定していた部。
注記1 ISO/IEC 10646の第2部とも呼ぶ。
注記2 ISO/IEC 10646-2には,第1版だけがあった。
ISO/IEC 10646-2
4.39
下位サロゲート符号位置
UTF-16で用いるために保留されているDC00〜DFFFの範囲の符号位置。
low-surrogate code point
4.40
下位サロゲート符号単位
UTF-16でサロゲートペアの末尾の符号単位として用いるD800〜DBFFの範囲の16ビットの符号単位。注記 9.2参照。
low-surrogate code unit
4.41
正しい形式の符号単位の最小列
正しい形式の符号単位列であって,一つのUCSスカラ値に写像されるもの。
minimal well-formed code unit sequence
4.42
鏡像文字
右から左に配置するテキストにおいて,その像が水平に反転される文字。
mirrored character
4.43
オクテット
8ビットの符号単位。注記 この規格では,オクテットの値は,16進数を用いて00〜FFとして表記する(附属書K参照)。
octet
4.44
面
UCS符号空間の一部分であって,65 536の符号位置からなるもの。注記 UCS符号空間は,17の面からなる。
plane
4.45
表示
図形記号を書いたり,印字したり,画面表示したりする処理。
presentation
4.46
表示形
(一部の言語の用字を表示する際に,)他の文字との相対的な位置に依存して文字を表現する図形記号の形。
presentation form
4.47
私用面
この符号化文字集合中の面であって,この規格で文字を規定しない面。注記 面0F及び面10が私用面である。
private use planes
4.48
レパートリ
符号化文字集合で表現する文字の指定された集合。
repertoire
4.49
区
面の一部であって,256の倍数の符号位置から始まり256個の連続する符号位置からなる,00〜FFの数値によって識別されるもの。
row
4.50
用字
一つ以上の言語の表記形で使用する図形文字の集合。
script
4.51
追加面
UCS符号空間の面00以外の面。注記 追加面は,基本多言語面に割り当てていない文字を収容する。
supplementary plane
4.52
用字及び記号のための追加多言語面●SMP
UCS符号空間の面01。
Supplementary Multilingual Plane for scripts and symboIs●SMP
4.53
追加漢字面●SIP
UCS符号空間の面02。
Supplementary Ideographic Plane●SIP
4.54
追加特殊用途面●SSP
UCS符号空間の面0E。
Supplememtary Special-purpose Plane●SSP
4.55
サロゲートペア
二つの16ビット符号単位からなる一文字の表現であって,ペアの最初の値が上位サロゲート符号単位であり,二番目の値が下位サロゲート符号単位であるもの。
surrogate pair
4.56
第三漢字面●TIP
UCS符号空間の面03。
Tertiary Ideographic Plane●TIP
4.57
UCS符号空間
UCSの文字のレパートリを割り当てるために用いる,0〜10FFFF(16進数)の整数からなる符号空間。
UCS codespace
4.58
UCSスカラ値
上位サロゲート符号位置及び下位サロゲート符号位置を除く任意のUCS符号位置。
UCS scalar value
4.59
対をなさないサロゲート符号単位
符号単位列の中の符号単位であって,次のいずれかであるもの。
− 上位サロゲート符号単位であって,下位サロゲート符号単位が直後にないもの。
− 下位サロゲート符号単位であって,上位サロゲート符号単位が直前にないもの。
unpaired surrogate code unit
4.60
利用者
装置が提供するサービスを使う人又はそれに代わるもの。注記 “装置”が符号変換機又はゲートウェイ機能の場合,これは,応用プログラムのような処理であってもよい。
user
4.61
正しい形式の符号単位列
UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合し,誤った形式の符号単位列部分集合を含まないもの。
well-formed code unit sequence
一覧に戻る
このページのトップに戻る