特殊文字

曖昧さ回避 この項目では、文字コードとしての特殊文字について説明しています。
  • HTMLで文字を指定する方法については「文字参照」をご覧ください。
  • ウィキペディア日本語版で、表示や入力に工夫が必要な文字については「Help:特殊文字」をご覧ください。
  • その注意をするテンプレートについては「Template:特殊文字」をご覧ください。

特殊文字(とくしゅもじ、special character)とは、情報処理において文字集合に含まれる文字図形文字)として扱われるもののうち、伝統的な言語学でいう「文字」(表音文字表意文字)に入らないものであって、しばしば通常の文字とは異なる特殊な扱いをされるものをいう。

概要

多くの文字コードの規格においては「特殊文字」は以下のいずれかの方法またはその両方の併記で定められている。

  • それぞれの文字コード規格において定められている特殊文字に属する個々の文字または「○○記号」といった文字のグループを列挙する
  • それぞれの文字コード規格において定められている図形文字のうち特殊文字にならないもの以外のものとする。

個々の文字コードの規格から独立して定義されている情報処理用語の規格においては、特殊文字とは「図形文字のうち、数字、表音文字でなく、また概ね表意文字でもない文字のことをいう」とされている[1]

特殊文字に含まれるもの

伝統的な言語学で扱われてきた約物句読点などの学術記号(θ, π, Σ 等)、単位記号 (㎏, ㍑ 等)・通貨記号($, € 等)・国際音声記号 (θ, ǝ等)、といったさまざまな記号類、矢印罫線素片、ハートやダイヤなどのトランプマーク絵文字といったものも含まれる。

見解の分かれるもの

制御文字に含められることもある空白(ないし間隔)は図形文字とされるとき特殊文字に含める場合も含めない場合(そのような場合には、空白はそれだけで特殊文字と並ぶ一つのカテゴリーとされる)もある。

情報処理用語規格の厳密な定義では「数字及び表音文字ではない」とされているほか「概ね表意文字でもない」とされている。表意文字についてだけ「概ね」とされているのは、たとえば「」については、ほぼ同じ形のものが漢字と非漢字の両方に配置されていることもありながら表意文字と同じように意味を持つような事例があるためである。

そのほかの特殊文字

一部のコンピュータの環境やプログラムやシェルスクリプトの中などの一部のソフトウェアにおいて、制御機能や正規表現などに関連して特別な機能を持たされている(ワイルドカードなど)ために、ファイル中に存在してもそのままの形では表示されず、そのまま表示するため要のある文字を特殊文字と呼ぶことがある[要出典]。 コロン(:)やクエスチョンマーク(?)、アスタリスク(*)、バックスラッシュ(\,\)など。

このほか一部のコンピュータの環境においてハードの関係で文字化けを起こすため、表示、入力、保存などが不可能かまたは通常とは設定を変えたり特定のフォントファイル等の通常ではインストールされていないファイルを入れたりするといった特別な工夫が必要な文字を特殊文字とよぶことがある[要出典]以下のような文字がこの意味での「特殊文字」とされる。ウィキペディアにおける特殊文字とはこの意味での特殊文字である[独自研究?]

脚注

  1. ^ JIS X 0004:2002 「情報処理用語(データの構成)」p. 5
日本語用の
文字コード
JIS規格
符号化文字集合
文字符号化方式
文字一覧
JIS以外の公規格
メーカーの規格
符号化文字集合
文字符号化方式
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
文字符号化方式
文字一覧
TRONコード
日本語以外用の
文字集合
初期の文字コード
ISO/IEC 8859
書誌用
  • ISO 5426
  • ISO 5426-2
  • ISO 5427
  • ISO 5428
  • ISO 6438
  • ISO 6861
  • ISO 6862
  • ISO 9036
  • ISO 10585
  • ISO 10586
  • ISO 10754
  • ISO 11822
  • ANSEL
  • MARC-8
国家標準
EUC
ISO/IEC 2022
  • ISO/IEC 2022 CN
  • ISO/IEC 2022 KR
  • CCCII
MacOS
コードページ
  • Macintosh Standard Roman Character Set
  • アラビア語
  • CentralEurRoman
  • EUC-CN
  • Big5
  • クロアチア語
  • キリル
  • デーヴァナーガリー
  • Dingbats
  • ペルシャ語
  • ギリシア語
  • グジャラート語
  • グルムキー
  • ヘブライ語
  • アイスランド語
  • EUC-KR
  • ルーマニア語
  • MacSymbol
  • TIS-620
  • トルコ語
  • ウクライナ語
DOS
コードページ
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • KOI8
  • Kamenicky
  • Mazovia
  • MIK
  • Iran System
Windows
コードページ
EBCDIC
コードページ
  • 37
  • 293(英語版)
  • 300(英語版)
  • 310(英語版)
  • 351(英語版)
  • 353(英語版)
  • 355(英語版)
  • 357(英語版)
  • 358(英語版)
  • 359(英語版)
  • 360(英語版)
  • 819
  • 930(英語版)
  • 933(英語版)
  • 939(英語版)
  • 1364(英語版)
  • 1390(英語版)
  • 1399(英語版)
  • 8859(英語版)
その他標準
記号用
プラットフォーム
固有
  • ATASCII
  • CDC display code
  • DEC Radix-50
  • Fieldata
  • GSM 03.38
  • HP roman8
  • PETSCII
  • TI calculator character sets
  • ZX Spectrum character set
ソフトウェア
区分け
概念
関連トピック
カテゴリ カテゴリ
典拠管理データベース: 国立図書館 ウィキデータを編集
  • ドイツ
  • 表示
  • 編集
スタブアイコン

この項目は、文字文字学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(P:文字)。

  • 表示
  • 編集