[net.internat] Extended character sets -- tabulation

jhenry@randvax.UUCP (Jim Henry) (02/22/86)

At the end of this message is a tabulation of information I have been
compiling about Latin characters, common encodings, and their usage by
language.  I think I have gone about as far as I can on my own (I speak
only American :( ).  I would appreciate it if those who have some
expertise in any portion of the material presented would advise me of any
errors of commision or omission.  Since I expect there will be more than a
few, please mail the errata to me and I will revise the table and repost
it.  Based on my investigations to date, I also expect that there will
some debatable issues.  If at all possible please furnish an example,
reference, statement of grammatical rule or whatever with any correction
so I have something to go on in the event of conflicting opinions.

Hopefully the tables will be pretty self-explanatory.  I tried to construct
them so it is easy to use the Unix tools to select and rearrange
information to meet a wide variety of needs.

I have used PostScript names for the graphic being represented if one
exists.  PostScript is a page description language which is used in the
Apple LaserWriter and other printers.  The reference book is PostScript
Language Reference Manual by Adobe Systems Inc., Addison-Wesley ISBN
0-201-10174-2.  I have invented some additional names which are flagged
with a leading colon (:).

The second column contains a suggested two character sequence that might be
used to indicate the symbol on an unextended ASCII device. Example: N\o"el,
where \ indicates a compose sequence (using VT220 lingo).  The character
codes are in hexadecimal.  I apologize in advance for this and every other
thing I have done that offends someone somewhere.

Here are some additional notes and some questions:

The graphic representation of the standard ASCII characters hex 27 and 60
are particularly confusing.  There seem to be five distinct graphic symbols
in the "single quote-like family" as seen by the PostScript names below.
In PostScript output the quoteright and quoteleft are the characters which
are used as typographic single quotes and look like the comma moved
around. (When using foundry type an open quote IS a comma set upside
down.)  The quotesingle is a vertical mark like a troff \(fm, foot mark.
The acute and the grave are the diacritical marks.  Based on ISO 646-1973
(E) note 6 to Table 1, I have decided to associate the graphics for acute
and grave with the ASCII codes hex 27 and 60.  My reasoning is that these
ASCII characters serve double duty and acute and grave are typographically
acceptable substitutes for quoteright and quoteleft but the reverse is not
true.  I would be interested in knowing if anyone else has any burning
insights into this matter.  NOTE WELL: When going from 7 bits to 8 bits
confusion between quotesingle and acute seem inevitable.  (My Ann Arbor XL
has quotesingle on the keyboard and puts acute on the screen.)

    PostScript    as l1 ps pc mc vt
   quotesingle -- -- 27 a9 -- 27 --
     quoteleft `  -- -- 60 -- d4 --
    quoteright '  -- -- 27 -- d5 --
	 grave `  60 60 c1 60 60 60
	 acute '  27 b4 c2 27 ab 27

I have based the tabulation of ISO Latin-1 on the earlier network posting.
There are a few positions that seem to be in error.  Can someone with
access to the standard please check these?

	At position hex b6, the character pilcrow was reported.  Is
	this really a paragraph mark, the one that looks like a mirror
	image of a capital P with two vertical strokes?  Is the name
	'pilcrow' correct?

	At position hex a7, the character was reported as "section,
	paragraph".  These are distinct symbols.  The section mark
	looks something like an S but the center is doubled.  Did
	ISO really intend for these two distinct symbols to share
	one code?

	Positions d7 and f7 were marked "do not use".  The ISO codes
	follow DEC VT-220 codes closely.  On the VT-220 those positions
	are oe and OE ligatures.  Does ISO really exclude these ligatures?
	Is there a special reason for the "do not use" designation?

	Positions dd and fd were given as yacute and Yacute.  Should
	this really be ydierisis and Ydierisis?  If not, who uses
	Yacute?

Now let me mention a few areas of the proposed ISO set that I might take
issue with.  Might I ask if there are any participants in the drafting of
ISO Latin-1 reading this?  I think we ought to know if discussing the
following items will serve any real purpose.

	ISO included hex a0, no break space, and ad, soft hyphen.
	While the utility of such things is obvious in wordprocessors,
	I think making them part of the graphic characters is questionable.
	I object to having characters with "magic" properties especially
	since they are not likely to have a standard visible uniqueness.
	It would seem that this type of thing is better handled as
	a control character or control character graphic character
	combination.  For those who dismiss the confusion possible
	here, contemplate the confusion that arises periodically over
	tab (09) versus space (20) for horizontal spacing or CR vs. LF
	vs. CR-LF as an end-of-line indicator.

	a6 is 'broken bar'.  Why is this needed?  ASCII 7c, bar, is often
	drawn as a broken bar to be distinct from I, l, and 1.  Do we
	really need another symbol?

	ac is 'logical not', presumably the horizontal line with a short
	vertical descender at the right end.  Why is this needed?  If
	this is included there are lots of other special symbols that
	could come along.  I think Latin-1 should be limited to meeting
	the needs of general written language and not extended for
	scientific writing.

	b5 is 'mu'.  Same arguements as above.  Is this here just because
	it is on a VT-220?

	bc, bd, and be are the fractions 1/4, 1/2, and 3/4.  I don't
	think making these individual graphics really serves much purpose.

	b9, b2, and b3 are superscript 1, 2, and 3.  Again VT-220
	holdovers?  To be of any real value you should have all ten
	digits.  It seems to me that 'superscript' is a character
	attribute not unlike point size.  I don't know if such things
	should be part of a characters encoding.  I certainly don't
	think Latin-1 is a rich enough set to be able to handle such
	things.

	In sum, there are eleven characters that are questionable.  I
	think space in an 8 bit character set is too tight to include
	things that are amenities.  I believe the goal of Latin-1
	should be to provide a character set with the broadest
	coverage of languages feasible.  Adding icelandic eth will make
	it possible to address a larger population with Latin-1.
	Adding a mu will not.

This is a tabulation of the countries that are covered by the ISO Latin-1
proposal and the languages used.  Help in completing this would be
appreciated.

      SP Argentina            FI Finland              SP Panama
      BR Australia            FR France               SP Paraguay
      GE Austria              GE Germany              SP Peru
	 Belgium              SP Guatemala            PR Portugal
	 Belize                  Guyana               SP El Salvador
      SP Bolivia              SP Honduras             SP Spain
      PR Brazil               IC Iceland                 Surinam
   BR,FR Canada               BR Ireland              SW Sweden
      SP Chile                IT Italy                   Switzerland
      SP Colombia                Liechtenstein        DU The Netherlands
      SP Costa Rica              Luxemburg            BR United Kingdom
      SP Cuba                 SP Mexico               AM United States
      DA Denmark              BR New Zealand          SP Uruguay
      SP Ecuador              SP Nicaragua            SP Venezuela
	 Faroe Islands        NO Norway

Language codes
--------------
  American AM               French FR               Polish PL
   British BR               German GE           Portuguese PR
    Danish DA            Hungarian HU              Spanish SP
     Dutch DU            Icelandic IC              Swedish SW
 Esperanto ES              Italian IT              Turkish TU
   Finnish FI            Norwegian NO


I have tabulated seventeen languages using Latin alphabets.  Are there
others that someone could tabulate?

=============================================================================
  Latin characters, coding for selected machines, usage in various languages
=============================================================================

				    Language codes
				    --------------
				      American AM
				       British BR
					Danish DA
					 Dutch DU
				     Esperanto ES
				       Finnish FI
					French FR
					German GE
				     Hungarian HU
		  Character codes    Icelandic IC
		  ---------------      Italian IT
			ASCII as     Norwegian NO
		  ISO Latin-1 l1        Polish PL
		   PostScript ps    Portuguese PR
		       IBM-PC pc       Spanish SP
		    MacIntosh mc       Swedish SW
		   DEC VT-220 vt       Turkish TU
		  ----------------- --------------------------------------------------
    PostScript    as l1 ps pc mc vt AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
-------------- --
	exclam !  21 21 21 21 21 21 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
      quotedbl "  22 22 22 22 22 22 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
    numbersign #  23 23 23 23 23 23 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	dollar $  24 24 24 24 24 24 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
       percent %  25 25 25 25 25 25 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
     ampersand &  26 26 26 26 26 26 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 acute '  27 b4 c2 27 ab 27 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
     parenleft (  28 28 28 28 28 28 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
    parenright )  29 29 29 29 29 29 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
      asterisk *  2a 2a 2a 2a 2a 2a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  plus +  2b 2b 2b 2b 2b 2b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 comma ,  2c 2c 2c 2c 2c 2c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	hyphen -  2d 2d 2d 2d 2d 2d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	period .  2e 2e 2e 2e 2e 2e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 slash /  2f 2f 2f 2f 2f 2f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  zero 0  30 30 30 30 30 30 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	   one 1  31 31 31 31 31 31 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	   two 2  32 32 32 32 32 32 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 three 3  33 33 33 33 33 33 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  four 4  34 34 34 34 34 34 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  five 5  35 35 35 35 35 35 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	   six 6  36 36 36 36 36 36 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 seven 7  37 37 37 37 37 37 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 eight 8  38 38 38 38 38 38 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  nine 9  39 39 39 39 39 39 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 colon :  3a 3a 3a 3a 3a 3a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
     semicolon ;  3b 3b 3b 3b 3b 3b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	  less <  3c 3c 3c 3c 3c 3c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 equal =  3d 3d 3d 3d 3d 3d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
       greater >  3e 3e 3e 3e 3e 3e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
      question ?  3f 3f 3f 3f 3f 3f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	    at @  40 40 40 40 40 40 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     A A  41 41 41 41 41 41 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     B B  42 42 42 42 42 42 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     C C  43 43 43 43 43 43 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     D D  44 44 44 44 44 44 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     E E  45 45 45 45 45 45 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     F F  46 46 46 46 46 46 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     G G  47 47 47 47 47 47 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     H H  48 48 48 48 48 48 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     I I  49 49 49 49 49 49 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     J J  4a 4a 4a 4a 4a 4a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     K K  4b 4b 4b 4b 4b 4b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     L L  4c 4c 4c 4c 4c 4c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     M M  4d 4d 4d 4d 4d 4d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     N N  4e 4e 4e 4e 4e 4e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     O O  4f 4f 4f 4f 4f 4f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     P P  50 50 50 50 50 50 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     Q Q  51 51 51 51 51 51 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     R R  52 52 52 52 52 52 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     S S  53 53 53 53 53 53 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     T T  54 54 54 54 54 54 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     U U  55 55 55 55 55 55 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     V V  56 56 56 56 56 56 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     W W  57 57 57 57 57 57 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     X X  58 58 58 58 58 58 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     Y Y  59 59 59 59 59 59 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     Z Z  5a 5a 5a 5a 5a 5a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
   bracketleft [  5b 5b 5b 5b 5b 5b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
     backslash \  5c 5c 5c 5c 5c 5c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
  bracketright ]  5d 5d 5d 5d 5d 5d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
   asciicircum ^  5e 5e 5e 5e 5e 5e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
    underscore _  5f 5f 5f 5f 5f 5f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	 grave `  60 60 c1 60 60 60 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     a a  61 61 61 61 61 61 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     b b  62 62 62 62 62 62 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     c c  63 63 63 63 63 63 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     d d  64 64 64 64 64 64 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     e e  65 65 65 65 65 65 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     f f  66 66 66 66 66 66 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     g g  67 67 67 67 67 67 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     h h  68 68 68 68 68 68 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     i i  69 69 69 69 69 69 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     j j  6a 6a 6a 6a 6a 6a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     k k  6b 6b 6b 6b 6b 6b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     l l  6c 6c 6c 6c 6c 6c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     m m  6d 6d 6d 6d 6d 6d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     n n  6e 6e 6e 6e 6e 6e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     o o  6f 6f 6f 6f 6f 6f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     p p  70 70 70 70 70 70 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     q q  71 71 71 71 71 71 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     r r  72 72 72 72 72 72 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     s s  73 73 73 73 73 73 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     t t  74 74 74 74 74 74 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     u u  75 75 75 75 75 75 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     v v  76 76 76 76 76 76 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     w w  77 77 77 77 77 77 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     x x  78 78 78 78 78 78 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     y y  79 79 79 79 79 79 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	     z z  7a 7a 7a 7a 7a 7a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
     braceleft {  7b 7b 7b 7b 7b 7b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
	   bar |  7c 7c 7c 7c 7c 7c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
    braceright }  7d 7d 7d 7d 7d 7d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU
    asciitilde ~  7e 7e 7e 7e 7e 7e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU

	    ae ae -- e6 f1 91 be e6 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- --
	    AE AE -- c6 e1 92 ae c6 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- --
   ordfeminine a- -- aa e3 a6 bb aa -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
	aacute a' -- e1 -- a0 87 e1 -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
	Aacute A' -- c1 -- -- -- c1 -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
   acircumflex a^ -- e2 -- 83 89 e2 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU
   Acircumflex A^ -- c2 -- -- -- c2 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU
     adieresis a" -- e4 -- 84 8a e4 -- -- -- -- -- FI -- GE -- -- -- -- -- -- -- SW --
     Adieresis A" -- c4 -- 8e 80 c4 -- -- -- -- -- FI -- GE -- -- -- -- -- -- -- SW --
	agrave a` -- e0 -- 85 88 e0 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- --
	Agrave A` -- c0 -- -- cb c0 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
      :aogonek a, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
      :Aogonek A, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	 aring ao -- e5 -- 86 8c e5 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- SW --
	 Aring Ao -- c5 -- 8f 81 c5 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- SW --
	atilde a~ -- e3 -- -- 8b e3 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
	Atilde A~ -- c3 -- -- cc c3 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
       :cacute c' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
       :Cacute C' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
      ccedilla c, -- e7 -- 87 8d e7 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU
      Ccedilla C, -- c7 -- 80 82 c7 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU
  :ccircumflex c^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :Ccircumflex C^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
	eacute e' -- e9 -- 82 8e e9 -- -- -- -- -- -- FR -- HU -- -- -- -- PR SP -- --
	Eacute E' -- c9 -- 90 83 c9 -- -- -- -- -- -- FR -- HU -- -- -- -- PR SP -- --
   ecircumflex e^ -- ea -- 88 90 ea -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- --
   Ecircumflex E^ -- ca -- -- -- ca -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- --
     edieresis e" -- eb -- 89 91 eb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
     Edieresis E" -- cb -- -- -- cb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
	egrave e` -- e8 -- 8a 8f e8 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- --
	Egrave E` -- c8 -- -- -- c8 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
      :eogonek e, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
      :Eogonek E, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
       :gbreve gu -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
       :Gbreve Gu -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
  :gcircumflex g^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :Gcircumflex G^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :hcircumflex h^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :Hcircumflex H^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
	iacute i' -- ed a1 92 ed -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
	Iacute I' -- cd -- -- -- cd -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
   icircumflex i^ -- ee -- 8c 94 ee -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
   Icircumflex I^ -- ce -- -- -- ce -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
     idieresis i" -- ef -- 8b 95 ef -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
     Idieresis I" -- cf -- -- -- cf -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
	igrave i` -- ec -- 8d 93 ec -- -- -- -- -- -- -- -- -- -- IT -- -- -- -- -- --
	Igrave I` -- cc -- -- -- cc -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
            ij ij -- -- -- -- -- -- -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- --
            IJ IJ -- -- -- -- -- -- -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- --
      dotlessi -- -- -- f5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
	 :Idot I. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
  :jcircumflex j^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :Jcircumflex J^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
	lslash l/ -- -- f8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	Lslash L/ -- -- e8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	ntilde n~ -- f1 -- a4 96 f1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- --
	Ntilde N~ -- d1 -- a5 84 d1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- --
	oslash o/ -- f8 f9 -- bf f8 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- --
	Oslash O/ -- d8 e9 ed af d8 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- --
	    oe oe -- -- fa -- cf f7 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
	    OE OE -- -- ea -- ce d7 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
  ordmasculine o- -- ba eb a7 bc ba -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
	oacute o' -- f3 -- a2 97 f3 -- -- -- -- -- -- -- -- HU -- -- -- PL PR SP -- --
	Oacute O' -- d3 -- -- -- d3 -- -- -- -- -- -- -- -- HU -- -- -- PL PR SP -- --
   ocircumflex o^ -- f4 -- 93 99 f4 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- --
   Ocircumflex O^ -- d4 -- -- -- d4 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- --
     odieresis o" -- f6 -- 94 9a f6 -- -- -- -- -- FI -- GE HU -- -- -- -- -- -- SW TU
     Odieresis O" -- d6 -- 99 85 d6 -- -- -- -- -- FI -- GE HU -- -- -- -- -- -- SW TU
	ograve o` -- f2 -- 95 98 f2 -- -- ----  -- -- -- -- -- -- IT -- -- -- -- -- --
	Ograve O` -- d2 -- -- -- d2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
:ohungarumlaut o* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- --
:Ohungarumlaut O* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- --
	otilde o~ -- f5 -- -- 9b f5 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
	Otilde O~ -- d5 -- -- cd d5 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- --
    germandbls ss -- df fb e1 a7 df -- -- -- -- -- -- -- GE -- -- -- -- -- -- -- -- --
       :sacute s' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
       :Sacute S' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	scaron sv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	Scaron Sv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
     :scedilla s, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
     :Scedilla S, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
  :scircumflex s^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
  :Scircumflex S^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
	uacute u' -- fa -- a3 9c fa -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
	Uacute U' -- da -- -- -- da -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- --
       :ubreve uu -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
       :Ubreve Uu -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- --
   ucircumflex u^ -- fb -- 96 9e fb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU
   Ucircumflex U^ -- db -- -- -- db -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU
     udieresis u" -- fc -- 81 9f fc -- -- -- -- -- -- FR GE HU -- -- -- -- PR SP -- TU
     Udieresis U" -- dc -- 9a 86 dc -- -- -- -- -- -- FR GE HU -- -- -- -- PR SP -- TU
	ugrave u` -- f9 -- 97 9d f9 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- --
	Ugrave U` -- d9 -- -- -- d9 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
:uhungarumlaut u* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- --
:Uhungarumlaut U* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- --
       :yacute -- -- fd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
       :Yacute -- -- dd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
     ydieresis y" -- ff -- 98 d8 fd -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- --
     Ydieresis Y" -- -- -- -- -- dd -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- --
       :zacute z' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
       :Zacute Z' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	zcaron zv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	Zcaron Zv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	 :zdot z. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	 :Zdot Z. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
 :icelandiceth -- -- f0 -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- --
 :icelandicETH -- -- d0 -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- --
:celandicthorn -- -- fe -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- --
:celandicTHORN -- -- de -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- --

    exclamdown !! -- a1 a1 ad c1 a1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- --
  questiondown ?? -- bf bf a8 c0 bf -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- --
      sterling L- -- a3 a3 9c a3 a3 -- BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	   yen Y- -- a5 a5 9d b4 a5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	florin -- -- -- a6 9f c4 -- -- -- -- -- -- -- -- -- -- -- IT -- -- -- -- -- --
       :peseta Pt -- -- -- 9e -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- --
      currency ox -- a4 a8 -- -- a8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	  cent c/ -- a2 a2 9b a2 a2 AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
     plusminus +- -- b1 -- -- -- b1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   :registered rO -- -- -- -- a8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
    :copyright cO -- a9 -- -- a9 a9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
    :trademark tm -- ae -- -- aa -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
       section S* -- a7 a7 15 a4 a7 AM -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
     paragraph P| -- a7 b6 14 a6 b6 AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   quotesingle -- -- 27 a9 -- 27 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
     quoteleft `  -- -- 60 -- d4 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
    quoteright '  -- -- 27 -- d5 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
  quotedblleft -- -- -- aa -- d2 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
 quotedblright -- -- -- ba -- d3 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
quotesinglbase -- -- -- b8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
  quotedblbase -- -- -- b9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
 guillemoright >> -- bb bb af c8 bb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
 guillemotleft << -- ab ab ae c7 ab -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
 guilsinglleft -- -- -- ac -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
guilsinglright -- -- -- ad -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- --
	dagger -- -- -- b2 -- a0 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
     daggerdbl -- -- -- b3 -- -- -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	endash -- -- -- b1 -- d0 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	emdash -- -- -- d0 -- d1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
periodcentered -- -- -- b4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	bullet -- -- b7 b7 f9 a5 b7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
      ellipsis -- -- -- bc -- c9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   perthousand -- -- -- bd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	 grave `  60 -- c1 -- -- -- -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- --
	 acute '  27 b4 c2 -- ab -- -- -- -- -- -- -- FR -- HU -- -- -- PL PR SP -- --
    circumflex ^  5e -- c3 -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU
	 tilde ~  7e -- c4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PR SP -- --
	macron -- -- af c5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	 breve -- -- -- c6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU
     dotaccent -- -- -- c7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- TU
      dieresis "  -- a8 c8 -- ac -- -- -- -- DU -- FI FR GE HU -- -- -- PL PR SP SW TU
	  ring ** -- b0 ca f8 a1 b0 AM BR DA -- -- -- -- -- -- -- -- NO -- -- -- SW --
       cedilla ,  -- b8 cb -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU
  hungarumlaut '' -- -- cd -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- --
	ogonek -- -- -- ce -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- --
	 caron -- -- -- cf -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	    fi -- -- -- ae -- -- -- AM BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	    fl -- -- -- af -- -- -- AM BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
 :nobreakspace b/ -- a0 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   :softhyphen -- -- ad -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
    :brokenbar -- -- a6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
    logicalnot -- -- ac -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	    mu /u -- b5 -- -- -- b5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
      :pilcrow -- -- b6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
       :super1 -- -- b9 -- -- -- b9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
       :super2 -- -- b2 -- -- -- b2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
       :super3 -- -- b3 -- -- -- b3 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	  :1/4 -- -- bc -- -- -- bc -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	  :1/2 -- -- bd -- -- -- bd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
	  :3/4 -- -- be -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   :do.not.use -- -- d7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
   :do.not.use -- -- f7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --

French

   acircumflex a^ -- e2 -- 83 89 e2     ocircumflex o^ -- f4 -- 93 99 f4
   Acircumflex A^ -- c2 -- -- -- c2     Ocircumflex O^ -- d4 -- -- -- d4
	agrave a` -- e0 -- 85 88 e0     ucircumflex u^ -- fb -- 96 9e fb
	Agrave A` -- c0 -- -- cb c0     Ucircumflex U^ -- db -- -- -- db
      ccedilla c, -- e7 -- 87 8d e7       udieresis u" -- fc -- 81 9f fc
      Ccedilla C, -- c7 -- 80 82 c7       Udieresis U" -- dc -- 9a 86 dc
	eacute e' -- e9 -- 82 8e e9          ugrave u` -- f9 -- 97 9d f9
	Eacute E' -- c9 -- 90 83 c9          Ugrave U` -- d9 -- -- -- d9
   ecircumflex e^ -- ea -- 88 90 ea         section S* -- a7 a7 15 a4 a7
   Ecircumflex E^ -- ca -- -- -- ca   guillemoright >> -- bb bb af c8 bb
     edieresis e" -- eb -- 89 91 eb   guillemotleft << -- ab ab ae c7 ab
     Edieresis E" -- cb -- -- -- cb   guilsinglleft -- -- -- ac -- -- --
	egrave e` -- e8 -- 8a 8f e8  guilsinglright -- -- -- ad -- -- --
	Egrave E` -- c8 -- -- -- c8           grave `  60 -- c1 -- -- --
   icircumflex i^ -- ee -- 8c 94 ee           acute '  27 b4 c2 -- ab --
   Icircumflex I^ -- ce -- -- -- ce      circumflex ^  5e -- c3 -- -- --
     idieresis i" -- ef -- 8b 95 ef        dieresis "  -- a8 c8 -- ac --
     Idieresis I" -- cf -- -- -- cf         cedilla ,  -- b8 cb -- -- --
	    oe oe -- -- fa -- cf f7
	    OE OE -- -- ea -- ce d7

jhenry@randvax.UUCP (Jim Henry) (02/22/86)

What follows are tabulations of characters that might be needed to properly
support a particular language that are not part of the standard ASCII
character set.  The master table from which these are drawn has been posted
to net.internat.  I am cross-posting to net.nlang to solicit comments and
corrections.  Please mail these to me.  I will post a corrected version of
this information if there is enough interest.  If you can authoritatively
state that some part of this is correct I'd like to hear that too! (I speak
only English so this hasn't been easy to do.)  Followups have been directed
to net.internat.

Each character is described by its PostScript name or a PostScript-like
name which starts with a :.  Usually a two ASCII character sequence is
given which suggests what the character looks like.  (Visualize the two
characters as an overstrike.)  Following this are the hexadecimal codes for
a number of popular systems which have an extended character set.  The key
for these devices is as follows:

		      ASCII as
		ISO Latin-1 l1
		 PostScript ps
		     IBM-PC pc
		  MacIntosh mc
		 DEC VT-220 vt

This is a tabulation of the countries that are covered by the ISO Latin-1
proposal and the languages used.  Help in completing this would be
appreciated.

      SP Argentina            FI Finland              SP Panama
      BR Australia            FR France               SP Paraguay
      GE Austria              GE Germany              SP Peru
	 Belgium              SP Guatemala            PR Portugal
	 Belize                  Guyana               SP El Salvador
      SP Bolivia              SP Honduras             SP Spain
      PR Brazil               IC Iceland                 Surinam
   BR,FR Canada               BR Ireland              SW Sweden
      SP Chile                IT Italy                   Switzerland
      SP Colombia                Liechtenstein        DU The Netherlands
      SP Costa Rica              Luxemburg            BR United Kingdom
      SP Cuba                 SP Mexico               AM United States
      DA Denmark              BR New Zealand          SP Uruguay
      SP Ecuador              SP Nicaragua            SP Venezuela
	 Faroe Islands        NO Norway

Language codes
--------------
  American AM               French FR               Polish PL
   British BR               German GE           Portuguese PR
    Danish DA            Hungarian HU              Spanish SP
     Dutch DU            Icelandic IC              Swedish SW
 Esperanto ES              Italian IT              Turkish TU
   Finnish FI            Norwegian NO

I have tabulated seventeen languages using Latin alphabets.  Are there
others that someone could tabulate?

American

American extension are basically all symbols.  I think the ligatures fi and
fl are essentially typographic in nature and shouldn't be considered in a
standard character set.  The typographic quotes can probably be dispensed
with in favor of the existing ASCII characters.  dagger and double dagger
do not seem important.  There are additional typographic symbols such as
copyright which are in the master table but I didn't pick-up all the
symbols when I extracted this.

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
	  cent c/ -- a2 a2 9b a2 a2      quotesingle -- -- 27 a9 -- 27 --
       section S* -- a7 a7 15 a4 a7        quoteleft `  -- -- 60 -- d4 --
     paragraph P| -- a7 b6 14 a6 b6       quoteright '  -- -- 27 -- d5 --
	dagger -- -- -- b2 -- a0 --     quotedblleft -- -- -- aa -- d2 --
     daggerdbl -- -- -- b3 -- -- --    quotedblright -- -- -- ba -- d3 --
	  ring ** -- b0 ca f8 a1 b0               fi -- -- -- ae -- -- --
						  fl -- -- -- af -- -- --

British

The only British extension that is not common with American is the pound
sterling symbol.

    PostScript    as l1 ps pc mc vt
      sterling L- -- a3 a3 9c a3 a3

Danish

    PostScript    as l1 ps pc mc vt
	    ae ae -- e6 f1 91 be e6
	    AE AE -- c6 e1 92 ae c6
	 aring ao -- e5 -- 86 8c e5
	 Aring Ao -- c5 -- 8f 81 c5
	oslash o/ -- f8 f9 -- bf f8
	Oslash O/ -- d8 e9 ed af d8
	  ring ** -- b0 ca f8 a1 b0

Dutch

Is the Dutch ligature ij typographic in nature, like English fi, or should
it be part of an extended set?  What is the use of y dieresis as a
substitute for ij?  Is it good practice or a workaround?

    PostScript    as l1 ps pc mc vt
	    ij ij -- -- -- -- -- --
	    IJ IJ -- -- -- -- -- --
     ydieresis y" -- ff -- 98 d8 fd
     Ydieresis Y" -- -- -- -- -- dd
      dieresis "  -- a8 c8 -- ac --

Esperanto

Are all these still used in Esperanto or are some archaic?

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
  :ccircumflex c^ -- -- -- -- -- --     :jcircumflex j^ -- -- -- -- -- --
  :Ccircumflex C^ -- -- -- -- -- --     :Jcircumflex J^ -- -- -- -- -- --
  :gcircumflex g^ -- -- -- -- -- --     :scircumflex s^ -- -- -- -- -- --
  :Gcircumflex G^ -- -- -- -- -- --     :Scircumflex S^ -- -- -- -- -- --
  :hcircumflex h^ -- -- -- -- -- --          :ubreve uu -- -- -- -- -- --
  :Hcircumflex H^ -- -- -- -- -- --          :Ubreve Uu -- -- -- -- -- --

Finnish

    PostScript    as l1 ps pc mc vt
     adieresis a" -- e4 -- 84 8a e4
     Adieresis A" -- c4 -- 8e 80 c4
     odieresis o" -- f6 -- 94 9a f6
     Odieresis O" -- d6 -- 99 85 d6
      dieresis "  -- a8 c8 -- ac --

French

How important is the oe ligature?  The ISO Latin-1 set does not have oe.
Is a single guillemot needed?

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
   acircumflex a^ -- e2 -- 83 89 e2      ocircumflex o^ -- f4 -- 93 99 f4
   Acircumflex A^ -- c2 -- -- -- c2      Ocircumflex O^ -- d4 -- -- -- d4
	agrave a` -- e0 -- 85 88 e0      ucircumflex u^ -- fb -- 96 9e fb
	Agrave A` -- c0 -- -- cb c0      Ucircumflex U^ -- db -- -- -- db
      ccedilla c, -- e7 -- 87 8d e7        udieresis u" -- fc -- 81 9f fc
      Ccedilla C, -- c7 -- 80 82 c7        Udieresis U" -- dc -- 9a 86 dc
	eacute e' -- e9 -- 82 8e e9           ugrave u` -- f9 -- 97 9d f9
	Eacute E' -- c9 -- 90 83 c9           Ugrave U` -- d9 -- -- -- d9
   ecircumflex e^ -- ea -- 88 90 ea          section S* -- a7 a7 15 a4 a7
   Ecircumflex E^ -- ca -- -- -- ca    guillemoright >> -- bb bb af c8 bb
     edieresis e" -- eb -- 89 91 eb    guillemotleft << -- ab ab ae c7 ab
     Edieresis E" -- cb -- -- -- cb    guilsinglleft -- -- -- ac -- -- --
	egrave e` -- e8 -- 8a 8f e8   guilsinglright -- -- -- ad -- -- --
	Egrave E` -- c8 -- -- -- c8            grave `  60 -- c1 -- -- --
   icircumflex i^ -- ee -- 8c 94 ee            acute '  27 b4 c2 -- ab --
   Icircumflex I^ -- ce -- -- -- ce       circumflex ^  5e -- c3 -- -- --
     idieresis i" -- ef -- 8b 95 ef         dieresis "  -- a8 c8 -- ac --
     Idieresis I" -- cf -- -- -- cf          cedilla ,  -- b8 cb -- -- --
	    oe oe -- -- fa -- cf f7
	    OE OE -- -- ea -- ce d7

German

Please remember that the double s is not the same as Greek beta!  I don't
read German but that error still offends my eyes.

    PostScript    as l1 ps pc mc vt
     adieresis a" -- e4 -- 84 8a e4
     Adieresis A" -- c4 -- 8e 80 c4
     odieresis o" -- f6 -- 94 9a f6
     Odieresis O" -- d6 -- 99 85 d6
    germandbls ss -- df fb e1 a7 df
     udieresis u" -- fc -- 81 9f fc
     Udieresis U" -- dc -- 9a 86 dc
      dieresis "  -- a8 c8 -- ac --

Hungarian

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
	aacute a' -- e1 -- a0 87 e1           uacute u' -- fa -- a3 9c fa
	Aacute A' -- c1 -- -- -- c1           Uacute U' -- da -- -- -- da
	eacute e' -- e9 -- 82 8e e9        udieresis u" -- fc -- 81 9f fc
	Eacute E' -- c9 -- 90 83 c9        Udieresis U" -- dc -- 9a 86 dc
	iacute i' -- ed a1 92 ed --   :uhungarumlaut u* -- -- -- -- -- --
	Iacute I' -- cd -- -- -- cd   :Uhungarumlaut U* -- -- -- -- -- --
	oacute o' -- f3 -- a2 97 f3            acute '  27 b4 c2 -- ab --
	Oacute O' -- d3 -- -- -- d3         dieresis "  -- a8 c8 -- ac --
     odieresis o" -- f6 -- 94 9a f6     hungarumlaut '' -- -- cd -- -- --
     Odieresis O" -- d6 -- 99 85 d6
:ohungarumlaut o* -- -- -- -- -- --
:Ohungarumlaut O* -- -- -- -- -- --

Icelandic

I know nothing about Icelandic!  Any other extended characters?

    PostScript    as l1 ps pc mc vt
 :icelandiceth -- -- f0 -- -- -- --
 :icelandicETH -- -- d0 -- -- -- --
:celandicthorn -- -- fe -- -- -- --
:celandicTHORN -- -- de -- -- -- --

Italian

Does Italian use Igrave and Ograve?  I have information that says they are
used but rarely.

    PostScript    as l1 ps pc mc vt
	agrave a` -- e0 -- 85 88 e0
	egrave e` -- e8 -- 8a 8f e8
	igrave i` -- ec -- 8d 93 ec
	ograve o` -- f2 -- 95 98 f2
	ugrave u` -- f9 -- 97 9d f9
	florin -- -- -- a6 9f c4 --
	 grave `  60 -- c1 -- -- --

Norwegian

    PostScript    as l1 ps pc mc vt
	    ae ae -- e6 f1 91 be e6
	    AE AE -- c6 e1 92 ae c6
	 aring ao -- e5 -- 86 8c e5
	 Aring Ao -- c5 -- 8f 81 c5
	oslash o/ -- f8 f9 -- bf f8
	Oslash O/ -- d8 e9 ed af d8
	  ring ** -- b0 ca f8 a1 b0

Polish

An ogonek is a mirror image of a cedilla.

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
      :aogonek a, -- -- -- -- -- --          :sacute s' -- -- -- -- -- --
      :Aogonek A, -- -- -- -- -- --          :Sacute S' -- -- -- -- -- --
       :cacute c' -- -- -- -- -- --          :zacute z' -- -- -- -- -- --
       :Cacute C' -- -- -- -- -- --          :Zacute Z' -- -- -- -- -- --
      :eogonek e, -- -- -- -- -- --            :zdot z. -- -- -- -- -- --
      :Eogonek E, -- -- -- -- -- --            :Zdot Z. -- -- -- -- -- --
	lslash l/ -- -- f8 -- -- --            acute '  27 b4 c2 -- ab --
	Lslash L/ -- -- e8 -- -- --        dotaccent -- -- -- c7 -- -- --
	oacute o' -- f3 -- a2 97 f3         dieresis "  -- a8 c8 -- ac --
	Oacute O' -- d3 -- -- -- d3           ogonek -- -- -- ce -- -- --

Portuguese

Are e tilde, i tilde, or u tilde used?  Is there a special use of tilde in
contractions that needs to be considered?

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
   ordfeminine a- -- aa e3 a6 bb aa      ocircumflex o^ -- f4 -- 93 99 f4
	atilde a~ -- e3 -- -- 8b e3      Ocircumflex O^ -- d4 -- -- -- d4
	Atilde A~ -- c3 -- -- cc c3           otilde o~ -- f5 -- -- 9b f5
      ccedilla c, -- e7 -- 87 8d e7           Otilde O~ -- d5 -- -- cd d5
      Ccedilla C, -- c7 -- 80 82 c7        udieresis u" -- fc -- 81 9f fc
	eacute e' -- e9 -- 82 8e e9        Udieresis U" -- dc -- 9a 86 dc
	Eacute E' -- c9 -- 90 83 c9            acute '  27 b4 c2 -- ab --
   ecircumflex e^ -- ea -- 88 90 ea       circumflex ^  5e -- c3 -- -- --
   Ecircumflex E^ -- ca -- -- -- ca            tilde ~  7e -- c4 -- -- --
  ordmasculine o- -- ba eb a7 bc ba         dieresis "  -- a8 c8 -- ac --
	oacute o' -- f3 -- a2 97 f3          cedilla ,  -- b8 cb -- -- --
	Oacute O' -- d3 -- -- -- d3

Spanish

Is the Pt ligature for peseta needed?

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
	aacute a' -- e1 -- a0 87 e1           uacute u' -- fa -- a3 9c fa
	Aacute A' -- c1 -- -- -- c1           Uacute U' -- da -- -- -- da
	eacute e' -- e9 -- 82 8e e9        udieresis u" -- fc -- 81 9f fc
	Eacute E' -- c9 -- 90 83 c9        Udieresis U" -- dc -- 9a 86 dc
	iacute i' -- ed a1 92 ed --       exclamdown !! -- a1 a1 ad c1 a1
	Iacute I' -- cd -- -- -- cd     questiondown ?? -- bf bf a8 c0 bf
	ntilde n~ -- f1 -- a4 96 f1          :peseta Pt -- -- -- 9e -- --
	Ntilde N~ -- d1 -- a5 84 d1            acute '  27 b4 c2 -- ab --
	oacute o' -- f3 -- a2 97 f3            tilde ~  7e -- c4 -- -- --
	Oacute O' -- d3 -- -- -- d3         dieresis "  -- a8 c8 -- ac --

Swedish

    PostScript    as l1 ps pc mc vt
     adieresis a" -- e4 -- 84 8a e4
     Adieresis A" -- c4 -- 8e 80 c4
	 aring ao -- e5 -- 86 8c e5
	 Aring Ao -- c5 -- 8f 81 c5
     odieresis o" -- f6 -- 94 9a f6
     Odieresis O" -- d6 -- 99 85 d6
      dieresis "  -- a8 c8 -- ac --
	  ring ** -- b0 ca f8 a1 b0

Turkish

The breve is a rounded mark liked a squashed U.  A caron is more angular
like a V.  Is the accent on a G a breve or a caron?

    PostScript    as l1 ps pc mc vt       PostScript    as l1 ps pc mc vt
   acircumflex a^ -- e2 -- 83 89 e2      ucircumflex u^ -- fb -- 96 9e fb
   Acircumflex A^ -- c2 -- -- -- c2      Ucircumflex U^ -- db -- -- -- db
      ccedilla c, -- e7 -- 87 8d e7        udieresis u" -- fc -- 81 9f fc
      Ccedilla C, -- c7 -- 80 82 c7        Udieresis U" -- dc -- 9a 86 dc
       :gbreve gu -- -- -- -- -- --       circumflex ^  5e -- c3 -- -- --
       :Gbreve Gu -- -- -- -- -- --            breve -- -- -- c6 -- -- --
      dotlessi -- -- -- f5 -- -- --        dotaccent -- -- -- c7 -- -- --
	 :Idot I. -- -- -- -- -- --         dieresis "  -- a8 c8 -- ac --
     odieresis o" -- f6 -- 94 9a f6          cedilla ,  -- b8 cb -- -- --
     Odieresis O" -- d6 -- 99 85 d6
     :scedilla s, -- -- -- -- -- --
     :Scedilla S, -- -- -- -- -- --

blarson@oberon.UUCP (Bob Larson) (02/23/86)

My only disagreement with the comments is I think mu should be included.
It is the standard abreviation for the metric prefix micro, and therefor
has quite a bit of non-scientic use.  (I would also like upper case
omega, but its use out of electrical/electronic context is limited.)

-- 
Bob Larson
Arpa: Blarson@Usc-Ecl.Arpa
Uucp: ihnp4!sdcrdcf!oberon!blarson

jhenry@randvax.UUCP (Jim Henry) (02/26/86)

It has come to my attention that we have been putting 'rand-unix' in the
Reply-To: field.  The correct network name is 'randvax'.  My apologies to
anyone inconvenienced by this.  I have received comments from Steven
Pemberton, Stavros Macrakis, and Rich Wales.  I will acknowledge all
messages since I know some must travel through rather difficult paths.

Lest anyone be confused, my tabulation is NOT intended to contain any
value judgments.  It is simply a compilation of all the information I
could lay my hands on in a way that I thought might be useful.  The
information I have already received will allow me to extend and refine
the table considerably.