jhenry@randvax.UUCP (Jim Henry) (02/22/86)
At the end of this message is a tabulation of information I have been compiling about Latin characters, common encodings, and their usage by language. I think I have gone about as far as I can on my own (I speak only American :( ). I would appreciate it if those who have some expertise in any portion of the material presented would advise me of any errors of commision or omission. Since I expect there will be more than a few, please mail the errata to me and I will revise the table and repost it. Based on my investigations to date, I also expect that there will some debatable issues. If at all possible please furnish an example, reference, statement of grammatical rule or whatever with any correction so I have something to go on in the event of conflicting opinions. Hopefully the tables will be pretty self-explanatory. I tried to construct them so it is easy to use the Unix tools to select and rearrange information to meet a wide variety of needs. I have used PostScript names for the graphic being represented if one exists. PostScript is a page description language which is used in the Apple LaserWriter and other printers. The reference book is PostScript Language Reference Manual by Adobe Systems Inc., Addison-Wesley ISBN 0-201-10174-2. I have invented some additional names which are flagged with a leading colon (:). The second column contains a suggested two character sequence that might be used to indicate the symbol on an unextended ASCII device. Example: N\o"el, where \ indicates a compose sequence (using VT220 lingo). The character codes are in hexadecimal. I apologize in advance for this and every other thing I have done that offends someone somewhere. Here are some additional notes and some questions: The graphic representation of the standard ASCII characters hex 27 and 60 are particularly confusing. There seem to be five distinct graphic symbols in the "single quote-like family" as seen by the PostScript names below. In PostScript output the quoteright and quoteleft are the characters which are used as typographic single quotes and look like the comma moved around. (When using foundry type an open quote IS a comma set upside down.) The quotesingle is a vertical mark like a troff \(fm, foot mark. The acute and the grave are the diacritical marks. Based on ISO 646-1973 (E) note 6 to Table 1, I have decided to associate the graphics for acute and grave with the ASCII codes hex 27 and 60. My reasoning is that these ASCII characters serve double duty and acute and grave are typographically acceptable substitutes for quoteright and quoteleft but the reverse is not true. I would be interested in knowing if anyone else has any burning insights into this matter. NOTE WELL: When going from 7 bits to 8 bits confusion between quotesingle and acute seem inevitable. (My Ann Arbor XL has quotesingle on the keyboard and puts acute on the screen.) PostScript as l1 ps pc mc vt quotesingle -- -- 27 a9 -- 27 -- quoteleft ` -- -- 60 -- d4 -- quoteright ' -- -- 27 -- d5 -- grave ` 60 60 c1 60 60 60 acute ' 27 b4 c2 27 ab 27 I have based the tabulation of ISO Latin-1 on the earlier network posting. There are a few positions that seem to be in error. Can someone with access to the standard please check these? At position hex b6, the character pilcrow was reported. Is this really a paragraph mark, the one that looks like a mirror image of a capital P with two vertical strokes? Is the name 'pilcrow' correct? At position hex a7, the character was reported as "section, paragraph". These are distinct symbols. The section mark looks something like an S but the center is doubled. Did ISO really intend for these two distinct symbols to share one code? Positions d7 and f7 were marked "do not use". The ISO codes follow DEC VT-220 codes closely. On the VT-220 those positions are oe and OE ligatures. Does ISO really exclude these ligatures? Is there a special reason for the "do not use" designation? Positions dd and fd were given as yacute and Yacute. Should this really be ydierisis and Ydierisis? If not, who uses Yacute? Now let me mention a few areas of the proposed ISO set that I might take issue with. Might I ask if there are any participants in the drafting of ISO Latin-1 reading this? I think we ought to know if discussing the following items will serve any real purpose. ISO included hex a0, no break space, and ad, soft hyphen. While the utility of such things is obvious in wordprocessors, I think making them part of the graphic characters is questionable. I object to having characters with "magic" properties especially since they are not likely to have a standard visible uniqueness. It would seem that this type of thing is better handled as a control character or control character graphic character combination. For those who dismiss the confusion possible here, contemplate the confusion that arises periodically over tab (09) versus space (20) for horizontal spacing or CR vs. LF vs. CR-LF as an end-of-line indicator. a6 is 'broken bar'. Why is this needed? ASCII 7c, bar, is often drawn as a broken bar to be distinct from I, l, and 1. Do we really need another symbol? ac is 'logical not', presumably the horizontal line with a short vertical descender at the right end. Why is this needed? If this is included there are lots of other special symbols that could come along. I think Latin-1 should be limited to meeting the needs of general written language and not extended for scientific writing. b5 is 'mu'. Same arguements as above. Is this here just because it is on a VT-220? bc, bd, and be are the fractions 1/4, 1/2, and 3/4. I don't think making these individual graphics really serves much purpose. b9, b2, and b3 are superscript 1, 2, and 3. Again VT-220 holdovers? To be of any real value you should have all ten digits. It seems to me that 'superscript' is a character attribute not unlike point size. I don't know if such things should be part of a characters encoding. I certainly don't think Latin-1 is a rich enough set to be able to handle such things. In sum, there are eleven characters that are questionable. I think space in an 8 bit character set is too tight to include things that are amenities. I believe the goal of Latin-1 should be to provide a character set with the broadest coverage of languages feasible. Adding icelandic eth will make it possible to address a larger population with Latin-1. Adding a mu will not. This is a tabulation of the countries that are covered by the ISO Latin-1 proposal and the languages used. Help in completing this would be appreciated. SP Argentina FI Finland SP Panama BR Australia FR France SP Paraguay GE Austria GE Germany SP Peru Belgium SP Guatemala PR Portugal Belize Guyana SP El Salvador SP Bolivia SP Honduras SP Spain PR Brazil IC Iceland Surinam BR,FR Canada BR Ireland SW Sweden SP Chile IT Italy Switzerland SP Colombia Liechtenstein DU The Netherlands SP Costa Rica Luxemburg BR United Kingdom SP Cuba SP Mexico AM United States DA Denmark BR New Zealand SP Uruguay SP Ecuador SP Nicaragua SP Venezuela Faroe Islands NO Norway Language codes -------------- American AM French FR Polish PL British BR German GE Portuguese PR Danish DA Hungarian HU Spanish SP Dutch DU Icelandic IC Swedish SW Esperanto ES Italian IT Turkish TU Finnish FI Norwegian NO I have tabulated seventeen languages using Latin alphabets. Are there others that someone could tabulate? ============================================================================= Latin characters, coding for selected machines, usage in various languages ============================================================================= Language codes -------------- American AM British BR Danish DA Dutch DU Esperanto ES Finnish FI French FR German GE Hungarian HU Character codes Icelandic IC --------------- Italian IT ASCII as Norwegian NO ISO Latin-1 l1 Polish PL PostScript ps Portuguese PR IBM-PC pc Spanish SP MacIntosh mc Swedish SW DEC VT-220 vt Turkish TU ----------------- -------------------------------------------------- PostScript as l1 ps pc mc vt AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU -------------- -- exclam ! 21 21 21 21 21 21 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU quotedbl " 22 22 22 22 22 22 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU numbersign # 23 23 23 23 23 23 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU dollar $ 24 24 24 24 24 24 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU percent % 25 25 25 25 25 25 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU ampersand & 26 26 26 26 26 26 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU acute ' 27 b4 c2 27 ab 27 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU parenleft ( 28 28 28 28 28 28 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU parenright ) 29 29 29 29 29 29 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU asterisk * 2a 2a 2a 2a 2a 2a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU plus + 2b 2b 2b 2b 2b 2b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU comma , 2c 2c 2c 2c 2c 2c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU hyphen - 2d 2d 2d 2d 2d 2d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU period . 2e 2e 2e 2e 2e 2e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU slash / 2f 2f 2f 2f 2f 2f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU zero 0 30 30 30 30 30 30 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU one 1 31 31 31 31 31 31 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU two 2 32 32 32 32 32 32 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU three 3 33 33 33 33 33 33 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU four 4 34 34 34 34 34 34 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU five 5 35 35 35 35 35 35 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU six 6 36 36 36 36 36 36 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU seven 7 37 37 37 37 37 37 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU eight 8 38 38 38 38 38 38 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU nine 9 39 39 39 39 39 39 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU colon : 3a 3a 3a 3a 3a 3a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU semicolon ; 3b 3b 3b 3b 3b 3b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU less < 3c 3c 3c 3c 3c 3c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU equal = 3d 3d 3d 3d 3d 3d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU greater > 3e 3e 3e 3e 3e 3e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU question ? 3f 3f 3f 3f 3f 3f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU at @ 40 40 40 40 40 40 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU A A 41 41 41 41 41 41 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU B B 42 42 42 42 42 42 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU C C 43 43 43 43 43 43 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU D D 44 44 44 44 44 44 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU E E 45 45 45 45 45 45 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU F F 46 46 46 46 46 46 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU G G 47 47 47 47 47 47 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU H H 48 48 48 48 48 48 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU I I 49 49 49 49 49 49 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU J J 4a 4a 4a 4a 4a 4a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU K K 4b 4b 4b 4b 4b 4b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU L L 4c 4c 4c 4c 4c 4c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU M M 4d 4d 4d 4d 4d 4d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU N N 4e 4e 4e 4e 4e 4e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU O O 4f 4f 4f 4f 4f 4f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU P P 50 50 50 50 50 50 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU Q Q 51 51 51 51 51 51 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU R R 52 52 52 52 52 52 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU S S 53 53 53 53 53 53 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU T T 54 54 54 54 54 54 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU U U 55 55 55 55 55 55 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU V V 56 56 56 56 56 56 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU W W 57 57 57 57 57 57 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU X X 58 58 58 58 58 58 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU Y Y 59 59 59 59 59 59 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU Z Z 5a 5a 5a 5a 5a 5a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU bracketleft [ 5b 5b 5b 5b 5b 5b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU backslash \ 5c 5c 5c 5c 5c 5c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU bracketright ] 5d 5d 5d 5d 5d 5d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU asciicircum ^ 5e 5e 5e 5e 5e 5e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU underscore _ 5f 5f 5f 5f 5f 5f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU grave ` 60 60 c1 60 60 60 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU a a 61 61 61 61 61 61 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU b b 62 62 62 62 62 62 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU c c 63 63 63 63 63 63 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU d d 64 64 64 64 64 64 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU e e 65 65 65 65 65 65 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU f f 66 66 66 66 66 66 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU g g 67 67 67 67 67 67 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU h h 68 68 68 68 68 68 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU i i 69 69 69 69 69 69 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU j j 6a 6a 6a 6a 6a 6a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU k k 6b 6b 6b 6b 6b 6b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU l l 6c 6c 6c 6c 6c 6c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU m m 6d 6d 6d 6d 6d 6d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU n n 6e 6e 6e 6e 6e 6e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU o o 6f 6f 6f 6f 6f 6f AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU p p 70 70 70 70 70 70 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU q q 71 71 71 71 71 71 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU r r 72 72 72 72 72 72 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU s s 73 73 73 73 73 73 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU t t 74 74 74 74 74 74 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU u u 75 75 75 75 75 75 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU v v 76 76 76 76 76 76 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU w w 77 77 77 77 77 77 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU x x 78 78 78 78 78 78 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU y y 79 79 79 79 79 79 AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU z z 7a 7a 7a 7a 7a 7a AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU braceleft { 7b 7b 7b 7b 7b 7b AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU bar | 7c 7c 7c 7c 7c 7c AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU braceright } 7d 7d 7d 7d 7d 7d AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU asciitilde ~ 7e 7e 7e 7e 7e 7e AM BR DA DU ES FI FR GE HU IC IT NO PL PR SP SW TU ae ae -- e6 f1 91 be e6 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- -- AE AE -- c6 e1 92 ae c6 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- -- ordfeminine a- -- aa e3 a6 bb aa -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- aacute a' -- e1 -- a0 87 e1 -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- Aacute A' -- c1 -- -- -- c1 -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- acircumflex a^ -- e2 -- 83 89 e2 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU Acircumflex A^ -- c2 -- -- -- c2 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU adieresis a" -- e4 -- 84 8a e4 -- -- -- -- -- FI -- GE -- -- -- -- -- -- -- SW -- Adieresis A" -- c4 -- 8e 80 c4 -- -- -- -- -- FI -- GE -- -- -- -- -- -- -- SW -- agrave a` -- e0 -- 85 88 e0 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- -- Agrave A` -- c0 -- -- cb c0 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- :aogonek a, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Aogonek A, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- aring ao -- e5 -- 86 8c e5 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- SW -- Aring Ao -- c5 -- 8f 81 c5 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- SW -- atilde a~ -- e3 -- -- 8b e3 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- Atilde A~ -- c3 -- -- cc c3 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- :cacute c' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Cacute C' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- ccedilla c, -- e7 -- 87 8d e7 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU Ccedilla C, -- c7 -- 80 82 c7 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU :ccircumflex c^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Ccircumflex C^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- eacute e' -- e9 -- 82 8e e9 -- -- -- -- -- -- FR -- HU -- -- -- -- PR SP -- -- Eacute E' -- c9 -- 90 83 c9 -- -- -- -- -- -- FR -- HU -- -- -- -- PR SP -- -- ecircumflex e^ -- ea -- 88 90 ea -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- -- Ecircumflex E^ -- ca -- -- -- ca -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- -- edieresis e" -- eb -- 89 91 eb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- Edieresis E" -- cb -- -- -- cb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- egrave e` -- e8 -- 8a 8f e8 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- -- Egrave E` -- c8 -- -- -- c8 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- :eogonek e, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Eogonek E, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :gbreve gu -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :Gbreve Gu -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :gcircumflex g^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Gcircumflex G^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :hcircumflex h^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Hcircumflex H^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- iacute i' -- ed a1 92 ed -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- Iacute I' -- cd -- -- -- cd -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- icircumflex i^ -- ee -- 8c 94 ee -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- Icircumflex I^ -- ce -- -- -- ce -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- idieresis i" -- ef -- 8b 95 ef -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- Idieresis I" -- cf -- -- -- cf -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- igrave i` -- ec -- 8d 93 ec -- -- -- -- -- -- -- -- -- -- IT -- -- -- -- -- -- Igrave I` -- cc -- -- -- cc -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ij ij -- -- -- -- -- -- -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- -- IJ IJ -- -- -- -- -- -- -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- -- dotlessi -- -- -- f5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :Idot I. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :jcircumflex j^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Jcircumflex J^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- lslash l/ -- -- f8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- Lslash L/ -- -- e8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- ntilde n~ -- f1 -- a4 96 f1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- -- Ntilde N~ -- d1 -- a5 84 d1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- -- oslash o/ -- f8 f9 -- bf f8 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- -- Oslash O/ -- d8 e9 ed af d8 -- -- DA -- -- -- -- -- -- -- -- NO -- -- -- -- -- oe oe -- -- fa -- cf f7 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- OE OE -- -- ea -- ce d7 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- ordmasculine o- -- ba eb a7 bc ba -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- oacute o' -- f3 -- a2 97 f3 -- -- -- -- -- -- -- -- HU -- -- -- PL PR SP -- -- Oacute O' -- d3 -- -- -- d3 -- -- -- -- -- -- -- -- HU -- -- -- PL PR SP -- -- ocircumflex o^ -- f4 -- 93 99 f4 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- -- Ocircumflex O^ -- d4 -- -- -- d4 -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- -- odieresis o" -- f6 -- 94 9a f6 -- -- -- -- -- FI -- GE HU -- -- -- -- -- -- SW TU Odieresis O" -- d6 -- 99 85 d6 -- -- -- -- -- FI -- GE HU -- -- -- -- -- -- SW TU ograve o` -- f2 -- 95 98 f2 -- -- ---- -- -- -- -- -- -- IT -- -- -- -- -- -- Ograve O` -- d2 -- -- -- d2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :ohungarumlaut o* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- -- :Ohungarumlaut O* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- -- otilde o~ -- f5 -- -- 9b f5 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- Otilde O~ -- d5 -- -- cd d5 -- -- -- -- -- -- -- -- -- -- -- -- -- PR -- -- -- germandbls ss -- df fb e1 a7 df -- -- -- -- -- -- -- GE -- -- -- -- -- -- -- -- -- :sacute s' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Sacute S' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- scaron sv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- Scaron Sv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :scedilla s, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :Scedilla S, -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU :scircumflex s^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Scircumflex S^ -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- uacute u' -- fa -- a3 9c fa -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- Uacute U' -- da -- -- -- da -- -- -- -- -- -- -- -- HU -- -- -- -- -- SP -- -- :ubreve uu -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- :Ubreve Uu -- -- -- -- -- -- -- -- -- -- ES -- -- -- -- -- -- -- -- -- -- -- -- ucircumflex u^ -- fb -- 96 9e fb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU Ucircumflex U^ -- db -- -- -- db -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- TU udieresis u" -- fc -- 81 9f fc -- -- -- -- -- -- FR GE HU -- -- -- -- PR SP -- TU Udieresis U" -- dc -- 9a 86 dc -- -- -- -- -- -- FR GE HU -- -- -- -- PR SP -- TU ugrave u` -- f9 -- 97 9d f9 -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- -- Ugrave U` -- d9 -- -- -- d9 -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- :uhungarumlaut u* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- -- :Uhungarumlaut U* -- -- -- -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- -- :yacute -- -- fd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :Yacute -- -- dd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ydieresis y" -- ff -- 98 d8 fd -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- -- Ydieresis Y" -- -- -- -- -- dd -- -- -- DU -- -- -- -- -- -- -- -- -- -- -- -- -- :zacute z' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Zacute Z' -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- zcaron zv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- Zcaron Zv -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :zdot z. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :Zdot Z. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- :icelandiceth -- -- f0 -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- -- :icelandicETH -- -- d0 -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- -- :celandicthorn -- -- fe -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- -- :celandicTHORN -- -- de -- -- -- -- -- -- -- -- -- -- -- -- -- IC -- -- -- -- -- -- -- exclamdown !! -- a1 a1 ad c1 a1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- -- questiondown ?? -- bf bf a8 c0 bf -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- -- sterling L- -- a3 a3 9c a3 a3 -- BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- yen Y- -- a5 a5 9d b4 a5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- florin -- -- -- a6 9f c4 -- -- -- -- -- -- -- -- -- -- -- IT -- -- -- -- -- -- :peseta Pt -- -- -- 9e -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- SP -- -- currency ox -- a4 a8 -- -- a8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- cent c/ -- a2 a2 9b a2 a2 AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- plusminus +- -- b1 -- -- -- b1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :registered rO -- -- -- -- a8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :copyright cO -- a9 -- -- a9 a9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :trademark tm -- ae -- -- aa -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- section S* -- a7 a7 15 a4 a7 AM -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- paragraph P| -- a7 b6 14 a6 b6 AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quotesingle -- -- 27 a9 -- 27 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quoteleft ` -- -- 60 -- d4 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quoteright ' -- -- 27 -- d5 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quotedblleft -- -- -- aa -- d2 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quotedblright -- -- -- ba -- d3 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quotesinglbase -- -- -- b8 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- quotedblbase -- -- -- b9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- guillemoright >> -- bb bb af c8 bb -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- guillemotleft << -- ab ab ae c7 ab -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- guilsinglleft -- -- -- ac -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- guilsinglright -- -- -- ad -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- -- -- -- -- dagger -- -- -- b2 -- a0 -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- daggerdbl -- -- -- b3 -- -- -- AM -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- endash -- -- -- b1 -- d0 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- emdash -- -- -- d0 -- d1 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- periodcentered -- -- -- b4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- bullet -- -- b7 b7 f9 a5 b7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ellipsis -- -- -- bc -- c9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- perthousand -- -- -- bd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- grave ` 60 -- c1 -- -- -- -- -- -- -- -- -- FR -- -- -- IT -- -- -- -- -- -- acute ' 27 b4 c2 -- ab -- -- -- -- -- -- -- FR -- HU -- -- -- PL PR SP -- -- circumflex ^ 5e -- c3 -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU tilde ~ 7e -- c4 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PR SP -- -- macron -- -- af c5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- breve -- -- -- c6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- TU dotaccent -- -- -- c7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- TU dieresis " -- a8 c8 -- ac -- -- -- -- DU -- FI FR GE HU -- -- -- PL PR SP SW TU ring ** -- b0 ca f8 a1 b0 AM BR DA -- -- -- -- -- -- -- -- NO -- -- -- SW -- cedilla , -- b8 cb -- -- -- -- -- -- -- -- -- FR -- -- -- -- -- -- PR -- -- TU hungarumlaut '' -- -- cd -- -- -- -- -- -- -- -- -- -- -- HU -- -- -- -- -- -- -- -- ogonek -- -- -- ce -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- PL -- -- -- -- caron -- -- -- cf -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- fi -- -- -- ae -- -- -- AM BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- fl -- -- -- af -- -- -- AM BR -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :nobreakspace b/ -- a0 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :softhyphen -- -- ad -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :brokenbar -- -- a6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- logicalnot -- -- ac -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- mu /u -- b5 -- -- -- b5 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :pilcrow -- -- b6 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :super1 -- -- b9 -- -- -- b9 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :super2 -- -- b2 -- -- -- b2 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :super3 -- -- b3 -- -- -- b3 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :1/4 -- -- bc -- -- -- bc -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :1/2 -- -- bd -- -- -- bd -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :3/4 -- -- be -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :do.not.use -- -- d7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- :do.not.use -- -- f7 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- French acircumflex a^ -- e2 -- 83 89 e2 ocircumflex o^ -- f4 -- 93 99 f4 Acircumflex A^ -- c2 -- -- -- c2 Ocircumflex O^ -- d4 -- -- -- d4 agrave a` -- e0 -- 85 88 e0 ucircumflex u^ -- fb -- 96 9e fb Agrave A` -- c0 -- -- cb c0 Ucircumflex U^ -- db -- -- -- db ccedilla c, -- e7 -- 87 8d e7 udieresis u" -- fc -- 81 9f fc Ccedilla C, -- c7 -- 80 82 c7 Udieresis U" -- dc -- 9a 86 dc eacute e' -- e9 -- 82 8e e9 ugrave u` -- f9 -- 97 9d f9 Eacute E' -- c9 -- 90 83 c9 Ugrave U` -- d9 -- -- -- d9 ecircumflex e^ -- ea -- 88 90 ea section S* -- a7 a7 15 a4 a7 Ecircumflex E^ -- ca -- -- -- ca guillemoright >> -- bb bb af c8 bb edieresis e" -- eb -- 89 91 eb guillemotleft << -- ab ab ae c7 ab Edieresis E" -- cb -- -- -- cb guilsinglleft -- -- -- ac -- -- -- egrave e` -- e8 -- 8a 8f e8 guilsinglright -- -- -- ad -- -- -- Egrave E` -- c8 -- -- -- c8 grave ` 60 -- c1 -- -- -- icircumflex i^ -- ee -- 8c 94 ee acute ' 27 b4 c2 -- ab -- Icircumflex I^ -- ce -- -- -- ce circumflex ^ 5e -- c3 -- -- -- idieresis i" -- ef -- 8b 95 ef dieresis " -- a8 c8 -- ac -- Idieresis I" -- cf -- -- -- cf cedilla , -- b8 cb -- -- -- oe oe -- -- fa -- cf f7 OE OE -- -- ea -- ce d7
jhenry@randvax.UUCP (Jim Henry) (02/22/86)
What follows are tabulations of characters that might be needed to properly support a particular language that are not part of the standard ASCII character set. The master table from which these are drawn has been posted to net.internat. I am cross-posting to net.nlang to solicit comments and corrections. Please mail these to me. I will post a corrected version of this information if there is enough interest. If you can authoritatively state that some part of this is correct I'd like to hear that too! (I speak only English so this hasn't been easy to do.) Followups have been directed to net.internat. Each character is described by its PostScript name or a PostScript-like name which starts with a :. Usually a two ASCII character sequence is given which suggests what the character looks like. (Visualize the two characters as an overstrike.) Following this are the hexadecimal codes for a number of popular systems which have an extended character set. The key for these devices is as follows: ASCII as ISO Latin-1 l1 PostScript ps IBM-PC pc MacIntosh mc DEC VT-220 vt This is a tabulation of the countries that are covered by the ISO Latin-1 proposal and the languages used. Help in completing this would be appreciated. SP Argentina FI Finland SP Panama BR Australia FR France SP Paraguay GE Austria GE Germany SP Peru Belgium SP Guatemala PR Portugal Belize Guyana SP El Salvador SP Bolivia SP Honduras SP Spain PR Brazil IC Iceland Surinam BR,FR Canada BR Ireland SW Sweden SP Chile IT Italy Switzerland SP Colombia Liechtenstein DU The Netherlands SP Costa Rica Luxemburg BR United Kingdom SP Cuba SP Mexico AM United States DA Denmark BR New Zealand SP Uruguay SP Ecuador SP Nicaragua SP Venezuela Faroe Islands NO Norway Language codes -------------- American AM French FR Polish PL British BR German GE Portuguese PR Danish DA Hungarian HU Spanish SP Dutch DU Icelandic IC Swedish SW Esperanto ES Italian IT Turkish TU Finnish FI Norwegian NO I have tabulated seventeen languages using Latin alphabets. Are there others that someone could tabulate? American American extension are basically all symbols. I think the ligatures fi and fl are essentially typographic in nature and shouldn't be considered in a standard character set. The typographic quotes can probably be dispensed with in favor of the existing ASCII characters. dagger and double dagger do not seem important. There are additional typographic symbols such as copyright which are in the master table but I didn't pick-up all the symbols when I extracted this. PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt cent c/ -- a2 a2 9b a2 a2 quotesingle -- -- 27 a9 -- 27 -- section S* -- a7 a7 15 a4 a7 quoteleft ` -- -- 60 -- d4 -- paragraph P| -- a7 b6 14 a6 b6 quoteright ' -- -- 27 -- d5 -- dagger -- -- -- b2 -- a0 -- quotedblleft -- -- -- aa -- d2 -- daggerdbl -- -- -- b3 -- -- -- quotedblright -- -- -- ba -- d3 -- ring ** -- b0 ca f8 a1 b0 fi -- -- -- ae -- -- -- fl -- -- -- af -- -- -- British The only British extension that is not common with American is the pound sterling symbol. PostScript as l1 ps pc mc vt sterling L- -- a3 a3 9c a3 a3 Danish PostScript as l1 ps pc mc vt ae ae -- e6 f1 91 be e6 AE AE -- c6 e1 92 ae c6 aring ao -- e5 -- 86 8c e5 Aring Ao -- c5 -- 8f 81 c5 oslash o/ -- f8 f9 -- bf f8 Oslash O/ -- d8 e9 ed af d8 ring ** -- b0 ca f8 a1 b0 Dutch Is the Dutch ligature ij typographic in nature, like English fi, or should it be part of an extended set? What is the use of y dieresis as a substitute for ij? Is it good practice or a workaround? PostScript as l1 ps pc mc vt ij ij -- -- -- -- -- -- IJ IJ -- -- -- -- -- -- ydieresis y" -- ff -- 98 d8 fd Ydieresis Y" -- -- -- -- -- dd dieresis " -- a8 c8 -- ac -- Esperanto Are all these still used in Esperanto or are some archaic? PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt :ccircumflex c^ -- -- -- -- -- -- :jcircumflex j^ -- -- -- -- -- -- :Ccircumflex C^ -- -- -- -- -- -- :Jcircumflex J^ -- -- -- -- -- -- :gcircumflex g^ -- -- -- -- -- -- :scircumflex s^ -- -- -- -- -- -- :Gcircumflex G^ -- -- -- -- -- -- :Scircumflex S^ -- -- -- -- -- -- :hcircumflex h^ -- -- -- -- -- -- :ubreve uu -- -- -- -- -- -- :Hcircumflex H^ -- -- -- -- -- -- :Ubreve Uu -- -- -- -- -- -- Finnish PostScript as l1 ps pc mc vt adieresis a" -- e4 -- 84 8a e4 Adieresis A" -- c4 -- 8e 80 c4 odieresis o" -- f6 -- 94 9a f6 Odieresis O" -- d6 -- 99 85 d6 dieresis " -- a8 c8 -- ac -- French How important is the oe ligature? The ISO Latin-1 set does not have oe. Is a single guillemot needed? PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt acircumflex a^ -- e2 -- 83 89 e2 ocircumflex o^ -- f4 -- 93 99 f4 Acircumflex A^ -- c2 -- -- -- c2 Ocircumflex O^ -- d4 -- -- -- d4 agrave a` -- e0 -- 85 88 e0 ucircumflex u^ -- fb -- 96 9e fb Agrave A` -- c0 -- -- cb c0 Ucircumflex U^ -- db -- -- -- db ccedilla c, -- e7 -- 87 8d e7 udieresis u" -- fc -- 81 9f fc Ccedilla C, -- c7 -- 80 82 c7 Udieresis U" -- dc -- 9a 86 dc eacute e' -- e9 -- 82 8e e9 ugrave u` -- f9 -- 97 9d f9 Eacute E' -- c9 -- 90 83 c9 Ugrave U` -- d9 -- -- -- d9 ecircumflex e^ -- ea -- 88 90 ea section S* -- a7 a7 15 a4 a7 Ecircumflex E^ -- ca -- -- -- ca guillemoright >> -- bb bb af c8 bb edieresis e" -- eb -- 89 91 eb guillemotleft << -- ab ab ae c7 ab Edieresis E" -- cb -- -- -- cb guilsinglleft -- -- -- ac -- -- -- egrave e` -- e8 -- 8a 8f e8 guilsinglright -- -- -- ad -- -- -- Egrave E` -- c8 -- -- -- c8 grave ` 60 -- c1 -- -- -- icircumflex i^ -- ee -- 8c 94 ee acute ' 27 b4 c2 -- ab -- Icircumflex I^ -- ce -- -- -- ce circumflex ^ 5e -- c3 -- -- -- idieresis i" -- ef -- 8b 95 ef dieresis " -- a8 c8 -- ac -- Idieresis I" -- cf -- -- -- cf cedilla , -- b8 cb -- -- -- oe oe -- -- fa -- cf f7 OE OE -- -- ea -- ce d7 German Please remember that the double s is not the same as Greek beta! I don't read German but that error still offends my eyes. PostScript as l1 ps pc mc vt adieresis a" -- e4 -- 84 8a e4 Adieresis A" -- c4 -- 8e 80 c4 odieresis o" -- f6 -- 94 9a f6 Odieresis O" -- d6 -- 99 85 d6 germandbls ss -- df fb e1 a7 df udieresis u" -- fc -- 81 9f fc Udieresis U" -- dc -- 9a 86 dc dieresis " -- a8 c8 -- ac -- Hungarian PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt aacute a' -- e1 -- a0 87 e1 uacute u' -- fa -- a3 9c fa Aacute A' -- c1 -- -- -- c1 Uacute U' -- da -- -- -- da eacute e' -- e9 -- 82 8e e9 udieresis u" -- fc -- 81 9f fc Eacute E' -- c9 -- 90 83 c9 Udieresis U" -- dc -- 9a 86 dc iacute i' -- ed a1 92 ed -- :uhungarumlaut u* -- -- -- -- -- -- Iacute I' -- cd -- -- -- cd :Uhungarumlaut U* -- -- -- -- -- -- oacute o' -- f3 -- a2 97 f3 acute ' 27 b4 c2 -- ab -- Oacute O' -- d3 -- -- -- d3 dieresis " -- a8 c8 -- ac -- odieresis o" -- f6 -- 94 9a f6 hungarumlaut '' -- -- cd -- -- -- Odieresis O" -- d6 -- 99 85 d6 :ohungarumlaut o* -- -- -- -- -- -- :Ohungarumlaut O* -- -- -- -- -- -- Icelandic I know nothing about Icelandic! Any other extended characters? PostScript as l1 ps pc mc vt :icelandiceth -- -- f0 -- -- -- -- :icelandicETH -- -- d0 -- -- -- -- :celandicthorn -- -- fe -- -- -- -- :celandicTHORN -- -- de -- -- -- -- Italian Does Italian use Igrave and Ograve? I have information that says they are used but rarely. PostScript as l1 ps pc mc vt agrave a` -- e0 -- 85 88 e0 egrave e` -- e8 -- 8a 8f e8 igrave i` -- ec -- 8d 93 ec ograve o` -- f2 -- 95 98 f2 ugrave u` -- f9 -- 97 9d f9 florin -- -- -- a6 9f c4 -- grave ` 60 -- c1 -- -- -- Norwegian PostScript as l1 ps pc mc vt ae ae -- e6 f1 91 be e6 AE AE -- c6 e1 92 ae c6 aring ao -- e5 -- 86 8c e5 Aring Ao -- c5 -- 8f 81 c5 oslash o/ -- f8 f9 -- bf f8 Oslash O/ -- d8 e9 ed af d8 ring ** -- b0 ca f8 a1 b0 Polish An ogonek is a mirror image of a cedilla. PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt :aogonek a, -- -- -- -- -- -- :sacute s' -- -- -- -- -- -- :Aogonek A, -- -- -- -- -- -- :Sacute S' -- -- -- -- -- -- :cacute c' -- -- -- -- -- -- :zacute z' -- -- -- -- -- -- :Cacute C' -- -- -- -- -- -- :Zacute Z' -- -- -- -- -- -- :eogonek e, -- -- -- -- -- -- :zdot z. -- -- -- -- -- -- :Eogonek E, -- -- -- -- -- -- :Zdot Z. -- -- -- -- -- -- lslash l/ -- -- f8 -- -- -- acute ' 27 b4 c2 -- ab -- Lslash L/ -- -- e8 -- -- -- dotaccent -- -- -- c7 -- -- -- oacute o' -- f3 -- a2 97 f3 dieresis " -- a8 c8 -- ac -- Oacute O' -- d3 -- -- -- d3 ogonek -- -- -- ce -- -- -- Portuguese Are e tilde, i tilde, or u tilde used? Is there a special use of tilde in contractions that needs to be considered? PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt ordfeminine a- -- aa e3 a6 bb aa ocircumflex o^ -- f4 -- 93 99 f4 atilde a~ -- e3 -- -- 8b e3 Ocircumflex O^ -- d4 -- -- -- d4 Atilde A~ -- c3 -- -- cc c3 otilde o~ -- f5 -- -- 9b f5 ccedilla c, -- e7 -- 87 8d e7 Otilde O~ -- d5 -- -- cd d5 Ccedilla C, -- c7 -- 80 82 c7 udieresis u" -- fc -- 81 9f fc eacute e' -- e9 -- 82 8e e9 Udieresis U" -- dc -- 9a 86 dc Eacute E' -- c9 -- 90 83 c9 acute ' 27 b4 c2 -- ab -- ecircumflex e^ -- ea -- 88 90 ea circumflex ^ 5e -- c3 -- -- -- Ecircumflex E^ -- ca -- -- -- ca tilde ~ 7e -- c4 -- -- -- ordmasculine o- -- ba eb a7 bc ba dieresis " -- a8 c8 -- ac -- oacute o' -- f3 -- a2 97 f3 cedilla , -- b8 cb -- -- -- Oacute O' -- d3 -- -- -- d3 Spanish Is the Pt ligature for peseta needed? PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt aacute a' -- e1 -- a0 87 e1 uacute u' -- fa -- a3 9c fa Aacute A' -- c1 -- -- -- c1 Uacute U' -- da -- -- -- da eacute e' -- e9 -- 82 8e e9 udieresis u" -- fc -- 81 9f fc Eacute E' -- c9 -- 90 83 c9 Udieresis U" -- dc -- 9a 86 dc iacute i' -- ed a1 92 ed -- exclamdown !! -- a1 a1 ad c1 a1 Iacute I' -- cd -- -- -- cd questiondown ?? -- bf bf a8 c0 bf ntilde n~ -- f1 -- a4 96 f1 :peseta Pt -- -- -- 9e -- -- Ntilde N~ -- d1 -- a5 84 d1 acute ' 27 b4 c2 -- ab -- oacute o' -- f3 -- a2 97 f3 tilde ~ 7e -- c4 -- -- -- Oacute O' -- d3 -- -- -- d3 dieresis " -- a8 c8 -- ac -- Swedish PostScript as l1 ps pc mc vt adieresis a" -- e4 -- 84 8a e4 Adieresis A" -- c4 -- 8e 80 c4 aring ao -- e5 -- 86 8c e5 Aring Ao -- c5 -- 8f 81 c5 odieresis o" -- f6 -- 94 9a f6 Odieresis O" -- d6 -- 99 85 d6 dieresis " -- a8 c8 -- ac -- ring ** -- b0 ca f8 a1 b0 Turkish The breve is a rounded mark liked a squashed U. A caron is more angular like a V. Is the accent on a G a breve or a caron? PostScript as l1 ps pc mc vt PostScript as l1 ps pc mc vt acircumflex a^ -- e2 -- 83 89 e2 ucircumflex u^ -- fb -- 96 9e fb Acircumflex A^ -- c2 -- -- -- c2 Ucircumflex U^ -- db -- -- -- db ccedilla c, -- e7 -- 87 8d e7 udieresis u" -- fc -- 81 9f fc Ccedilla C, -- c7 -- 80 82 c7 Udieresis U" -- dc -- 9a 86 dc :gbreve gu -- -- -- -- -- -- circumflex ^ 5e -- c3 -- -- -- :Gbreve Gu -- -- -- -- -- -- breve -- -- -- c6 -- -- -- dotlessi -- -- -- f5 -- -- -- dotaccent -- -- -- c7 -- -- -- :Idot I. -- -- -- -- -- -- dieresis " -- a8 c8 -- ac -- odieresis o" -- f6 -- 94 9a f6 cedilla , -- b8 cb -- -- -- Odieresis O" -- d6 -- 99 85 d6 :scedilla s, -- -- -- -- -- -- :Scedilla S, -- -- -- -- -- --
blarson@oberon.UUCP (Bob Larson) (02/23/86)
My only disagreement with the comments is I think mu should be included. It is the standard abreviation for the metric prefix micro, and therefor has quite a bit of non-scientic use. (I would also like upper case omega, but its use out of electrical/electronic context is limited.) -- Bob Larson Arpa: Blarson@Usc-Ecl.Arpa Uucp: ihnp4!sdcrdcf!oberon!blarson
jhenry@randvax.UUCP (Jim Henry) (02/26/86)
It has come to my attention that we have been putting 'rand-unix' in the Reply-To: field. The correct network name is 'randvax'. My apologies to anyone inconvenienced by this. I have received comments from Steven Pemberton, Stavros Macrakis, and Rich Wales. I will acknowledge all messages since I know some must travel through rather difficult paths. Lest anyone be confused, my tabulation is NOT intended to contain any value judgments. It is simply a compilation of all the information I could lay my hands on in a way that I thought might be useful. The information I have already received will allow me to extend and refine the table considerably.