home *** CD-ROM | disk | FTP | other *** search
/ SGI Freeware 1999 August / SGI Freeware 1999 August.iso / dist / fw_libxml.idb / usr / freeware / include / gnome-xml / parserInternals.h.z / parserInternals.h
Encoding:
C/C++ Source or Header  |  1999-07-16  |  23.4 KB  |  663 lines

  1. /*
  2.  * parserInternals.h : internals routines exported by the parser.
  3.  *
  4.  * See Copyright for the status of this software.
  5.  *
  6.  * Daniel.Veillard@w3.org
  7.  */
  8.  
  9. #ifndef __XML_PARSER_INTERNALS_H__
  10. #define __XML_PARSER_INTERNALS_H__
  11.  
  12. #include "parser.h"
  13.  
  14. #ifdef __cplusplus
  15. extern "C" {
  16. #endif
  17.  
  18. /**
  19.  * A few macros needed to help building the parser.
  20.  */
  21.  
  22. #ifdef UNICODE
  23. /************************************************************************
  24.  *                                    *
  25.  * UNICODE version of the macros.                          *
  26.  *                                    *
  27.  ************************************************************************/
  28. /*
  29.  * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
  30.  *                  | [#x10000-#x10FFFF]
  31.  * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
  32.  */
  33. #define IS_CHAR(c)                            \
  34.     ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) ||        \
  35.       (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) &&        \
  36.       (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) >= 0) &&        \
  37.       ((c) <= 0x10FFFF))
  38.  
  39. /*
  40.  * [3] S ::= (#x20 | #x9 | #xD | #xA)+
  41.  */
  42. #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) ||    \
  43.                      ((c) == 0x0D))
  44.  
  45. /*
  46.  * [85] BaseChar ::= ... long list see REC ...
  47.  *
  48.  * VI is your friend !
  49.  * :1,$ s/\[#x\([0-9A-Z]*\)-#x\([0-9A-Z]*\)\]/     (((c) >= 0x\1) \&\& ((c) <= 0x\2)) ||/
  50.  * and 
  51.  * :1,$ s/#x\([0-9A-Z]*\)/     ((c) == 0x\1) ||/
  52.  */
  53. #define IS_BASECHAR(c)                            \
  54.      ((((c) >= 0x0041) && ((c) <= 0x005A)) ||                \
  55.       (((c) >= 0x0061) && ((c) <= 0x007A)) ||                \
  56.       (((c) >= 0x00C0) && ((c) <= 0x00D6)) ||                \
  57.       (((c) >= 0x00D8) && ((c) <= 0x00F6)) ||                \
  58.       (((c) >= 0x00F8) && ((c) <= 0x00FF)) ||                \
  59.       (((c) >= 0x0100) && ((c) <= 0x0131)) ||                \
  60.       (((c) >= 0x0134) && ((c) <= 0x013E)) ||                \
  61.       (((c) >= 0x0141) && ((c) <= 0x0148)) ||                \
  62.       (((c) >= 0x014A) && ((c) <= 0x017E)) ||                \
  63.       (((c) >= 0x0180) && ((c) <= 0x01C3)) ||                \
  64.       (((c) >= 0x01CD) && ((c) <= 0x01F0)) ||                \
  65.       (((c) >= 0x01F4) && ((c) <= 0x01F5)) ||                \
  66.       (((c) >= 0x01FA) && ((c) <= 0x0217)) ||                \
  67.       (((c) >= 0x0250) && ((c) <= 0x02A8)) ||                \
  68.       (((c) >= 0x02BB) && ((c) <= 0x02C1)) ||                \
  69.       ((c) == 0x0386) ||                        \
  70.       (((c) >= 0x0388) && ((c) <= 0x038A)) ||                \
  71.       ((c) == 0x038C) ||                        \
  72.       (((c) >= 0x038E) && ((c) <= 0x03A1)) ||                \
  73.       (((c) >= 0x03A3) && ((c) <= 0x03CE)) ||                \
  74.       (((c) >= 0x03D0) && ((c) <= 0x03D6)) ||                \
  75.       ((c) == 0x03DA) ||                        \
  76.       ((c) == 0x03DC) ||                        \
  77.       ((c) == 0x03DE) ||                        \
  78.       ((c) == 0x03E0) ||                        \
  79.       (((c) >= 0x03E2) && ((c) <= 0x03F3)) ||                \
  80.       (((c) >= 0x0401) && ((c) <= 0x040C)) ||                \
  81.       (((c) >= 0x040E) && ((c) <= 0x044F)) ||                \
  82.       (((c) >= 0x0451) && ((c) <= 0x045C)) ||                \
  83.       (((c) >= 0x045E) && ((c) <= 0x0481)) ||                \
  84.       (((c) >= 0x0490) && ((c) <= 0x04C4)) ||                \
  85.       (((c) >= 0x04C7) && ((c) <= 0x04C8)) ||                \
  86.       (((c) >= 0x04CB) && ((c) <= 0x04CC)) ||                \
  87.       (((c) >= 0x04D0) && ((c) <= 0x04EB)) ||                \
  88.       (((c) >= 0x04EE) && ((c) <= 0x04F5)) ||                \
  89.       (((c) >= 0x04F8) && ((c) <= 0x04F9)) ||                \
  90.       (((c) >= 0x0531) && ((c) <= 0x0556)) ||                \
  91.       ((c) == 0x0559) ||                        \
  92.       (((c) >= 0x0561) && ((c) <= 0x0586)) ||                \
  93.       (((c) >= 0x05D0) && ((c) <= 0x05EA)) ||                \
  94.       (((c) >= 0x05F0) && ((c) <= 0x05F2)) ||                \
  95.       (((c) >= 0x0621) && ((c) <= 0x063A)) ||                \
  96.       (((c) >= 0x0641) && ((c) <= 0x064A)) ||                \
  97.       (((c) >= 0x0671) && ((c) <= 0x06B7)) ||                \
  98.       (((c) >= 0x06BA) && ((c) <= 0x06BE)) ||                \
  99.       (((c) >= 0x06C0) && ((c) <= 0x06CE)) ||                \
  100.       (((c) >= 0x06D0) && ((c) <= 0x06D3)) ||                \
  101.       ((c) == 0x06D5) ||                        \
  102.       (((c) >= 0x06E5) && ((c) <= 0x06E6)) ||                \
  103.       (((c) >= 0x0905) && ((c) <= 0x0939)) ||                \
  104.       ((c) == 0x093D) ||                        \
  105.       (((c) >= 0x0958) && ((c) <= 0x0961)) ||                \
  106.       (((c) >= 0x0985) && ((c) <= 0x098C)) ||                \
  107.       (((c) >= 0x098F) && ((c) <= 0x0990)) ||                \
  108.       (((c) >= 0x0993) && ((c) <= 0x09A8)) ||                \
  109.       (((c) >= 0x09AA) && ((c) <= 0x09B0)) ||                \
  110.       ((c) == 0x09B2) ||                        \
  111.       (((c) >= 0x09B6) && ((c) <= 0x09B9)) ||                \
  112.       (((c) >= 0x09DC) && ((c) <= 0x09DD)) ||                \
  113.       (((c) >= 0x09DF) && ((c) <= 0x09E1)) ||                \
  114.       (((c) >= 0x09F0) && ((c) <= 0x09F1)) ||                \
  115.       (((c) >= 0x0A05) && ((c) <= 0x0A0A)) ||                \
  116.       (((c) >= 0x0A0F) && ((c) <= 0x0A10)) ||                \
  117.       (((c) >= 0x0A13) && ((c) <= 0x0A28)) ||                \
  118.       (((c) >= 0x0A2A) && ((c) <= 0x0A30)) ||                \
  119.       (((c) >= 0x0A32) && ((c) <= 0x0A33)) ||                \
  120.       (((c) >= 0x0A35) && ((c) <= 0x0A36)) ||                \
  121.       (((c) >= 0x0A38) && ((c) <= 0x0A39)) ||                \
  122.       (((c) >= 0x0A59) && ((c) <= 0x0A5C)) ||                \
  123.       ((c) == 0x0A5E) ||                        \
  124.       (((c) >= 0x0A72) && ((c) <= 0x0A74)) ||                \
  125.       (((c) >= 0x0A85) && ((c) <= 0x0A8B)) ||                \
  126.       ((c) == 0x0A8D) ||                        \
  127.       (((c) >= 0x0A8F) && ((c) <= 0x0A91)) ||                \
  128.       (((c) >= 0x0A93) && ((c) <= 0x0AA8)) ||                \
  129.       (((c) >= 0x0AAA) && ((c) <= 0x0AB0)) ||                \
  130.       (((c) >= 0x0AB2) && ((c) <= 0x0AB3)) ||                \
  131.       (((c) >= 0x0AB5) && ((c) <= 0x0AB9)) ||                \
  132.       ((c) == 0x0ABD) ||                        \
  133.       ((c) == 0x0AE0) ||                        \
  134.       (((c) >= 0x0B05) && ((c) <= 0x0B0C)) ||                \
  135.       (((c) >= 0x0B0F) && ((c) <= 0x0B10)) ||                \
  136.       (((c) >= 0x0B13) && ((c) <= 0x0B28)) ||                \
  137.       (((c) >= 0x0B2A) && ((c) <= 0x0B30)) ||                \
  138.       (((c) >= 0x0B32) && ((c) <= 0x0B33)) ||                \
  139.       (((c) >= 0x0B36) && ((c) <= 0x0B39)) ||                \
  140.       ((c) == 0x0B3D) ||                        \
  141.       (((c) >= 0x0B5C) && ((c) <= 0x0B5D)) ||                \
  142.       (((c) >= 0x0B5F) && ((c) <= 0x0B61)) ||                \
  143.       (((c) >= 0x0B85) && ((c) <= 0x0B8A)) ||                \
  144.       (((c) >= 0x0B8E) && ((c) <= 0x0B90)) ||                \
  145.       (((c) >= 0x0B92) && ((c) <= 0x0B95)) ||                \
  146.       (((c) >= 0x0B99) && ((c) <= 0x0B9A)) ||                \
  147.       ((c) == 0x0B9C) ||                        \
  148.       (((c) >= 0x0B9E) && ((c) <= 0x0B9F)) ||                \
  149.       (((c) >= 0x0BA3) && ((c) <= 0x0BA4)) ||                \
  150.       (((c) >= 0x0BA8) && ((c) <= 0x0BAA)) ||                \
  151.       (((c) >= 0x0BAE) && ((c) <= 0x0BB5)) ||                \
  152.       (((c) >= 0x0BB7) && ((c) <= 0x0BB9)) ||                \
  153.       (((c) >= 0x0C05) && ((c) <= 0x0C0C)) ||                \
  154.       (((c) >= 0x0C0E) && ((c) <= 0x0C10)) ||                \
  155.       (((c) >= 0x0C12) && ((c) <= 0x0C28)) ||                \
  156.       (((c) >= 0x0C2A) && ((c) <= 0x0C33)) ||                \
  157.       (((c) >= 0x0C35) && ((c) <= 0x0C39)) ||                \
  158.       (((c) >= 0x0C60) && ((c) <= 0x0C61)) ||                \
  159.       (((c) >= 0x0C85) && ((c) <= 0x0C8C)) ||                \
  160.       (((c) >= 0x0C8E) && ((c) <= 0x0C90)) ||                \
  161.       (((c) >= 0x0C92) && ((c) <= 0x0CA8)) ||                \
  162.       (((c) >= 0x0CAA) && ((c) <= 0x0CB3)) ||                \
  163.       (((c) >= 0x0CB5) && ((c) <= 0x0CB9)) ||                \
  164.       ((c) == 0x0CDE) ||                        \
  165.       (((c) >= 0x0CE0) && ((c) <= 0x0CE1)) ||                \
  166.       (((c) >= 0x0D05) && ((c) <= 0x0D0C)) ||                \
  167.       (((c) >= 0x0D0E) && ((c) <= 0x0D10)) ||                \
  168.       (((c) >= 0x0D12) && ((c) <= 0x0D28)) ||                \
  169.       (((c) >= 0x0D2A) && ((c) <= 0x0D39)) ||                \
  170.       (((c) >= 0x0D60) && ((c) <= 0x0D61)) ||                \
  171.       (((c) >= 0x0E01) && ((c) <= 0x0E2E)) ||                \
  172.       ((c) == 0x0E30) ||                        \
  173.       (((c) >= 0x0E32) && ((c) <= 0x0E33)) ||                \
  174.       (((c) >= 0x0E40) && ((c) <= 0x0E45)) ||                \
  175.       (((c) >= 0x0E81) && ((c) <= 0x0E82)) ||                \
  176.       ((c) == 0x0E84) ||                        \
  177.       (((c) >= 0x0E87) && ((c) <= 0x0E88)) ||                \
  178.       ((c) == 0x0E8A) ||                        \
  179.       ((c) == 0x0E8D) ||                        \
  180.       (((c) >= 0x0E94) && ((c) <= 0x0E97)) ||                \
  181.       (((c) >= 0x0E99) && ((c) <= 0x0E9F)) ||                \
  182.       (((c) >= 0x0EA1) && ((c) <= 0x0EA3)) ||                \
  183.       ((c) == 0x0EA5) ||                        \
  184.       ((c) == 0x0EA7) ||                        \
  185.       (((c) >= 0x0EAA) && ((c) <= 0x0EAB)) ||                \
  186.       (((c) >= 0x0EAD) && ((c) <= 0x0EAE)) ||                \
  187.       ((c) == 0x0EB0) ||                        \
  188.       (((c) >= 0x0EB2) && ((c) <= 0x0EB3)) ||                \
  189.       ((c) == 0x0EBD) ||                        \
  190.       (((c) >= 0x0EC0) && ((c) <= 0x0EC4)) ||                \
  191.       (((c) >= 0x0F40) && ((c) <= 0x0F47)) ||                \
  192.       (((c) >= 0x0F49) && ((c) <= 0x0F69)) ||                \
  193.       (((c) >= 0x10A0) && ((c) <= 0x10C5)) ||                \
  194.       (((c) >= 0x10D0) && ((c) <= 0x10F6)) ||                \
  195.       ((c) == 0x1100) ||                        \
  196.       (((c) >= 0x1102) && ((c) <= 0x1103)) ||                \
  197.       (((c) >= 0x1105) && ((c) <= 0x1107)) ||                \
  198.       ((c) == 0x1109) ||                        \
  199.       (((c) >= 0x110B) && ((c) <= 0x110C)) ||                \
  200.       (((c) >= 0x110E) && ((c) <= 0x1112)) ||                \
  201.       ((c) == 0x113C) ||                        \
  202.       ((c) == 0x113E) ||                        \
  203.       ((c) == 0x1140) ||                        \
  204.       ((c) == 0x114C) ||                        \
  205.       ((c) == 0x114E) ||                        \
  206.       ((c) == 0x1150) ||                        \
  207.       (((c) >= 0x1154) && ((c) <= 0x1155)) ||                \
  208.       ((c) == 0x1159) ||                        \
  209.       (((c) >= 0x115F) && ((c) <= 0x1161)) ||                \
  210.       ((c) == 0x1163) ||                        \
  211.       ((c) == 0x1165) ||                        \
  212.       ((c) == 0x1167) ||                        \
  213.       ((c) == 0x1169) ||                        \
  214.       (((c) >= 0x116D) && ((c) <= 0x116E)) ||                \
  215.       (((c) >= 0x1172) && ((c) <= 0x1173)) ||                \
  216.       ((c) == 0x1175) ||                        \
  217.       ((c) == 0x119E) ||                        \
  218.       ((c) == 0x11A8) ||                        \
  219.       ((c) == 0x11AB) ||                        \
  220.       (((c) >= 0x11AE) && ((c) <= 0x11AF)) ||                \
  221.       (((c) >= 0x11B7) && ((c) <= 0x11B8)) ||                \
  222.       ((c) == 0x11BA) ||                        \
  223.       (((c) >= 0x11BC) && ((c) <= 0x11C2)) ||                \
  224.       ((c) == 0x11EB) ||                        \
  225.       ((c) == 0x11F0) ||                        \
  226.       ((c) == 0x11F9) ||                        \
  227.       (((c) >= 0x1E00) && ((c) <= 0x1E9B)) ||                \
  228.       (((c) >= 0x1EA0) && ((c) <= 0x1EF9)) ||                \
  229.       (((c) >= 0x1F00) && ((c) <= 0x1F15)) ||                \
  230.       (((c) >= 0x1F18) && ((c) <= 0x1F1D)) ||                \
  231.       (((c) >= 0x1F20) && ((c) <= 0x1F45)) ||                \
  232.       (((c) >= 0x1F48) && ((c) <= 0x1F4D)) ||                \
  233.       (((c) >= 0x1F50) && ((c) <= 0x1F57)) ||                \
  234.       ((c) == 0x1F59) ||                        \
  235.       ((c) == 0x1F5B) ||                        \
  236.       ((c) == 0x1F5D) ||                        \
  237.       (((c) >= 0x1F5F) && ((c) <= 0x1F7D)) ||                \
  238.       (((c) >= 0x1F80) && ((c) <= 0x1FB4)) ||                \
  239.       (((c) >= 0x1FB6) && ((c) <= 0x1FBC)) ||                \
  240.       ((c) == 0x1FBE) ||                        \
  241.       (((c) >= 0x1FC2) && ((c) <= 0x1FC4)) ||                \
  242.       (((c) >= 0x1FC6) && ((c) <= 0x1FCC)) ||                \
  243.       (((c) >= 0x1FD0) && ((c) <= 0x1FD3)) ||                \
  244.       (((c) >= 0x1FD6) && ((c) <= 0x1FDB)) ||                \
  245.       (((c) >= 0x1FE0) && ((c) <= 0x1FEC)) ||                \
  246.       (((c) >= 0x1FF2) && ((c) <= 0x1FF4)) ||                \
  247.       (((c) >= 0x1FF6) && ((c) <= 0x1FFC)) ||                \
  248.       ((c) == 0x2126) ||                        \
  249.       (((c) >= 0x212A) && ((c) <= 0x212B)) ||                \
  250.       ((c) == 0x212E) ||                        \
  251.       (((c) >= 0x2180) && ((c) <= 0x2182)) ||                \
  252.       (((c) >= 0x3041) && ((c) <= 0x3094)) ||                \
  253.       (((c) >= 0x30A1) && ((c) <= 0x30FA)) ||                \
  254.       (((c) >= 0x3105) && ((c) <= 0x312C)) ||                \
  255.       (((c) >= 0xAC00) && ((c) <= 0xD7A3)))
  256.  
  257. /*
  258.  * [88] Digit ::= ... long list see REC ...
  259.  */
  260. #define IS_DIGIT(c)                             \
  261.      ((((c) >= 0x0030) && ((c) <= 0x0039)) ||                \
  262.       (((c) >= 0x0660) && ((c) <= 0x0669)) ||                \
  263.       (((c) >= 0x06F0) && ((c) <= 0x06F9)) ||                \
  264.       (((c) >= 0x0966) && ((c) <= 0x096F)) ||                \
  265.       (((c) >= 0x09E6) && ((c) <= 0x09EF)) ||                \
  266.       (((c) >= 0x0A66) && ((c) <= 0x0A6F)) ||                \
  267.       (((c) >= 0x0AE6) && ((c) <= 0x0AEF)) ||                \
  268.       (((c) >= 0x0B66) && ((c) <= 0x0B6F)) ||                \
  269.       (((c) >= 0x0BE7) && ((c) <= 0x0BEF)) ||                \
  270.       (((c) >= 0x0C66) && ((c) <= 0x0C6F)) ||                \
  271.       (((c) >= 0x0CE6) && ((c) <= 0x0CEF)) ||                \
  272.       (((c) >= 0x0D66) && ((c) <= 0x0D6F)) ||                \
  273.       (((c) >= 0x0E50) && ((c) <= 0x0E59)) ||                \
  274.       (((c) >= 0x0ED0) && ((c) <= 0x0ED9)) ||                \
  275.       (((c) >= 0x0F20) && ((c) <= 0x0F29)))
  276.  
  277. /*
  278.  * [87] CombiningChar ::= ... long list see REC ...
  279.  */
  280. #define IS_COMBINING(c)                         \
  281.      ((((c) >= 0x0300) && ((c) <= 0x0345)) ||                \
  282.       (((c) >= 0x0360) && ((c) <= 0x0361)) ||                \
  283.       (((c) >= 0x0483) && ((c) <= 0x0486)) ||                \
  284.       (((c) >= 0x0591) && ((c) <= 0x05A1)) ||                \
  285.       (((c) >= 0x05A3) && ((c) <= 0x05B9)) ||                \
  286.       (((c) >= 0x05BB) && ((c) <= 0x05BD)) ||                \
  287.       ((c) == 0x05BF) ||                        \
  288.       (((c) >= 0x05C1) && ((c) <= 0x05C2)) ||                \
  289.       ((c) == 0x05C4) ||                        \
  290.       (((c) >= 0x064B) && ((c) <= 0x0652)) ||                \
  291.       ((c) == 0x0670) ||                        \
  292.       (((c) >= 0x06D6) && ((c) <= 0x06DC)) ||                \
  293.       (((c) >= 0x06DD) && ((c) <= 0x06DF)) ||                \
  294.       (((c) >= 0x06E0) && ((c) <= 0x06E4)) ||                \
  295.       (((c) >= 0x06E7) && ((c) <= 0x06E8)) ||                \
  296.       (((c) >= 0x06EA) && ((c) <= 0x06ED)) ||                \
  297.       (((c) >= 0x0901) && ((c) <= 0x0903)) ||                \
  298.       ((c) == 0x093C) ||                        \
  299.       (((c) >= 0x093E) && ((c) <= 0x094C)) ||                \
  300.       ((c) == 0x094D) ||                        \
  301.       (((c) >= 0x0951) && ((c) <= 0x0954)) ||                \
  302.       (((c) >= 0x0962) && ((c) <= 0x0963)) ||                \
  303.       (((c) >= 0x0981) && ((c) <= 0x0983)) ||                \
  304.       ((c) == 0x09BC) ||                        \
  305.       ((c) == 0x09BE) ||                        \
  306.       ((c) == 0x09BF) ||                        \
  307.       (((c) >= 0x09C0) && ((c) <= 0x09C4)) ||                \
  308.       (((c) >= 0x09C7) && ((c) <= 0x09C8)) ||                \
  309.       (((c) >= 0x09CB) && ((c) <= 0x09CD)) ||                \
  310.       ((c) == 0x09D7) ||                        \
  311.       (((c) >= 0x09E2) && ((c) <= 0x09E3)) ||                \
  312.       ((c) == 0x0A02) ||                        \
  313.       ((c) == 0x0A3C) ||                        \
  314.       ((c) == 0x0A3E) ||                        \
  315.       ((c) == 0x0A3F) ||                        \
  316.       (((c) >= 0x0A40) && ((c) <= 0x0A42)) ||                \
  317.       (((c) >= 0x0A47) && ((c) <= 0x0A48)) ||                \
  318.       (((c) >= 0x0A4B) && ((c) <= 0x0A4D)) ||                \
  319.       (((c) >= 0x0A70) && ((c) <= 0x0A71)) ||                \
  320.       (((c) >= 0x0A81) && ((c) <= 0x0A83)) ||                \
  321.       ((c) == 0x0ABC) ||                        \
  322.       (((c) >= 0x0ABE) && ((c) <= 0x0AC5)) ||                \
  323.       (((c) >= 0x0AC7) && ((c) <= 0x0AC9)) ||                \
  324.       (((c) >= 0x0ACB) && ((c) <= 0x0ACD)) ||                \
  325.       (((c) >= 0x0B01) && ((c) <= 0x0B03)) ||                \
  326.       ((c) == 0x0B3C) ||                        \
  327.       (((c) >= 0x0B3E) && ((c) <= 0x0B43)) ||                \
  328.       (((c) >= 0x0B47) && ((c) <= 0x0B48)) ||                \
  329.       (((c) >= 0x0B4B) && ((c) <= 0x0B4D)) ||                \
  330.       (((c) >= 0x0B56) && ((c) <= 0x0B57)) ||                \
  331.       (((c) >= 0x0B82) && ((c) <= 0x0B83)) ||                \
  332.       (((c) >= 0x0BBE) && ((c) <= 0x0BC2)) ||                \
  333.       (((c) >= 0x0BC6) && ((c) <= 0x0BC8)) ||                \
  334.       (((c) >= 0x0BCA) && ((c) <= 0x0BCD)) ||                \
  335.       ((c) == 0x0BD7) ||                        \
  336.       (((c) >= 0x0C01) && ((c) <= 0x0C03)) ||                \
  337.       (((c) >= 0x0C3E) && ((c) <= 0x0C44)) ||                \
  338.       (((c) >= 0x0C46) && ((c) <= 0x0C48)) ||                \
  339.       (((c) >= 0x0C4A) && ((c) <= 0x0C4D)) ||                \
  340.       (((c) >= 0x0C55) && ((c) <= 0x0C56)) ||                \
  341.       (((c) >= 0x0C82) && ((c) <= 0x0C83)) ||                \
  342.       (((c) >= 0x0CBE) && ((c) <= 0x0CC4)) ||                \
  343.       (((c) >= 0x0CC6) && ((c) <= 0x0CC8)) ||                \
  344.       (((c) >= 0x0CCA) && ((c) <= 0x0CCD)) ||                \
  345.       (((c) >= 0x0CD5) && ((c) <= 0x0CD6)) ||                \
  346.       (((c) >= 0x0D02) && ((c) <= 0x0D03)) ||                \
  347.       (((c) >= 0x0D3E) && ((c) <= 0x0D43)) ||                \
  348.       (((c) >= 0x0D46) && ((c) <= 0x0D48)) ||                \
  349.       (((c) >= 0x0D4A) && ((c) <= 0x0D4D)) ||                \
  350.       ((c) == 0x0D57) ||                        \
  351.       ((c) == 0x0E31) ||                        \
  352.       (((c) >= 0x0E34) && ((c) <= 0x0E3A)) ||                \
  353.       (((c) >= 0x0E47) && ((c) <= 0x0E4E)) ||                \
  354.       ((c) == 0x0EB1) ||                        \
  355.       (((c) >= 0x0EB4) && ((c) <= 0x0EB9)) ||                \
  356.       (((c) >= 0x0EBB) && ((c) <= 0x0EBC)) ||                \
  357.       (((c) >= 0x0EC8) && ((c) <= 0x0ECD)) ||                \
  358.       (((c) >= 0x0F18) && ((c) <= 0x0F19)) ||                \
  359.       ((c) == 0x0F35) ||                        \
  360.       ((c) == 0x0F37) ||                        \
  361.       ((c) == 0x0F39) ||                        \
  362.       ((c) == 0x0F3E) ||                        \
  363.       ((c) == 0x0F3F) ||                        \
  364.       (((c) >= 0x0F71) && ((c) <= 0x0F84)) ||                \
  365.       (((c) >= 0x0F86) && ((c) <= 0x0F8B)) ||                \
  366.       (((c) >= 0x0F90) && ((c) <= 0x0F95)) ||                \
  367.       ((c) == 0x0F97) ||                        \
  368.       (((c) >= 0x0F99) && ((c) <= 0x0FAD)) ||                \
  369.       (((c) >= 0x0FB1) && ((c) <= 0x0FB7)) ||                \
  370.       ((c) == 0x0FB9) ||                        \
  371.       (((c) >= 0x20D0) && ((c) <= 0x20DC)) ||                \
  372.       ((c) == 0x20E1) ||                        \
  373.       (((c) >= 0x302A) && ((c) <= 0x302F)) ||                \
  374.       ((c) == 0x3099) ||                        \
  375.       ((c) == 0x309A))
  376.  
  377. /*
  378.  * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
  379.  *                   #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
  380.  *                   [#x309D-#x309E] | [#x30FC-#x30FE]
  381.  */
  382. #define IS_EXTENDER(c)                            \
  383.     (((c) == 0xb7) || ((c) == 0x2d0) || ((c) == 0x2d1) ||        \
  384.      ((c) == 0x387) || ((c) == 0x640) || ((c) == 0xe46) ||        \
  385.      ((c) == 0xec6) || ((c) == 0x3005)                    \
  386.      (((c) >= 0x3031) && ((c) <= 0x3035)) ||                \
  387.      (((c) >= 0x309b) && ((c) <= 0x309e)) ||                \
  388.      (((c) >= 0x30fc) && ((c) <= 0x30fe)))
  389.  
  390. /*
  391.  * [86] Ideographic ::= [#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]
  392.  */
  393. #define IS_IDEOGRAPHIC(c)                        \
  394.     ((((c) >= 0x4e00) && ((c) <= 0x9fa5)) ||                \
  395.      (((c) >= 0xf900) && ((c) <= 0xfa2d)) ||                \
  396.      (((c) >= 0x3021) && ((c) <= 0x3029)) ||                \
  397.       ((c) == 0x3007))
  398.  
  399. /*
  400.  * [84] Letter ::= BaseChar | Ideographic 
  401.  */
  402. #define IS_LETTER(c) (IS_BASECHAR(c) || IS_IDEOGRAPHIC(c))
  403.  
  404. #else
  405. #ifndef USE_UTF_8
  406. /************************************************************************
  407.  *                                    *
  408.  * 8bits / ISO-Latin version of the macros.                *
  409.  *                                    *
  410.  ************************************************************************/
  411. /*
  412.  * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
  413.  *                  | [#x10000-#x10FFFF]
  414.  * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
  415.  */
  416. #define IS_CHAR(c)                            \
  417.     ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) ||        \
  418.       (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) &&        \
  419.       (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) <= 0x10FFFF))
  420.  
  421. /*
  422.  * [85] BaseChar ::= ... long list see REC ...
  423.  */
  424. #define IS_BASECHAR(c)                            \
  425.     ((((c) >= 0x41) && ((c) <= 0x5a)) ||                \
  426.      (((c) >= 0x61) && ((c) <= 0x7a)) ||                \
  427.      (((c) >= 0xaa) && ((c) <= 0x5b)) ||                \
  428.      (((c) >= 0xc0) && ((c) <= 0xd6)) ||                \
  429.      (((c) >= 0xd8) && ((c) <= 0xf6)) ||                \
  430.      (((c) >= 0xf8) && ((c) <= 0xff)) ||                \
  431.       ((c) == 0xba))
  432.  
  433. /*
  434.  * [88] Digit ::= ... long list see REC ...
  435.  */
  436. #define IS_DIGIT(c) (((c) >= 0x30) && ((c) <= 0x39))
  437.  
  438. /*
  439.  * [84] Letter ::= BaseChar | Ideographic 
  440.  */
  441. #define IS_LETTER(c) IS_BASECHAR(c)
  442.  
  443.  
  444. /*
  445.  * [87] CombiningChar ::= ... long list see REC ...
  446.  */
  447. #define IS_COMBINING(c) 0
  448.  
  449. /*
  450.  * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
  451.  *                   #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
  452.  *                   [#x309D-#x309E] | [#x30FC-#x30FE]
  453.  */
  454. #define IS_EXTENDER(c) ((c) == 0xb7)
  455.  
  456. #else /* USE_UTF_8 */
  457. /************************************************************************
  458.  *                                    *
  459.  * 8bits / UTF-8 version of the macros.                    *
  460.  *                                    *
  461.  ************************************************************************/
  462.  
  463. TODO !!!
  464. #endif /* USE_UTF_8 */
  465. #endif /* !UNICODE */
  466.  
  467. /*
  468.  * Blank chars.
  469.  *
  470.  * [3] S ::= (#x20 | #x9 | #xD | #xA)+
  471.  */
  472. #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) ||    \
  473.                      ((c) == 0x0D))
  474.  
  475. /*
  476.  * [13] PubidChar ::= #x20 | #xD | #xA | [a-zA-Z0-9] | [-'()+,./:=?;!*#@$_%]
  477.  */
  478. #define IS_PUBIDCHAR(c)                            \
  479.     (((c) == 0x20) || ((c) == 0x0D) || ((c) == 0x0A) ||            \
  480.      (((c) >= 'a') && ((c) <= 'z')) ||                    \
  481.      (((c) >= 'A') && ((c) <= 'Z')) ||                    \
  482.      (((c) >= '0') && ((c) <= '9')) ||                    \
  483.      ((c) == '-') || ((c) == '\'') || ((c) == '(') || ((c) == ')') ||    \
  484.      ((c) == '+') || ((c) == ',') || ((c) == '.') || ((c) == '/') ||    \
  485.      ((c) == ':') || ((c) == '=') || ((c) == '?') || ((c) == ';') ||    \
  486.      ((c) == '!') || ((c) == '*') || ((c) == '#') || ((c) == '@') ||    \
  487.      ((c) == '$') || ((c) == '_') || ((c) == '%'))
  488.  
  489. #define SKIP_EOL(p)                             \
  490.     if (*(p) == 0x13) { p++ ; if (*(p) == 0x10) p++; }            \
  491.     if (*(p) == 0x10) { p++ ; if (*(p) == 0x13) p++; }
  492.  
  493. #define MOVETO_ENDTAG(p)                        \
  494.     while (IS_CHAR(*p) && (*(p) != '>')) (p)++
  495.  
  496. #define MOVETO_STARTTAG(p)                        \
  497.     while (IS_CHAR(*p) && (*(p) != '<')) (p)++
  498.  
  499. /**
  500.  * entity substitution default behaviour.
  501.  */
  502.  
  503. int xmlSubstituteEntitiesDefaultValue;
  504.  
  505. /**
  506.  * Parser context
  507.  */
  508. xmlParserCtxtPtr
  509. xmlCreateDocParserCtxt(CHAR *cur);
  510. xmlParserCtxtPtr
  511. xmlCreateFileParserCtxt(const char *filename);
  512. xmlParserCtxtPtr
  513. xmlCreateMemoryParserCtxt(char *buffer, int size);
  514. void
  515. xmlFreeParserCtxt(xmlParserCtxtPtr ctxt);
  516.  
  517. /**
  518.  * Entities
  519.  */
  520. void
  521. xmlHandleEntity(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
  522.  
  523. /**
  524.  * Input Streams
  525.  */
  526. xmlParserInputPtr
  527. xmlNewEntityInputStream(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
  528. void
  529. xmlPushInput(xmlParserCtxtPtr ctxt, xmlParserInputPtr input);
  530. CHAR
  531. xmlPopInput(xmlParserCtxtPtr ctxt);
  532. void
  533. xmlFreeInputStream(xmlParserInputPtr input);
  534. xmlParserInputPtr
  535. xmlNewInputFromFile(xmlParserCtxtPtr ctxt, const char *filename);
  536.  
  537. /**
  538.  * Namespaces.
  539.  */
  540. CHAR *
  541. xmlSplitQName(const CHAR *name, CHAR **prefix);
  542. CHAR *
  543. xmlNamespaceParseNCName(xmlParserCtxtPtr ctxt);
  544. CHAR *
  545. xmlNamespaceParseQName(xmlParserCtxtPtr ctxt, CHAR **prefix);
  546. CHAR *
  547. xmlNamespaceParseNSDef(xmlParserCtxtPtr ctxt);
  548. CHAR *
  549. xmlParseQuotedString(xmlParserCtxtPtr ctxt);
  550. void
  551. xmlParseNamespace(xmlParserCtxtPtr ctxt);
  552.  
  553. /**
  554.  * Generic production rules
  555.  */
  556. CHAR *
  557. xmlParseName(xmlParserCtxtPtr ctxt);
  558. CHAR *
  559. xmlParseNmtoken(xmlParserCtxtPtr ctxt);
  560. CHAR *
  561. xmlParseEntityValue(xmlParserCtxtPtr ctxt, CHAR **orig);
  562. CHAR *
  563. xmlParseAttValue(xmlParserCtxtPtr ctxt);
  564. CHAR *
  565. xmlParseSystemLiteral(xmlParserCtxtPtr ctxt);
  566. CHAR *
  567. xmlParsePubidLiteral(xmlParserCtxtPtr ctxt);
  568. void
  569. xmlParseCharData(xmlParserCtxtPtr ctxt, int cdata);
  570. CHAR *
  571. xmlParseExternalID(xmlParserCtxtPtr ctxt, CHAR **publicID, int strict);
  572. void 
  573. xmlParseComment(xmlParserCtxtPtr ctxt, int create);
  574. CHAR *
  575. xmlParsePITarget(xmlParserCtxtPtr ctxt);
  576. void
  577. xmlParsePI(xmlParserCtxtPtr ctxt);
  578. void
  579. xmlParseNotationDecl(xmlParserCtxtPtr ctxt);
  580. void
  581. xmlParseEntityDecl(xmlParserCtxtPtr ctxt);
  582. int
  583. xmlParseDefaultDecl(xmlParserCtxtPtr ctxt, CHAR **value);
  584. xmlEnumerationPtr
  585. xmlParseNotationType(xmlParserCtxtPtr ctxt);
  586. xmlEnumerationPtr
  587. xmlParseEnumerationType(xmlParserCtxtPtr ctxt);
  588. int
  589. xmlParseEnumeratedType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
  590. int
  591. xmlParseAttributeType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
  592. void
  593. xmlParseAttributeListDecl(xmlParserCtxtPtr ctxt);
  594. xmlElementContentPtr
  595. xmlParseElementMixedContentDecl(xmlParserCtxtPtr ctxt);
  596. xmlElementContentPtr
  597. xmlParseElementChildrenContentDecl(xmlParserCtxtPtr ctxt);
  598. int
  599. xmlParseElementContentDecl(xmlParserCtxtPtr ctxt, CHAR *name,
  600.                            xmlElementContentPtr *result);
  601. int
  602. xmlParseElementDecl(xmlParserCtxtPtr ctxt);
  603. void
  604. xmlParseMarkupDecl(xmlParserCtxtPtr ctxt);
  605. int
  606. xmlParseCharRef(xmlParserCtxtPtr ctxt);
  607. xmlEntityPtr
  608. xmlParseEntityRef(xmlParserCtxtPtr ctxt);
  609. void
  610. xmlParseReference(xmlParserCtxtPtr ctxt);
  611. void
  612. xmlParsePEReference(xmlParserCtxtPtr ctxt);
  613. void
  614. xmlParseDocTypeDecl(xmlParserCtxtPtr ctxt);
  615. CHAR *
  616. xmlParseAttribute(xmlParserCtxtPtr ctxt, CHAR **value);
  617. CHAR *
  618. xmlParseStartTag(xmlParserCtxtPtr ctxt);
  619. void
  620. xmlParseEndTag(xmlParserCtxtPtr ctxt, CHAR *tagname);
  621. void
  622. xmlParseCDSect(xmlParserCtxtPtr ctxt);
  623. void
  624. xmlParseContent(xmlParserCtxtPtr ctxt);
  625. void
  626. xmlParseElement(xmlParserCtxtPtr ctxt);
  627. CHAR *
  628. xmlParseVersionNum(xmlParserCtxtPtr ctxt);
  629. CHAR *
  630. xmlParseVersionInfo(xmlParserCtxtPtr ctxt);
  631. CHAR *
  632. xmlParseEncName(xmlParserCtxtPtr ctxt);
  633. CHAR *
  634. xmlParseEncodingDecl(xmlParserCtxtPtr ctxt);
  635. int
  636. xmlParseSDDecl(xmlParserCtxtPtr ctxt);
  637. void
  638. xmlParseXMLDecl(xmlParserCtxtPtr ctxt);
  639. void
  640. xmlParseMisc(xmlParserCtxtPtr ctxt);
  641.  
  642. /*
  643.  * Entities substitution
  644.  */
  645. #define XML_SUBSTITUTE_NONE    0
  646. #define XML_SUBSTITUTE_REF    1
  647. #define XML_SUBSTITUTE_PEREF    2
  648. #define XML_SUBSTITUTE_BOTH     3
  649.  
  650. CHAR *
  651. xmlDecodeEntities(xmlParserCtxtPtr ctxt, int len, int what,
  652.                   CHAR end, CHAR  end2, CHAR end3);
  653.  
  654. /*
  655.  * Generated by MACROS on top of parser.c c.f. PUSH_AND_POP
  656.  */
  657. extern int nodePush(xmlParserCtxtPtr ctxt, xmlNodePtr value);
  658. extern xmlNodePtr nodePop(xmlParserCtxtPtr ctxt);
  659. extern int inputPush(xmlParserCtxtPtr ctxt, xmlParserInputPtr value);
  660. extern xmlParserInputPtr inputPop(xmlParserCtxtPtr ctxt);
  661.  
  662. #endif /* __XML_PARSER_INTERNALS_H__ */
  663.