home *** CD-ROM | disk | FTP | other *** search
/ Amiga ISO Collection / AmigaUtilCD2.iso / Misc / PFONTM-A.DMS / in.adf / AppendixO < prev    next >
Encoding:
Text File  |  1995-11-12  |  21.4 KB  |  466 lines

  1. "Personal Fonts Maker -  O. PFM IFF Data Format"
  2.  
  3.  
  4. O.         PFM IFF Data Format
  5.  
  6.    As explained in sections 4.3 ("Load PFM Font"), 4.4 ("Save PFM Font"),
  7. 4.8 ("Load Character Set") and 4.9 ("Save Character Set"), the Personal
  8. Fonts Maker uses different IFF conforming formats to load and save its
  9. font and character set files. This appendix contains the necessary
  10. technical documentation to create external programs that can access and
  11. create files which are compatible with the Personal Fonts Maker formats.
  12. Programmers are encouraged to use this information to write their own
  13. routines to handle fonts and character sets.
  14.  
  15.    This appendix assumes that the Commodore "'EA IFF 85' Standard for
  16. Interchange Format Files" documentation has been understood. A disk for
  17. software developers, which includes the "ParseCPFM" tool to analyze font
  18. files and character set files, is available from Cloanto.
  19.  
  20.  
  21. O.1        The IFF FORM: CPFM
  22.  
  23.    A CPFM (Cloanto Personal Fonts Maker) IFF FORM contains one or more
  24. IFHD (InFormation HeaDer) chunks, each (not necessarily immediately)
  25. followed by a CHDT (CHaracter DaTa) chunk. Each IFHD describes the
  26. contents of the CHDT chunk which follows. The optional CSNM (Character Set
  27. NaMe) chunk contains the name of the character set used to create the data
  28. described by the preceding chunks. Reference point positions are stored in
  29. the optional REFP (REFerence Points) chunk. Additional chunks may be added
  30. in future versions of the program to support new functions.
  31.  
  32.    An IFHD chunk gives some general information on the following CHDT
  33. chunk. The data contained in the IFHD chunk tells the program whether the
  34. CHDT which follows contains data relative to a font or to a character set.
  35. Information like the maximum size of the character images, the aspect
  36. ratio (horizontal and vertical densities) and other data is also stored in
  37. the IFHD chunk. The CHDT chunk contains the data relative to each
  38. character, like the graphical image and the position in the encoding
  39. vector (if the chunk contains character set data) of each character. The
  40. IFHD chunk is called a property chunk, and must appear before any CHDT
  41. chunk. The CSNM chunk must come after (not necessarily immediately after)
  42. the IFHD chunk it refers to.
  43.  
  44.    A character set needs to store information which is very similar to
  45. that of a font. The default images of the characters are treated similarly
  46. to the images of the characters in a font. Additional data regarding the
  47. character encoding vector is also contained in the character set data. A
  48. couple of IFHD+CHDT chunks either contain font data or character set data.
  49. It is possible, even if not yet supported by the program, that the same
  50. file may contain information regarding a character set (a couple of
  51. chunks), and a font designed having that character set in mind (other two
  52. chunks).
  53.  
  54.  
  55. O.2        IFF Chunks: IFHD
  56.  
  57.    An IFHD (InFormation HeaDer) chunk contains an instance of an
  58. InformationHeader structure:
  59.  
  60. struct InformationHeader
  61. {
  62.  UWORD MaxWidth, MaxHeight;    /* maximum character size */
  63.  UWORD HorizDPI, VertDPI;      /* print/display density */
  64.  UWORD MaxBytesPerLine;        /* bytes sufficient to store an image row
  65. */
  66.  UBYTE  BitPlanes;             /* number of bitplanes */
  67.  UBYTE  System;                /* file creator's operating system */
  68.  ULONG  Flags;                 /* font or character set flags */
  69. };
  70.  
  71. /* System */
  72. #define IHS_AMIGA_SYSTEM       0
  73. #define IHS_MSDOS_SYSTEM       1
  74.  
  75. /* Flags */
  76. #define IHF_ATTRIBUTES          0x0000FFFF    /* mask for font/cset attr.
  77. */
  78. #define IHF_ITALIC              0x00000001
  79. #define IHF_BOLD                0x00000002    /* excludes IHF_LIGHT */
  80. #define IHF_LIGHT               0x00000004    /* excludes IHF_BOLD */
  81. #define IHF_UNDERLINE           0x00000008
  82. #define IHF_OUTLINE             0x00000010
  83. #define IHF_SHADOW              0x00000020
  84. #define IHF_SUPERSCRIPT         0x00000040    /* excludes IHF_SUBSCRIPT
  85. */
  86. #define IHF_SUBSCRIPT           0x00000080    /* excludes IHF_SUPERSCRIPT
  87. */
  88. #define IHF_ENLARGED            0x00000100    /* excludes IHF_CONDENSED
  89. */
  90. #define IHF_CONDENSED           0x00000200    /* excludes IHF_ENLARGED */
  91. #define IHF_REVERSE             0x00000400
  92. #define IHF_SERIF               0x00000800
  93. #define IHF_DRAFT               0x00001000
  94. #define IHF_FIXED_PITCH         0x00002000
  95. #define IHF_RIGHT_TO_LEFT       0x00004000
  96. #define IHF_LANDSCAPE           0x00008000
  97.  
  98. #define IHF_FONT_HEADER         0x80000000    /* font IFHD+CHDT (no cset)
  99. */
  100.  
  101.    Fields are filed in the order shown. The compiler must not add pad
  102. bytes to the structure. UWORD and ULONG are high bytes first.
  103.  
  104.    Values in MaxWidth and MaxHeight must be in the range 1-65535. The two
  105. values must be 16 and 18 (decimal), respectively, if the IFHD refers to a
  106. character set (rather than a font).
  107.  
  108.    Valid values for HorizDPI and VertDPI range from 0 to 65535. If one of
  109. the two is 0, the program uses its own current aspect ratio. The two
  110. fields are ignored (the screen display ratio is used) if the data is read
  111. as a character set, but should always be filled in correctly when writing
  112. the character set data. The ratio of (a) equals the ratio of (b) when
  113. XDPI(a) / YDPI(a) == XDPI(b) / YDPI(b). This is important to understand
  114. when and how images are stretched.
  115.  
  116.    MaxBytesPerLine is MaxWidth divided by 8. The value must be 2 if it
  117. refers to character set data (rather than font data).
  118.  
  119.    The Personal Fonts Maker does not read the encoding vector of character
  120. set data if the System field is not set to the same operating system under
  121. which the program is running. For example, the Amiga version of the
  122. Personal Fonts Maker reads only the image data in a character set's CHDT
  123. chunk if the operating system field is not set to IHS_AMIGA_SYSTEM.
  124.  
  125.    The Flags field should have the IHF_FONT_HEADER flag set if the chunk
  126. refers to font data, and cleared (not set) if a character set is being
  127. described instead. In both cases (description of a font or character set),
  128. different font attribute flags can be used, keeping in mind that some
  129. attributes mutually exclude each other (e.g. IHF_SUPERSCRIPT and
  130. IHF_SUBSCRIPT cannot be set at the same time).
  131.  
  132.    The ATRB Font Format Description Language variable (section 2.7.2.1)
  133. can be extracted from the Flags field using the following formula:
  134.  
  135.      ATRB = InformationHeader.Flags & IHF_ATTRIBUTES
  136.  
  137.    BitPlanes must contain a value in the range 0 to 255. A value of 0
  138. means that all characters are empty.
  139.  
  140.    Programs reading the IFHD chunk must be able to support future
  141. extensions of the data format. The size of the InformationHeader structure
  142. can increase. Programs reading this data should seek from the end of the
  143. structure which was read, to the end of the chunk. The number of bytes to
  144. skip can be calculated with a similar formula:
  145.  
  146.      SkipBytes = IFHDChunkLength - sizeof(struct InformationHeader)
  147.  
  148.  
  149. O.3        IFF Chunks: CHDT
  150.  
  151.    The CHDT (CHaracter DaTa) chunk contains an ordered sequence of
  152. character units, each referring to a character in the font or character
  153. set being described. The units are divided into three parts: the units's
  154. format descriptor, a character header, containing non-graphical data, and
  155. a variable-length part containing the data associated with the character
  156. image of the character referenced to.
  157.  
  158.    The format descriptor byte specifies the format of the character header
  159. and the Cloanto Character Image Format (CCIF) used to achieve the required
  160. level of data compression and access speed. Using the CCIF compression
  161. algorithms described here, the font files on the Personal Fonts Maker
  162. disks have been reduced by an average of 47% of their uncompressed size,
  163. and the character sets by more than 55%.
  164.  
  165.    The image data is divided into bitplanes, which in turn are divided
  166. into horizontal rows, each described by a maximum of MaxBytesPerLine
  167. bytes. Compressed graphical data is stored bytewise (8-bit bytes) or in
  168. nibbles (4-bits), depending on the compression technique. If groups of
  169. identical bits are not compressed, the data is stored bitwise.
  170.  
  171.    Programs handling CCIF data must always read and write across rows and
  172. bitplanes. All rows within the specified frame, of all bitplanes, are
  173. merged into one ideal row of bits, left to right, top to bottom, from one
  174. bitplane to the next.
  175.  
  176.    No pad bytes are used between the character units. Adjacent character
  177. units must not necessarily refer to contiguous characters, but they must
  178. be ordered by the position of the character in the font, from the
  179. beginning to the end (i.e. lower character codes first), though the
  180. Personal Fonts Maker can load character units even if they are in "sparse"
  181. order. A program loading character units from a CHDT chunk can determine
  182. when the last unit was read by verifying when the end of the chunk is
  183. reached. As specified in the IFF documentation, odd-length chunks must be
  184. followed by a pad byte.
  185.  
  186.    The following data structures are used:
  187.  
  188. UBYTE FormatDescriptor;
  189.  
  190. struct FontCImageHead8
  191. {
  192.  UBYTE CharNum;        /* position of the character in the font */
  193.  UBYTE XSize;          /* horizontal image size in dot-columns (XSIZ) */
  194.  BYTE  Space;          /* total space before next character (SPCE) */
  195.  BYTE  Offset;         /* offset of this character's beginning (KERN) */
  196. };
  197.  
  198. struct FontCImageHead16
  199. {
  200.  UWORD CharNum;        /* position of the character in the font */
  201.  UWORD XSize;          /* horizontal image size in dot-columns (XSIZ) */
  202.  WORD  Space;          /* total space before next character (SPCE) */
  203.  WORD  Offset;         /* offset of this character's beginning (KERN) */
  204. };
  205.  
  206. struct CSetCImageHead8
  207. {
  208.  BYTE CharNum;                 /* position in the character set */
  209.  BYTE EqualToSystemChar;       /* code in the host system's character set
  210. */
  211. };
  212.  
  213. struct CSetCImageHead16
  214. {
  215.  WORD CharNum;                 /* position in the character set */
  216.  WORD EqualToSystemChar;       /* code in the host system's character set
  217. */
  218. };
  219.  
  220. /* EqualToSystemChar */
  221. #define NOT_IN_SYSTEM_SET      -1     /* no equivalent in system cset */
  222.  
  223. struct CCIFPlaneInfo
  224. {
  225.  UBYTE PlanePick;              /* planes described by graphical data */
  226.  UBYTE PlaneOnOff;             /* status of other planes */
  227. };
  228.  
  229. struct CCIFFrame8
  230. {
  231.  UBYTE BlankColumns;
  232.  UBYTE BlankRows;
  233.  UBYTE DataColumns;
  234.  UBYTE DataRows;
  235. };
  236.  
  237. struct CCIFFrame16
  238. {
  239.  UWORD BlankColumns;
  240.  UWORD BlankRows;
  241.  UWORD DataColumns;
  242.  UWORD DataRows;
  243. };
  244.  
  245. /* FormatDescriptor */
  246.  
  247. #define FD_CIHEAD8      0x01
  248. #define FD_PLANEINFO    0x02
  249. #define FD_FRAME8       0x04
  250. #define FD_FRAME16      0x08
  251. #define FD_PACKET4      0x10
  252. #define FD_PACKET8      0x20
  253. #define FD_RESERVED     (0x40 | 0x80)
  254.  
  255.    The FormatDescriptor byte describes exactly which structures follow in
  256. the data unit, and how the graphical data is stored. The eight bits in
  257. this byte store the following information:
  258.  
  259.      FD_CIHEAD8  : compact (8-bit) CSet/Font-CImageHead structure follows
  260. if
  261.                    the bit is set. Default is normal (full) structure.
  262.  
  263.      FD_PLANEINFO: specifies whether bitplane information data follows.
  264.  
  265.      FD_FRAME8   : CCIF 8-bit frame data structure follows.
  266.  
  267.      FD_FRAME16  : CCIF 16-bit frame data structure follows. Setting both
  268.                    FD_FRAME8 and FD_FRAME16 bits is a reserved condition,
  269.                    reserved for future implementations.
  270.  
  271.      FD_PACKET4  : CCIF "1+3"-bit packets are used.
  272.  
  273.      FD_PACKET8  : CCIF "1+7"-bit packets are used. Setting both
  274. FD_PACKET4
  275.                    and FD_PACKET8 bits is currently forbidden and remains
  276.                    reserved for future implementations. It does not make
  277.                    sense to set FD_FRAME8, FD_FRAME16, FD_PACKET4 or
  278.                    FD_PACKET8 if no image data follows (zero
  279.                    character-width).
  280.  
  281.      FD_RESERVED : reserved for future versions, must be set to 0.
  282.  
  283.    It is currently not permitted to set both FD_FRAME8 and FD_FRAME16
  284. bits, or both FD_PACKET4 and FD_PACKET8 bits, or any of the FD_UNUSED
  285. bits.
  286.  
  287.    Depending on whether a font or a character set is being described,
  288. either the FontCImageHead or the CSetCImageHead structure is used to
  289. introduce each character unit. An instance of the FontCImageHead or
  290. CSetCImageHead structure must exist in each character unit. If the
  291. FD_CIMHEAD8 bit of the format descriptor byte is set, the compact version
  292. of these structures is used. The compact structures occupy half the space
  293. of their full-length counterpart. As a trade-off, the compact structures
  294. can only be used if each of the values to be stored in the fields of the
  295. structure can be represented using 8 bits. This means that all unsigned
  296. values must be in the range 0-255 and signed values must be in the range
  297. from -128 to 127. It is important not to forget that even the CharNum
  298. field can exceed this limit, if it refers to the undefined characer
  299. (decimal code 256).
  300.  
  301.    The FD_PLANEINFO bit of the format description byte specifies whether
  302. an instance of a CCIFPlaneInfo structure follows. Such a structure is
  303. useful when coloured fonts are processed, or to compress those characters
  304. which are completely empty (all dots in the background colour) or consist
  305. of one filled rectangle. Multiple-colour images are stored in more than
  306. one bitplane. For a given character one or more bitplanes may contain
  307. either all '0' or all '1' bits. In this case, memory can be saved if a
  308. more compact description of these bitplanes is saved, rather than the
  309. bitplanes themselves. If no memory can be saved in this way, the second
  310. bit of the format description byte should be cleared. The bits in the
  311. PlanePick field of the CCIFPlaneInfo structure tell the program which
  312. planes follow in the character image data. The status of the PlaneOnOff
  313. bits determines how the remaining bitplanes are to be set (all '0's or all
  314. '1's). Only the dots included in the frame described by the CCIFFrame
  315. structure (if present) are affected. Even if the BitPlanes field in the
  316. InformationHeader structure contains a value higher than 8, only the first
  317. eight bitplanes can be picked, cleared or set with this method. Any
  318. bitplanes after the first 8 are considered to be "picked".
  319.  
  320.    One of the simplest measures that can be taken in order to store a
  321. character's image data in the least possible space is to "cut" away the
  322. outermost empty rows and columns of the image. The first two fields in the
  323. CCIFFrame respectively specify how many blank columns and rows precede the
  324. region of coloured dots, starting from the top-left corner. These blank
  325. dots do not need to be stored in the image data. The other two fields
  326. indicate the number of columns described by the following image data, and
  327. how many image rows are described. The image data therefore only describes
  328. the content of the smallest possible rectangle containing all coloured
  329. dots. If the dimensions of this rectangle do not exceed 256 dots, and the
  330. top and left offset of the rectangle do not exceed this value either, the
  331. more compact 8-bit fields can be used. The bits FD_FRAME8 and FD_FRAME16
  332. of the format descriptor byte specify which structure to use. If neither
  333. of the two bits is set, all dots which make up the character image must be
  334. stored.
  335.  
  336.    Certain limit-cases are acceptable, but should be avoided. For example,
  337. if there are no outer empty rows or columns, it is a waste to use the
  338. CCIFFrame structure. This is also true if there are no dots in the
  339. character (zero-width character, not stored by the Personal Fonts Maker).
  340.  
  341.    The bits FD_PACKET4 and FD_PACKET8 of the format descriptor byte
  342. specify whether the rows of dots which make up the character image are
  343. packed into nibbles or bytes. If neither of the two bits is set, the data
  344. is stored bitwise. Images are processed left to right, top to bottom,
  345. bitplane by bitplane. The leftmost dots are stored in the most significant
  346. bits in each byte. After all bits have been written, any remaining bits in
  347. the current byte are set to zero and used as pad bits.
  348.  
  349.    If the FD_PACKET4 bit is set, the content of each row of bits in a
  350. bitplane is compressed into a sequence of packets. The packets are 4-bits
  351. long. The most significant bit in a packet determines the status ('0' or
  352. '1') of the data bits which are described. The remaining three bits
  353. contain a number from 1 to 8 (normally this would be 0 to 7, but 1 is
  354. always added since it does not make sense to describe zero bits)
  355. indicating how many bits have the specified value (i.e. 0 or 1). If there
  356. are more than 8 bits with the same value, more packets with the same
  357. setting of the most significant bit can be generated. This technique is
  358. very efficient to compress the description of rows of dots in a font's
  359. character image, especially if it is combined with a CCIFFrame structure.
  360. If the last packet in the last row of the last bitplane terminates in the
  361. middle of a byte, the remaining four bits are set to zero and used as pad
  362. bits.
  363.  
  364.    If the FD_PACKET8 bit of the format descriptor byte is set, 8-bit
  365. packets are used. Up to 128 bits of data can be compressed into such a
  366. packet. This can be more space-efficient in extremely large or very high
  367. resolution fonts, and to describe long sequences of identical bits across
  368. rows of smaller characters.
  369.  
  370.    Once again, it should be noted that if a CCIFFrame structure is used,
  371. only the rows which are contained in the specified frame are affected by
  372. the CCIFPlaneInfo structure and are described by the 4 or 8 bit packets,
  373. or by the bitmap data.
  374.  
  375.    The order in which the different data structures are to be written in
  376. the CHDT chunk is the following (optional structures are enclosed by
  377. parentheses):
  378.  
  379.      FormatDescriptor
  380.      FontCImageHead8 | FontCImageHead16 | CSetCImageHead8 |
  381. CSetCImageHead16
  382.      (CCIFPlaneInfo)
  383.      (CCIFFrame8 | CCIFFrame16)
  384.      (graphical data)
  385.  
  386.    It is reasonable not to write any graphical data if a character
  387. consists of zero rows and/or columns (it is however preferable not to save
  388. such characters at all), or if the CCIFPlaneInfo structure (perhaps
  389. combined with CCIFFrame) has already given a complete description of the
  390. character.
  391.  
  392.    The data compression techniques supported by the Cloanto Character
  393. Image Format are extremely easy to handle. Fonts compressed in this way
  394. can fit into as little as 40 percent of the space occupied by the same
  395. non-compressed font. It is up to the programs writing the character units
  396. to choose the most appropriate format to store each character's data.
  397. Different techniques can be combined. A compression method should never be
  398. applied to a character if the resulting data would be longer than the
  399. non-compressed data. This is possible, especially using very small font
  400. formats (e.g. 6 x 5 characters).
  401.  
  402.  
  403. O.4        IFF Chunks: CSNM
  404.  
  405.    The CSNM chunk contains the name of a character set. This is the name
  406. of the character set which was used when the font was designed, if the
  407. chunk's data regards a font (rather than a character set). The CSNM chunk
  408. may be omitted if the character set is unknown (e.g. if no character set
  409. was selected). If the CSNM chunk follows an IFHD chunk describing
  410. character set data, the string contains the name which was originally
  411. assigned to the character set by the user (in the save command), i.e. the
  412. original file name (without path). This enables the program to detect
  413. whether the file has been renamed, and to display a warning message. It is
  414. better not to rename character set files, as they may be referenced by
  415. fonts created using these sets. Sections 4.3 ("Load PFM Font") and 4.9
  416. ("Save Character Set") explain in more detail what the Personal Fonts
  417. Maker uses this name for.
  418.  
  419.    The CSNM chunk may appear only after the IFHD chunk describing the data
  420. to which CSNM refers. The CSNM chunk may appear either before or after the
  421. CHDT chunk. A CSNM chunk does not refer to the whole CPFM FORM, but is
  422. always relative to the current couple of IFHD and CHDT chunks. The use of
  423. the CSNM chunk is optional.
  424.  
  425.    The string contained in CSNM is an exact copy of the character set file
  426. name. The same character set and letter-case (capitals vs. lower case)
  427. used for the file name are used. Characters whose code is out of the range
  428. 33-126 should be avoided, as these may have different meanings on
  429. operating systems other than the one where the file was originally
  430. written. The maximum length for the file name is 63 characters (without
  431. zero terminator). At read time, the length of the string is determined by
  432. the chunk length. The string is not zero-terminated.
  433.  
  434.  
  435. O.5        IFF Chunks: REFP
  436.  
  437.    This (optional) chunk contains the vertical positions of one or more
  438. reference points. The REFP chunk must always contain data for at least
  439. four reference points, describing the following lines (from the top): cap
  440. line, mean line, baseline and underline position. These values must always
  441. be the first four in the REFP chunk. Section 3.21 ("Reference Points") has
  442. more on this subject.
  443.  
  444.    The Personal Fonts Maker supports a minimum of four reference points.
  445. Other programs may support a minimum of more than four reference points.
  446. If the REFP chunk being read contains fewer values than the minimum number
  447. of reference points used by the program which is reading the data, the
  448. reference points to which no value could be assigned should be reset to a
  449. default value.
  450.  
  451.    If the REFP chunk contains more values than the maximum number of
  452. reference points supported by the reader program, only the first values
  453. should be read. The values are always ordered, from the first reference
  454. point to the last. The first reference point is always reference point
  455. number one. Each value, ranging from 0 to YMAX, is stored as an unsigned
  456. word (high byte first). Thus:
  457.  
  458.      NumRefP = REFPChunkLength / 2
  459.      ReadBytes = (NumRefP > MaxRefP ? MaxRefP : NumRefP) * 2
  460.      SkipBytes = REFPChunkLength - ReadBytes
  461.  
  462.    The values can range from 0 to MaxHeight (IFHD chunk), or from 0 to 18
  463. if IFHD and REFP refer to a character set.
  464.  
  465.  
  466.