home *** CD-ROM | disk | FTP | other *** search
/ PC World 2003 January / PCWorld_2003-01_cd.bin / Akce / Program / ActiveX / tts621gr.exe / readme.txt < prev    next >
Encoding:
Text File  |  2001-08-31  |  15.2 KB  |  408 lines

  1. ***********************************************************************
  2.     IBM VIAVOICE TTS RUN TIME KIT 
  3.     Version 6.2.1 
  4.     Readme (win32.readme.6.2.1.txt)
  5.     Copyright IBM Corporation, 2001.  All Rights Reserved 
  6. ***********************************************************************
  7.  
  8.  
  9. CONTENTS
  10. --------
  11.  1.  Company
  12.  2.  Product
  13.  3.  Version 
  14.  4.  Description
  15.  5.  Contact Information
  16.  6.  Upgrade Information
  17.  7.  Installation Requirements
  18.  8.  End-User Installation Instructions
  19.  9.  ISV Installation Instructions
  20. 10.  Working with Concatenative Voices
  21. 11.  Uninstall Instructions
  22. 12.  General Limitations and Comments 
  23. 13.  Known Problems & F.A.Q.
  24. 14.  Developer Notes
  25. 15.  Trademark Information
  26.  
  27.  
  28. 1.  COMPANY
  29. -----------
  30.     International Business Machines Corporation (IBM)
  31.  
  32.  
  33. 2.  PRODUCT
  34. -----------
  35.     IBM ViaVoice TTS Run Time Kit
  36.  
  37.  
  38. 3.  VERSION
  39. -----------
  40.     IBM ViaVoice TTS Run Time Kit, Version 6.2.1 
  41.  
  42.  
  43. 4.  DESCRIPTION 
  44. ----------------
  45. IBM ViaVoice TTS Run Time Kit, provides the speech synthesis engine and 
  46. other components necessary for applications to produce speech. IBM 
  47. ViaVoice TTS Run Time Kit, Version 6.2.1 produces speech from 
  48. recordings of units of human speech. These units (possibly phonemes, 
  49. syllables, words, or phrases) are then combined (concatenated) 
  50. according to linguistic rules formulated from analyzed text. When these 
  51. recorded speech units are entire phrases or sentences, the output can 
  52. be very natural, human-sounding speech.
  53.  
  54. The components for the ViaVoice TTS Run Time Kit include: 
  55. Speech synthesis engine
  56. Data Sets (Per Language):
  57. 1. Adult male 8 KHz 
  58. 2. Adult female 8 KHz
  59.  
  60. The Speech synthesis engine and data include capability for a 
  61. concatenative voice dataset representation as well as for synthesized 
  62. voice representation. The concatenative voice is derived from a 
  63. professional speaker, speaking a particular language and dialect, 
  64. recorded at a particular sampling rate. When a client program changes 
  65. languages, and it is doing concatenative synthesis, a new voice dataset 
  66. may have to be loaded into memory from disk, if it is not already 
  67. cached in memory from previous usage. 
  68.  
  69. The system will automatically choose concatenative synthesis if a voice 
  70. data set is available for the language, voice, and sample rate that you 
  71. select. For example, if you are using English at 8KHz, with voice 1 and 
  72. U.S. English voice 1 at 8Khz has been installed, then the system will 
  73. automatically do concatenative synthesis. Otherwise, the system will do 
  74. formant synthesis. 
  75.  
  76. When concatenation is being done, ECI voice selections appear to the 
  77. concatenative engine as requests to switch between already-loaded voice 
  78. datasets, while voice attribute settings appear as changes in the 
  79. phonetic and acoustic data that it receives. 
  80.  
  81.  
  82. 5.  CONTACT INFORMATION
  83. -----------------------
  84. Please visit our Web site for enhancements and updates to ViaVoice TTS.
  85.  
  86.     http://www.software.ibm.com/speech/dev
  87.  
  88.  
  89. 6.  UPGRADE PATH TO FULL VERSION
  90. --------------------------------
  91. The full version is currently included.
  92.  
  93.  
  94. 7.  INSTALLATION REQUIREMENTS
  95. -----------------------------
  96. Hardware: 
  97. Formant
  98. - Processor performance equivalent to Intel Pentium 133MHz with MMX 
  99.   with 256K L2 cache
  100. - 48MB of RAM in total
  101. - 10MB available hard disk space
  102. - Compatible 16 bit sound card 
  103. - CD-ROM drive 
  104. Note: Formant functionality is supported under:
  105.       Windows 98
  106.       Windows 2000
  107.       Windows NT 4.0
  108.       Windows Millennium
  109.  
  110. Concatenative
  111. - Processor performance equivalent to Intel Pentium III 266MHz
  112. - 48MB of RAM plus 48MB of RAM per Concatenative Voice loaded
  113. - 10MB available hard disk space + 75 MB Per Concatenative Voice
  114. - Compatible 16 bit sound card 
  115. - CD-ROM drive 
  116. Note: Concatenative functionality is only supported under:
  117.       Windows 2000 with Service Pack 1 
  118.       Windows NT 4.0 with Service Pack 6
  119.  
  120.  
  121. 8.  END-USER INSTALLATION INSTRUCTIONS
  122. --------------------------------------
  123. Run setup.exe from the installation media.
  124. Follow the instructions presented to you.
  125. You may be prompted to install concatenative voices.
  126. Select the voices for which you want to synthesize speech with the 
  127. concatenative method.
  128.  
  129. Warning: If you do not have sufficient free space on the target drive, 
  130. the install will fail without indicating any error. This is because we 
  131. removed the checks for free space in order to minimize the install 
  132. time. 
  133. The amount of free space that is required is affected by the number of 
  134. concatenative voices to be installed. On average, each concatenative 
  135. voice requires 75 MB.
  136.  
  137.  
  138. 9.  ISV INSTALLATION INSTRUCTIONS
  139. ---------------------------------
  140. If you are deploying applications using the IBM ViaVoice TTS Run Time Kit, you 
  141. must obtain a licence from IBM for redistribution.
  142. In addition, you will want to integrate our product installation with your 
  143. products' installation program. You will need to copy the redistributable TTS 
  144. driver to your installation media and invoke setup.exe.
  145. The IBM ViaVoice TTS Run Time Kit installation program setup.exe, takes the 
  146. following command line arguments: 
  147.  
  148. setup.exe [installPath] [/silent] [/hideaddremove] [/nosapi] [/nr] [/ns] 
  149. [/nl] [/nk] [-SMS] [/statusnone] [/statusold] -lXXXX 
  150.  
  151.  
  152. -l (Lower Case L) requires the the following XXXX language code
  153.  
  154. 0003-Catalan   0005-Czech      0006-Danish    0007-German
  155. 0008-Greek     0009-English    000a-Spanish   000b-Finnish
  156. 000e-Hungarian 0010-Italian    0011-Japanese  0012-Korean
  157. 0013-Dutch     0014-Norwegian  0015-Polish    0019-Russian
  158. 001a-Croatian  001b-Slovak     001d-Swedish   001e-Thai
  159. 001f-Turkish   0021-Indonesian 0024-Slovenian 002d-Basque
  160. 0404-Chinese (Taiwan) 040c-French (Standard)0416-Portuguese (Brazilian)
  161. 0804-Chinese (PRC) 0816-Portuguese (Standard) 0c0c-French (Canadian)
  162.  
  163. **Note due to an InstallShield limitation if you are using DoInstall you must 
  164. specify the same language as the parent installation.  See IS document Q144122.
  165.  
  166. <Installpath> can contain spaces and is a fully qualified path.  No quotes 
  167. should be placed around the path.  Path will be ignored if TTS is already on the 
  168. system.  If a path is provided on the command line the choose directory dialog 
  169. will not be shown.
  170.  
  171. /silent
  172. Prevent everything except the path dialog from appearing.  If voice data is 
  173. detected it too will ask which voices to install regardless of this parameter.
  174.  
  175. /hideaddremove
  176. Deletes the Add/Remove program entry from the control panel.
  177.  
  178. /nosapi 
  179. Prevents SAPI from installing.
  180.  
  181. /nr 
  182. No reboot message and subsequent reboot.  Even if a calling application executes 
  183. our install with a GUI we may wish to let the calling install perform additional 
  184. logic.  The calling install should then reboot if TTS requests.  Please see 
  185. appendix 2 for how to determine whether TTS requires a reboot.  TTS 
  186. functionality will not work until the requested reboot is carried out.  If the 
  187. /silent option is used /nr is redundant.
  188.  
  189. [-SMS] 
  190. This switch prevents a network connection and the Setup.exe from closing before 
  191. the installation is complete. The switch works with installations originating 
  192. from a Windows NT server over a network. Please note that SMS must be uppercase; 
  193. this switch is case-sensitive. 
  194.  
  195. /statusold
  196. By default, the TTS install will show a large progress bar dialog box.
  197. To display the small dialog box, use the /statusold option.
  198.  
  199. /statusnone
  200. To turn off the status box altogether use the option /statusnone.
  201.  
  202. [Redundant but still supported for backwards compatibility]
  203. /nk do not hide add remove (now default behavior)
  204. /nl no license (no license now packaged).
  205. /ns (silent install)
  206.  
  207. *Please note the language parameter is not optional. A minimal amount of 
  208. change is required to make old installations work.
  209.  
  210.  
  211. 10.  Working with Concatenative Voices
  212. --------------------------------------
  213. During installation you may install concatenative voices from the 
  214. selection presented to you.  Due to disk space issues, periodic 
  215. updates, or business reasons you may wish to add, remove, or relocate a
  216. concatenative voice. To add a voice, rerun the installation selecting 
  217. the voice you wish to add.
  218. To remove a voice you must unregister the voice then manually delete it 
  219. from the <INSTALLATION DIRECTORY>\voices\<LANGUAGE>\<VOICENUMBER> 
  220. directory. 
  221. To relocate a voice or update a voice from a downloaded file you must 
  222. register the location of the voice using the inivoice.exe utility. 
  223.  
  224. inivoice.exe [-u] <VOICENUMBER> <QUALIFIED PATH TO SYNTHINFO FILE>
  225.  
  226. For example, to move voice 1 from ViaVoice's default installation path 
  227. to F:\TTSVoices\us\1.  Move the data files and then invoke the following 
  228. command:
  229.  
  230. C:>inivoice.exe 1 "F:\TTSVoices\us\1at8000KHz_1_0\synthinfo"
  231.  
  232. To unregister a voice with the system use the -u command.
  233.  
  234. C:>inivoice.exe -u 1 "F:\TTSVoices\us\1at8000KHz_1_0\synthinfo"
  235.  
  236.  
  237. Note: Concatenative voices allow the following parameters to be adjusted 
  238. at run time:
  239.    - Volume
  240.    - Pitch Baseline
  241.    - Speed
  242.    - Pitch Fluctuation
  243.  
  244. The following parameters are not changeable for concatentaive voices:
  245.    - Gender
  246.    - Sample Rate (see section 4 above)
  247.    - Head Size
  248.    - Roughness
  249.    - Breathiness
  250.  
  251. If a change is executed to one of the above (not changeable 
  252. parameters), no error will occur and the voice synthesis will not 
  253. change.
  254.  
  255.  
  256. 11.  UNINSTALL INSTRUCTIONS
  257. ---------------------------
  258. To uninstall the ViaVoice TTS Run Time Kit: 
  259.  
  260.   Open Control Panel 
  261.   Select Add Remove Programs
  262.   Select the entry for IBM ViaVoice TTS Runtime (for the appropriate 
  263.   language)
  264.  
  265. You will be guided through the uninstall process.  
  266.  
  267.  
  268. 12.  GENERAL LIMITATIONS AND COMMENTS
  269. -------------------------------------
  270. This section contains information that is not specific to any 
  271. particular element of the ViaVoice TTS Run Time Kit but is general or 
  272. generic in nature. It is very important to heed these warnings and 
  273. follow the instructions given to avoid abnormal or unpredictable 
  274. results.
  275.  
  276. *  Currently, only 8 KHz concatenative voices are provided. 
  277. Application programmers requiring higher quality audio should upgrade 
  278. their voice datasets.  For more information visit the IBM ViaVoice home 
  279. page.
  280.  
  281. *  Currently, Version 6.2.1 supports the following languages with Formant 
  282.    voices, (Note: languages with a * denote formant and concatenative voice
  283.    support):
  284.    
  285.    Brazilian Portuguese
  286.    French*
  287.    Canadian French 
  288.    Finnish
  289.    German*
  290.    United States English*
  291.    United Kingdom English*
  292.    Spanish*
  293.    Mexican Spanish
  294.    Italian*
  295.    Chinese Simplified*
  296.    Chinese Traditional*
  297.    Japanese*
  298.    
  299.  
  300. 13.  KNOW PROBLEMS & F.A.Q.
  301. --------------------------
  302. The following are known problems that are included in this release:
  303.  
  304. *  If you are upgrading from TTS version 4.7 to TTS Version 6.2.1, you will
  305.    need to remove TTS version 4.7 prior to installing TTS Version 6.2.1. 
  306.  
  307. *  On Windows XP, and Windows 2000 non-administrator users may receive 
  308.    error messages pertaining to the InstallShield engine not being able to 
  309.    register. You will need to have the proper access permissions to properly 
  310.    install.
  311.  
  312. *  Setting the pitch baseline after setting head size may return an 
  313.    error in certain situations.
  314.  
  315. *  The installation copies a large amount of data from the installation 
  316.    media. During the copy process, very little screen activity is 
  317.    visible. 
  318.  
  319.  
  320. F.A.Q
  321. -----
  322. Q: Why is my application still synthesizing with format synthesis.
  323.  
  324. A: When you install an 8KHz voice the system will produce concatenative 
  325.    synthesis for any application which requests synthesis at 8KHz.  By
  326.    default the system generates audio at 11KHz.  In order to produce 
  327.    concatenative speech use eciSetParam to set the sample rate. Also,
  328.    check that version 5.0 was not installed after version 6.2.1 if both 
  329.    version reside on the same machine.
  330.  
  331.  
  332.  
  333. 14.  DEVELOPER NOTES
  334. --------------------
  335. *  The ViaVoice TTS SDK is a good starting point for developing applications.
  336.    In order to develop applications, you will require updated versions 
  337.    of ibmeci.lib, and eci.h that are installed in your ViaVoice TTS 
  338.    directory.  If you have existing TTS applications that use the ECI interface, 
  339.    you will need to re-compile and re-link these applications with the new 
  340.    files. 
  341.  
  342. *  Using SAPI programs with concatenative synthesis
  343.    If you have an 8K concatenative voice installed, and you select a 
  344.    SAPI voice  that has been optimized for  the telephone ("tel" in the 
  345.    name and speaker fields, and 0x200 in the available feature field), 
  346.    you will experience a delay while the concatenative voice data is 
  347.    loaded into memory. This delay is considerably shortened the second 
  348.    and subsequent times that you access the same voice, as the IBM 
  349.    Concatenative Memory Manager (CMM) caches voices for a period of 
  350.    time before flushing them from memory.
  351.  
  352. *  Concatenative Memory Manager (CMM) cmmcmd Utility
  353.    A support utility called cmmcmd was created to interface with the
  354.    Concatenative Memory Manager (CMM).
  355.    Note : This is a support tool and was not intended to be an end 
  356.    user utility.
  357.  
  358.    Invoke cmmcmd as follows:
  359.  
  360.    cmmcmd shutdown       -- shuts down the CMM 
  361.    cmmcmd timeout ##     -- sets the CMM timeout to ## seconds
  362.  
  363.  
  364. *  Concatenation Shared Memory Configuration Utility: inishmad 
  365.  
  366.    Concatenative speech data which is read-only and shared by all 
  367.    concatenative TTS applications is stored in shared memory that is 
  368.    managed by the CMM.  Because this memory contains pointers, it must be 
  369.    located at a common virtual address by all TTS concatenative
  370.    applications.  The default location of this shared memory on Windows is 
  371.    0x40000000 (1 GB).  If your application or another application has 
  372.    shared memory or DLLs loaded at this address or within 100 MB above it, 
  373.    the CMM may not be able to map the shared memory at the same virtual 
  374.    location for all processes.  In this case you should reconfigure 
  375.    the base address of the shared memory higher or lower until all your 
  376.    applications work correctly. For example, using a default base address of 
  377.    0x10000000 (256 MB) or 0x20000000 (512 MB) might work better for 
  378.    you. Use the inishmad utility is change the default address. 
  379.                                                                              
  380.    To change the default address to 0x20000000, invoke inishmad as follows:
  381.  
  382.    inishmad 0x20000000 
  383.  
  384.    To view the changed default address, invoke inishmad as follows: 
  385.  
  386.    inishmad -l 
  387.  
  388.    Note: Do not attempt to set the base address to a non-multiple of 64 KB.
  389.    It is not supported.  We recommend multiples of 1 MB. 
  390.  
  391.  
  392. 15.  TRADEMARK INFORMATION
  393. --------------------------
  394. IBM and ViaVoice are registered trademarks or trademarks of 
  395. International Business Machines Corporation in the United States and 
  396. other countries.
  397.  
  398. Microsoft, Windows, Windows NT, Windows 95, Windows 98, Windows XP, 
  399. and Windows 2000 logo are trademarks or registered trademarks of 
  400. Microsoft Corporation in the United States and/or other countries.
  401.  
  402. All other names are registered trademarks, trademarks or service marks 
  403. of their respective companies.
  404.  
  405.  
  406. Doc Number: win32.readme.6.2.1.txt.083001
  407.  
  408.