home *** CD-ROM | disk | FTP | other *** search
/ PC World 2005 February / PCWorld_2005-02_cd.bin / software / topware / thebat / thebat_home_301.msi / Data1.cab / advanced.ini < prev    next >
Text File  |  2004-10-12  |  5KB  |  77 lines

  1. ; this file contains advanced bayesit settings which may be not interested for all number of users. It must be placed either in the bayesit's working folder, either in the same folder as bayesit.tbp (in this case the new file with copy of settings will be created in the working folder). Values can be either solid (without spaces), either enclosed in quotes. In the case of solid values ';' required at the end of erevy line.
  2. ; You can also place the file "bayesit.ini" with basic settings which are available during GUI setup - the settings from the file will be used as default during filter's installation (first run).
  3. ; the names of values for bayesit.ini is there:
  4.  
  5. ;working directory                (string)
  6. ;filter log                        (string)
  7. ;list of ignoring kludges         (string)
  8. ;show splash screen             (1 or 0)
  9. ;log current process            (1 or 0)
  10. ;log global state"                (1 or 0)
  11. ;log grades                        (1 or 0)
  12. ;filter is logged                (1 or 0)
  13. ;use white list of kludges        (1 or 0)
  14. ;use partically translitting    (1 or 0)
  15. ;sighificant tokens                (integer - by default 15)
  16. ;spam transliteration table        (string)
  17. ;local user alphabet             (string)
  18.  
  19. ; "THREAD_PRIORITY_LOWEST" - for usual recalculating thread.
  20. working thread priority = 2;
  21.  
  22. ; TREHAD_PRIORITY_NORMAL - for recalculating thread when exiting from The Bat! started.
  23. onexit thread priority = 3;
  24.  
  25. ; if 1, export "selective.txt", if 0 - don't export.
  26. export selective download = 1;
  27.  
  28. ; indicates how many times a header token must be met in spam headers to be included
  29. ; into "selective.txt" file. Lower value increases filesize and increases possibility
  30. ; of false positivies.
  31. selective download spam threshold = 10;
  32.  
  33. ; trait numeric HTML comments as marks of spam
  34. simple digits spam marks = 1;
  35.  
  36. ; trait any solid HTML comments as marks of spam
  37. no spaces spam marks = 1;
  38.  
  39. ; if token is longer than this value, store it in the base in form of hash
  40. limit size to hash = 19;
  41.  
  42. ; if header token is longer than this value, store it in the base in form of hash.
  43. limit size to hash header = 96;
  44.  
  45. ; It is "last chance" - if no TEMP environment variable defined and if no other temp paths exists, this path will be used.
  46. temporary dictionary = "c:\\temp";
  47.  
  48. ; not used in current version (must be 0)
  49. use expiration = 0;
  50.  
  51. ; not used in current version (no meaning, what you set here - only check that it is integer number)
  52. age to expirate = 100;
  53.  
  54. ; if 1, the filter can create it's base "from zero" - i.e. even if no "mark as" action were made for any dictionary, using only incoming mail, by marking only spam "as spam" and leaving non-spam. If 0, the filter can be trained ONLY if at least one letter was marked as spam and non-spam.
  55. learn from zero = 1;
  56.  
  57. ; if log file exceed this size, it will be renamed into same name with "~" added at the beginning of the name, and the logging will be continued into new file.
  58. max size of log file = 131072;
  59.  
  60. ; If it is integer number from 1 and more, recalculation is completed after filter collect more than this number of letters. If it is float value below 1 (as 0.001), recalculation is completed after filter collects the quantity of letters which is more than total number of letter which are already in base multiplied to this number (for example, if you have 1000 spams and 2000 hams and this parameter is set to 0.01, recalculation will be when you collect (1000+2000)*0.01 = 30 letters. But anyway in this case recalculation will be done if number of collected letters is more than 100.
  61. recalculating strategy = 0.005;
  62.  
  63. ; this number shows, how much "heavier" non-spam tokens than spam. It makes some kind of "guard" and keeps from false positives. Usual value is 2, but you can also try others...
  64. regarding threshold = 2;
  65.  
  66. ; if yes, the filter will automark all letters according assigned threshold for "move to junk folder" and result of working. If no, you must "mark as" ALL incoming letters in order to keep the filter's base healthy.
  67. use autotrain = 1;
  68.  
  69. ; if 1, and the filter can't found token during regarding, it will try some variations of the same token (from capital letter, all caps, same variations from header/body, same variations with added "!"). It helps to improve the quality of filtering. If 0, the filter will use default value for absent tokens. It helps to make the filter faster.
  70. use degeneration = 1;
  71.  
  72. ; The number of "!" which will be added subsequently to the token in order to check all it's variations (during degeneration). If previous parameter is 0, this one is ignored.
  73. number of exclamations = 5;
  74.  
  75. ; If this value is 0, the filter works usual way and calculate the final grade of a letter using a bayesian formula. If it is set to 1, the filter just calculates arithmetic average as the final result (which is linear and smooth).
  76. use average instead of bayesian = 0;
  77.