home *** CD-ROM | disk | FTP | other *** search
/ Reverse Code Engineering RCE CD +sandman 2000 / ReverseCodeEngineeringRceCdsandman2000.iso / RCE / Ebooks / Thinking in Java / c10 / SortedWordCount.java < prev    next >
Encoding:
Java Source  |  2000-05-25  |  4.9 KB  |  145 lines

  1. //: SortedWordCount.java
  2. //////////////////////////////////////////////////
  3. // Copyright (c) Bruce Eckel, 1998
  4. // Source code file from the book "Thinking in Java"
  5. // All rights reserved EXCEPT as allowed by the
  6. // following statements: You can freely use this file
  7. // for your own work (personal or commercial),
  8. // including modifications and distribution in
  9. // executable form only. Permission is granted to use
  10. // this file in classroom situations, including its
  11. // use in presentation materials, as long as the book
  12. // "Thinking in Java" is cited as the source. 
  13. // Except in classroom situations, you cannot copy
  14. // and distribute this code; instead, the sole
  15. // distribution point is http://www.BruceEckel.com 
  16. // (and official mirror sites) where it is
  17. // freely available. You cannot remove this
  18. // copyright and notice. You cannot distribute
  19. // modified versions of the source code in this
  20. // package. You cannot use this file in printed
  21. // media without the express permission of the
  22. // author. Bruce Eckel makes no representation about
  23. // the suitability of this software for any purpose.
  24. // It is provided "as is" without express or implied
  25. // warranty of any kind, including any implied
  26. // warranty of merchantability, fitness for a
  27. // particular purpose or non-infringement. The entire
  28. // risk as to the quality and performance of the
  29. // software is with you. Bruce Eckel and the
  30. // publisher shall not be liable for any damages
  31. // suffered by you or any third party as a result of
  32. // using or distributing software. In no event will
  33. // Bruce Eckel or the publisher be liable for any
  34. // lost revenue, profit, or data, or for direct,
  35. // indirect, special, consequential, incidental, or
  36. // punitive damages, however caused and regardless of
  37. // the theory of liability, arising out of the use of
  38. // or inability to use software, even if Bruce Eckel
  39. // and the publisher have been advised of the
  40. // possibility of such damages. Should the software
  41. // prove defective, you assume the cost of all
  42. // necessary servicing, repair, or correction. If you
  43. // think you've found an error, please email all
  44. // modified files with clearly commented changes to:
  45. // Bruce@EckelObjects.com. (Please use the same
  46. // address for non-code errors found in the book.)
  47. /////////////////////////////////////////////////
  48.  
  49. // Counts words in a file, outputs
  50. // results in sorted form.
  51. import java.io.*;
  52. import java.util.*;
  53. import c08.*; // Contains StrSortVector
  54.  
  55. class Counter {
  56.   private int i = 1;
  57.   int read() { return i; }
  58.   void increment() { i++; }
  59. }
  60.  
  61. public class SortedWordCount {
  62.   private FileInputStream file;
  63.   private StreamTokenizer st;
  64.   private Hashtable counts = new Hashtable();
  65.   SortedWordCount(String filename)
  66.     throws FileNotFoundException {
  67.     try {
  68.       file = new FileInputStream(filename);
  69.       st = new StreamTokenizer(file);
  70.       st.ordinaryChar('.');
  71.       st.ordinaryChar('-');
  72.     } catch(FileNotFoundException e) {
  73.       System.out.println(
  74.         "Could not open " + filename);
  75.       throw e;
  76.     }
  77.   }
  78.   void cleanup() {
  79.     try {
  80.       file.close();
  81.     } catch(IOException e) {
  82.       System.out.println(
  83.         "file.close() unsuccessful");
  84.     }
  85.   }
  86.   void countWords() {
  87.     try {
  88.       while(st.nextToken() !=
  89.         StreamTokenizer.TT_EOF) {
  90.         String s;
  91.         switch(st.ttype) {
  92.           case StreamTokenizer.TT_EOL:
  93.             s = new String("EOL");
  94.             break;
  95.           case StreamTokenizer.TT_NUMBER:
  96.             s = Double.toString(st.nval);
  97.             break;
  98.           case StreamTokenizer.TT_WORD:
  99.             s = st.sval; // Already a String
  100.             break;
  101.           default: // single character in ttype
  102.             s = String.valueOf((char)st.ttype);
  103.         }
  104.         if(counts.containsKey(s))
  105.           ((Counter)counts.get(s)).increment();
  106.         else
  107.           counts.put(s, new Counter());
  108.       }
  109.     } catch(IOException e) {
  110.       System.out.println(
  111.         "st.nextToken() unsuccessful");
  112.     }
  113.   }
  114.   Enumeration values() {
  115.     return counts.elements();
  116.   }
  117.   Enumeration keys() { return counts.keys(); }
  118.   Counter getCounter(String s) {
  119.     return (Counter)counts.get(s);
  120.   }
  121.   Enumeration sortedKeys() {
  122.     Enumeration e = counts.keys();
  123.     StrSortVector sv = new StrSortVector();
  124.     while(e.hasMoreElements())
  125.       sv.addElement((String)e.nextElement());
  126.     // This call forces a sort:
  127.     return sv.elements();
  128.   }
  129.   public static void main(String[] args) {
  130.     try {
  131.       SortedWordCount wc =
  132.         new SortedWordCount(args[0]);
  133.       wc.countWords();
  134.       Enumeration keys = wc.sortedKeys();
  135.       while(keys.hasMoreElements()) {
  136.         String key = (String)keys.nextElement();
  137.         System.out.println(key + ": "
  138.                  + wc.getCounter(key).read());
  139.       }
  140.       wc.cleanup();
  141.     } catch(Exception e) {
  142.       e.printStackTrace();
  143.     }
  144.   }
  145. } ///:~