找回密碼 或 安全提問
 註冊
|註冊|登錄

伊莉討論區

搜索
儲值後自動升級用戶組搞笑、娛樂、精彩的影片讓你看你準備好成為出色的版主了嗎?
火影偷拍中文新竹旬果siro鬼滅之刃
高島愛茜鎮怪異牧場katfile美綜世界bagr 033汙部屋の

休閒聊天興趣交流學術文化旅遊交流飲食交流家庭事務PC GAMETV GAME
熱門線上其他線上感情感性寵物交流家族門派動漫交流貼圖分享BL/GL
音樂世界影視娛樂女性頻道潮流資訊BT下載區GB下載區下載分享短片
電腦資訊數碼產品手機交流交易廣場網站事務長篇小說體育運動時事經濟
上班一族博彩娛樂

[繁]海賊王 航海王 11

[簡]假面騎士GOTCHARD

(4月新番)[繁]怪獸八

(4月新番)[繁]戰隊大

[繁]迷宮飯12~15-

[繁]戰隊大失格02-
C & C++ 語言C# 語言Visual Basic 語言PHP 語言JAVA 語言
查看: 2240|回復: 15
打印上一主題下一主題

[問題]請問如何把讀到的文檔用空白鍵分割英文字串?[複製鏈接]

帖子
65
積分
23 點
潛水值
12145 米
跳轉到指定樓層
樓主
發表於 2012-6-13 03:53 AM|只看該作者|倒序瀏覽
成為伊莉的版主,你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛,那種滿足感等著你來嚐嚐喔。
我主要是 讀txt檔 把裡面的英文分開計算出現次數 再轉出一個txt檔
例如:I is apple
I  1
is  1
apple 1
讀取跟輸出txt檔都ok
就是在把文章分割字串有錯誤
本來想要判斷空白鍵做分割但是都沒成功
希望可以用成空白或是特殊符號都可以分割
請教各位大大我的程式是不是那裡有錯誤?

import java.io.*;
import java.util.*;
...
瀏覽完整內容,請先 註冊登入會員
分享分享0收藏收藏0支持支持0

使用道具檢舉

BlueMarken 該用戶已被刪除
頭香
發表於 2012-6-13 09:11 AM|只看該作者
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。
本帖最後由 BlueMarken 於 2012-6-13 09:12 AM 編輯

先用一個簡單的方式分解字串,主要是利用 String.split()方法,細節就麻煩自己查文件(查Java Doc很重要的)。
  1.   public static void main(String[] args) {
  2.     String test="This is a test string.";
  3.     String[] parts=test.split("\\s");
  4.     System.out.println(String.format("There are %s words in the test string.", parts.length));
  5.   }
複製代碼
output
  1. There are 5 words in the test string.
複製代碼
...
瀏覽完整內容,請先 註冊登入會員
分享使你變得更實在,可以使其他人感到快樂,分享是我們的動力。今天就來分享你的資訊、圖片或檔案吧。

使用道具檢舉

BlueMarken 該用戶已被刪除
3
發表於 2012-6-13 11:27 AM|只看該作者
本帖最後由 BlueMarken 於 2012-6-13 11:28 AM 編輯

花了一點時間學習 StreamTokener,順便Debug一下程式,我的範例如下,不知道是否符合你的需求:
  1. package sliptstring;

  2. import java.io.IOException;
  3. import java.io.StreamTokenizer;
  4. import java.io.StringReader;
  5. import java.util.ArrayList;
  6. import java.util.Collections;
  7. import java.util.Comparator;
  8. import java.util.HashMap;
  9. import java.util.List;
  10. import java.util.Map;
  11. import java.util.Map.Entry;

  12. /**
  13. *
  14. * @author marken
  15. */
  16. public class SliptString {

  17.   /**
  18.    * @param args the command line arguments
  19.    */
  20.   public static void main(String[] args) throws IOException {
  21.     String svalue = "There are two apples, three oranges\n\r and four tomatos.\n"
  22.         + "The promble is '-' whether it is a token or not.";
  23.     StreamTokenizer st = new StreamTokenizer(new StringReader(svalue));

  24.     st.lowerCaseMode(true);
  25.     //st.eolIsSignificant (true);
  26.     st.ordinaryChar('.');

  27.     Map<String, Integer> mapWords = new HashMap<>();
  28.     out:
  29.     while (true) {
  30.       int ttype = st.nextToken();
  31.       switch (ttype) {
  32.         case StreamTokenizer.TT_EOF:
  33.           break out; // 這一行才能正確的跳出 while 迴圈
  34.         case StreamTokenizer.TT_WORD:
  35.           // 取得Hashmap內累計的次數
  36.           Integer numWords = mapWords.get(st.sval);
  37.           numWords = (numWords == null ? 1 : ++numWords);
  38.           // 存回次數
  39.           mapWords.put(st.sval, numWords);
  40.       }
  41.     }
  42.     // 依出現的次數排序, 遞減排序,最多次的最前面
  43.     List<Map.Entry<String, Integer>> mapEntries = new ArrayList<>(mapWords.entrySet());
  44.     Collections.sort(mapEntries,new Comparator<Map.Entry<String, Integer>>(){

  45.       @Override
  46.       public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {
  47.         return o2.getValue().compareTo(o1.getValue());
  48.       }
  49.     });
  50.     // 印出結果
  51.     for(Map.Entry<String, Integer> entry : mapEntries) {
  52.       System.out.println(String.format("%s:%d", entry.getKey(),entry.getValue()));
  53.     }
  54.   }
  55. }
複製代碼
...
瀏覽完整內容,請先 註冊登入會員
若瀏覽伊莉的時侯發生問題或不正常情況,請使用Internet Explorer(I.E)。

使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
4
發表於 2012-6-13 03:39 PM|只看該作者
如果發覺自己無法使用一些功能或出現問題,請按重新整理一次,並待所有網頁內容完全載入後5秒才進行操作。
BlueMarken 發表於 2012-6-13 11:27 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

花了一點時間學習 StreamTokener,順便Debug一下程式,我的範例如下,不知道是否符合你的需求: ...

謝謝大大 的確很符合 只是還有 讀取txt檔
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

BlueMarken 該用戶已被刪除
5
發表於 2012-6-13 08:11 PM|只看該作者
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。
ray215018 發表於 2012-6-13 03:39 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

謝謝大大 的確很符合 只是還有 讀取txt檔
我是想把大大教的
String svalue = "There are two apples, thr ...

StreamTokenizer()建構時,直接丟bufReder就可以了。
  1. String               fileName   = "test1.txt";
  2.     BufferedReader       bufReader  = new BufferedReader (new FileReader (fileName));
  3.     StreamTokenizer st = new StreamTokenizer(bufReader);
複製代碼
...
瀏覽完整內容,請先 註冊登入會員





回覆中加入附件並不會使你增加積分,請使用主題方式發佈附件。

使用道具檢舉

BlueMarken 該用戶已被刪除
6
發表於 2012-6-13 08:11 PM|只看該作者
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。
ray215018 發表於 2012-6-13 03:39 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

謝謝大大 的確很符合 只是還有 讀取txt檔
我是想把大大教的
String svalue = "There are two apples, thr ...

StreamTokenizer()建構時,直接丟bufReder就可以了。
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
7
發表於 2012-6-13 08:41 PM|只看該作者
BlueMarken 發表於 2012-6-13 08:11 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

StreamTokenizer()建構時,直接丟bufReder就可以了。
參考:

大大 我剛剛改完之後 執行出來的結果又變成了 純單字而已
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

BlueMarken 該用戶已被刪除
8
發表於 2012-6-13 10:44 PM|只看該作者
你要Parser的檔案,看來像 XML 檔案,你必須仔細的想想你的需求是什麼。
處理 xml 檔是另外一回事。
成為伊莉的版主,你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛,那種滿足感等著你來嚐嚐喔。

使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
9
發表於 2012-6-13 10:57 PM|只看該作者
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。
BlueMarken 發表於 2012-6-13 10:44 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

你要Parser的檔案,看來像 XML 檔案,你必須仔細的想想你的需求是什麼。
處理 xml 檔是另外一回事。
...

嗯 我還是讀txt檔 只是裡面可能會有似類xml格式
...
瀏覽完整內容,請先 註冊登入會員
成為伊莉的版主,你將獲得更高級和無限的權限。把你感興趣的版面一步步地發展和豐盛,那種滿足感等著你來嚐嚐喔。

使用道具檢舉

BlueMarken 該用戶已被刪除
10
發表於 2012-6-14 10:34 AM|只看該作者
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。
我測試過你貼上來的文字檔,可以執行喔,你要不要貼上你的錯誤訊息。
另外,我是用 JDK 7 去執行的(有用到新語法)。
另外,切字的方式,當然就要依你需求去調整。
附上部份的結果:
  1. of:8
  2. the:7
  3. a:6
  4. to:6
  5. and:5
  6. techniques:4
  7. classification:4
複製代碼
...
瀏覽完整內容,請先 註冊登入會員





使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
11
發表於 2012-6-14 08:25 PM|只看該作者
BlueMarken 發表於 2012-6-14 10:34 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

我測試過你貼上來的文字檔,可以執行喔,你要不要貼上你的錯誤訊息。
另外,我是用 JDK 7 去執行的(有用到 ...

只是我用執行完變成這樣
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
12
發表於 2012-6-14 10:53 PM|只看該作者
回覆中加入附件並不會使你增加積分,請使用主題方式發佈附件。
我就是把txt讀取 跟輸出的地方改過
但是跑出來的結果跟大大的不一樣
  1. //package sliptstring;
  2. import java.io.*;
  3. import java.util.*;
  4. import java.io.IOException;
  5. import java.io.StreamTokenizer;
  6. import java.io.StringReader;
  7. import java.util.ArrayList;
  8. import java.util.Collections;
  9. import java.util.Comparator;
  10. import java.util.HashMap;
  11. import java.util.List;
  12. import java.util.Map;
  13. import java.util.Map.Entry;

  14. /**
  15. *
  16. * @author marken
  17. */
  18. public class SliptString {

  19.   /**
  20.    * @param args the command line arguments
  21.    */
  22.   public static void main(String[] args) throws IOException {
  23.    
  24.    
  25.     String               fileName   = "test2.txt";
  26.     BufferedReader       svalue  = new BufferedReader (new FileReader (fileName));   
  27.     StreamTokenizer      st    = new StreamTokenizer (svalue);

  28.     st.lowerCaseMode(true);
  29.     //st.eolIsSignificant (true);
  30.     st.ordinaryChar('.');

  31.     Map<String, Integer> mapWords = new HashMap<>();
  32.     out:
  33.     while (true) {
  34.       int ttype = st.nextToken();
  35.       switch (ttype) {
  36.         case StreamTokenizer.TT_EOF:
  37.           break out; // 這一行才能正確的跳出 while 迴圈
  38.         case StreamTokenizer.TT_WORD:
  39.           // 取得Hashmap內累計的次數
  40.           Integer numWords = mapWords.get(st.sval);
  41.           numWords = (numWords == null ? 1 : ++numWords);
  42.           // 存回次數
  43.           mapWords.put(st.sval, numWords);
  44.       }
  45.     }
  46.     // 依出現的次數排序, 遞減排序,最多次的最前面
  47.     List<Map.Entry<String, Integer>> mapEntries = new ArrayList<>(mapWords.entrySet());
  48.     Collections.sort(mapEntries,new Comparator<Map.Entry<String, Integer>>(){

  49.       @Override
  50.       public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {
  51.         return o2.getValue().compareTo(o1.getValue());
  52.       }
  53.     });
  54.     // 印出結果
  55. BufferedWriter bw = new BufferedWriter
  56.         (new FileWriter("test.txt"));

  57.     for(Map.Entry<String, Integer> entry : mapEntries) {
  58.       bw.write(String.format("%s:%d", entry.getKey(),entry.getValue())+"\r\n");
  59.     }
  60. bw.close();
  61.   }
  62. }
複製代碼
...
瀏覽完整內容,請先 註冊登入會員
分享使你變得更實在,可以使其他人感到快樂,分享是我們的動力。今天就來分享你的資訊、圖片或檔案吧。

使用道具檢舉

BlueMarken 該用戶已被刪除
13
發表於 2012-6-15 07:50 PM|只看該作者
ray215018 發表於 2012-6-14 10:53 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

我就是把txt讀取 跟輸出的地方改過
但是跑出來的結果跟大大的不一樣



我照你的程式跑,沒問題。我猜可能是環境的問題。
...
瀏覽完整內容,請先 註冊登入會員
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。

使用道具檢舉

帖子
65
積分
23 點
潛水值
12145 米
14
發表於 2012-6-16 07:03 AM|只看該作者
如果發覺自己無法使用一些功能或出現問題,請按重新整理一次,並待所有網頁內容完全載入後5秒才進行操作。
BlueMarken 發表於 2012-6-15 07:50 PM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

我照你的程式跑,沒問題。我猜可能是環境的問題。
我是用 jdk 7u5 ,你有檢查過你的環境? 另外,你的文 ...

的確是可以執行成功  感謝你
...
瀏覽完整內容,請先 註冊登入會員
若有安裝色情守門員,可用無界、自由門等軟件瀏覽伊莉。或使用以下網址瀏覽伊莉: http://www.eyny.com:81/index.php

使用道具檢舉

BlueMarken 該用戶已被刪除
15
發表於 2012-6-16 07:57 PM|只看該作者
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。
ray215018 發表於 2012-6-16 07:03 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

的確是可以執行成功  感謝你
我原本是用 javac SliptString.java     java SliptString  做執行的動作
...
瀏覽完整內容,請先 註冊登入會員





若瀏覽伊莉的時侯發生問題或不正常情況,請使用Internet Explorer(I.E)。

使用道具檢舉

您需要登錄後才可以回帖 登錄 | 註冊

Powered by Discuz!

© Comsenz Inc.

重要聲明:本討論區是以即時上載留言的方式運作,對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。切勿上傳和撰寫 侵犯版權(未經授權)、粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。
回頂部