主頁 > 知識庫 > Java正則表達式使用

Java正則表達式使用

熱門標(biāo)簽:電子圍欄 銀行業(yè)務(wù) Linux服務(wù)器 團購網(wǎng)站 阿里云 服務(wù)器配置 科大訊飛語音識別系統(tǒng) Mysql連接數(shù)設(shè)置

一:抓取網(wǎng)頁中的Email地址

利用正則表達式匹配網(wǎng)頁中的文本

復(fù)制代碼 代碼如下:

[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+

將網(wǎng)頁內(nèi)容分割提取

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class EmailSpider {
  public static void main(String[] args) {
    try {
      BufferedReader br = new BufferedReader(new FileReader("C:\\emailSpider.html"));
      String line = "";
      while((line=br.readLine()) != null) {
        parse(line);
      }
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
  private static void parse(String line) {
    Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
    Matcher m = p.matcher(line);
    while(m.find()) {
      System.out.println(m.group());
    }
  }
}

打印結(jié)果:

867124664@qq.com
260678675@QQ.com
806208721@qq.com
hr_1985@163.com
32575987@qq.com
qingchen0501@126.com
yingyihanxin@foxmail.com
1170382650@qq.com
1170382650@qq.com
yingyihanxin@foxmail.com
qingchen0501@126.com
32575987@qq.com
hr_1985@163.com

現(xiàn)在你找到這么多郵箱地址,用上JavaMail的知識,你可以群發(fā)垃圾郵件了,呵呵?。。?/p>

二:代碼統(tǒng)計

import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
public class CodeCounter {
  static long normalLines = 0;//正常代碼行
  static long commentLines = 0;//注釋行
  static long whiteLines = 0;//空白行
  public static void main(String[] args) {
    //找到某個文件夾,該文件夾下面在沒有文件夾,這里沒有寫遞歸處理不在同一文件夾的文件
    File f = new File("E:\\Workspaces\\eclipse\\Application\\JavaMailTest\\src\\com\\java\\mail");
    File[] codeFiles = f.listFiles();
    for(File child : codeFiles){
      //只統(tǒng)計java文件
      if(child.getName().matches(".*\\.java$")) {
        parse(child);
      }
    }
    System.out.println("normalLines:" + normalLines);
    System.out.println("commentLines:" + commentLines);
    System.out.println("whiteLines:" + whiteLines);
  }
  private static void parse(File f) {
    BufferedReader br = null;
    //表示是否為注釋開始
    boolean comment = false;
    try {
      br = new BufferedReader(new FileReader(f));
      String line = "";
      while((line = br.readLine()) != null) {
        //去掉注釋符/*前面可能出現(xiàn)的空白
        line = line.trim();
        //空行 因為readLine()將字符串取出來時,已經(jīng)去掉了換行符\n
        //所以不是"^[\\s[^\\n]]*\\n$"
        if(line.matches("^[\\s[^\\n]]*$")) {
          whiteLines ++;
        } else if (line.startsWith("/*")  !line.endsWith("*/")) {
          //統(tǒng)計多行/*****/
          commentLines ++;
          comment = true;  
        } else if (line.startsWith("/*")  line.endsWith("*/")) {
          //統(tǒng)計一行/**/
          commentLines ++;
        } else if (true == comment) {
          //統(tǒng)計*/
          commentLines ++;
          if(line.endsWith("*/")) {
            comment = false;
          }
        } else if (line.startsWith("http://")) {
          commentLines ++;
        } else {
          normalLines ++;
        }
      }
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } finally {
      if(br != null) {
        try {
          br.close();
          br = null;
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
    }
  }
}

以上內(nèi)容就是本文給大家分享的Java在正則表達式的使用,希望大家喜歡。

您可能感興趣的文章:
  • Java正則表達式入門基礎(chǔ)篇(新手必看)
  • Java正則表達式基礎(chǔ)入門知識
  • 在Java編程中使用正則表達式的基本方法

標(biāo)簽:衢州 江蘇 廣元 大理 蚌埠 棗莊 萍鄉(xiāng) 衡水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Java正則表達式使用》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266