主頁(yè) > 知識(shí)庫(kù) > 使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能示例

使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能示例

熱門(mén)標(biāo)簽:地圖標(biāo)注多少錢(qián)一張 福州人工智能電銷(xiāo)機(jī)器人加盟 云狐人工智能電話(huà)機(jī)器人 廣州銷(xiāo)售外呼系統(tǒng)定制 電銷(xiāo)機(jī)器人 數(shù)據(jù) ai電銷(xiāo)機(jī)器人對(duì)貸款有幫助嗎 400電話(huà)辦理信任翰諾科技 怎樣給陜西地圖標(biāo)注顏色 宿遷智能外呼系統(tǒng)排名

有時(shí)我們需要對(duì)PDF文件進(jìn)行一些處理,提取文本、合并等。以前我們使用A-PDF Text Extractor免費(fèi)工具,為什么不自己寫(xiě)一個(gè)呢?
現(xiàn)在我們可以使用PDFBox-0.7.3這個(gè)開(kāi)源類(lèi)庫(kù). 下載解包后引用:

復(fù)制代碼 代碼如下:

PDFBox-0.7.3.dll
IKVM.GNU.Classpath.dll

新建一個(gè)項(xiàng)目,代碼很簡(jiǎn)單:

復(fù)制代碼 代碼如下:

public static string ParseToTxtStringUsingPDFBox(string filename){
PDDocument doc = PDDocument.load(filename);
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}

獲得這個(gè)textString,再把它們寫(xiě)成磁盤(pán)文件就可以了, 像這樣的方法:

復(fù)制代碼 代碼如下:

public static void WriteToTextFile(string str,string txtpath)
{
if (string.IsNullOrEmpty(txtpath))
throw new ArgumentNullException("Output file path should not be Null");
using (var txtWriter = new StreamWriter(txtpath))
{
txtWriter.Write(str);
txtWriter.Close();
}
}

其它的功能您可以自行發(fā)揮了. 這個(gè)類(lèi)庫(kù)目前支持:

PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF

標(biāo)簽:大興安嶺 曲靖 延安 焦作 黃南 新疆 宜春 綿陽(yáng)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能示例》,本文關(guān)鍵詞  使用,pdfbox,實(shí)現(xiàn),pdf,文本,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能示例》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能示例的相關(guān)信息資訊供網(wǎng)民參考!
  • 企业400电话

    智能AI客服机器人
    15000

    在线订购

    合计11份范本:公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

    推薦文章