主頁 > 知識庫 > 在Linux系統(tǒng)下移除文件內(nèi)的隱私數(shù)據(jù)的方法和具體步驟

在Linux系統(tǒng)下移除文件內(nèi)的隱私數(shù)據(jù)的方法和具體步驟

熱門標(biāo)簽:南通電銷外呼系統(tǒng)排名 營業(yè)廳外呼系統(tǒng)有錄音嗎 滁州外呼系統(tǒng)接口對接 南京電銷外呼系統(tǒng)廠家 地圖標(biāo)注怎么兼職 宿松百度地圖標(biāo)注 合力億捷外呼系統(tǒng)如何解壓安裝 地圖標(biāo)注和視頻彩鈴制作生意 信陽智能外呼系統(tǒng)聯(lián)系方式

典型的數(shù)據(jù)文件通常關(guān)聯(lián)著“元數(shù)據(jù)”,其包含這個文件的描述信息,表現(xiàn)為一系列屬性-值的集合。元數(shù)據(jù)一般包括創(chuàng)建者名稱、生成文件的工具、文件創(chuàng)建/修改時期、創(chuàng)建位置和編輯歷史等等。幾種流行的元數(shù)據(jù)標(biāo)準(zhǔn)有 EXIF(圖片)、RDF(web資源)和DOI(數(shù)字文檔)等。

雖然元數(shù)據(jù)在數(shù)據(jù)管理領(lǐng)域有它的優(yōu)點(diǎn),但事實(shí)上它會危害你的隱私。相機(jī)圖片中的EXIF格式數(shù)據(jù)會泄露出可識別的個人信息,比如相機(jī)型號、拍攝相關(guān)的GPS坐標(biāo)和用戶偏愛的照片編輯軟件等。在文檔和電子表格中的元數(shù)據(jù)包含作者/所屬單位信息和相關(guān)的編輯歷史。不一定這么絕對,但諸如metagoofil一類的元數(shù)據(jù)收集工具在信息收集的過程中常最作為入侵測試的一部分被利用。

對那些想要從共享數(shù)據(jù)中擦除一切個人元數(shù)據(jù)的用戶來說,有一些方法從數(shù)據(jù)文件中移除元數(shù)據(jù)。你可以使用已有的文檔或圖片編輯軟件,通常有自帶的元數(shù)據(jù)編輯功能。在這個教程里,我會介紹一種不錯的、單獨(dú)的元數(shù)據(jù)清理工具,其目標(biāo)只有一個:匿名一切私有元數(shù)據(jù)。

MAT(元數(shù)據(jù)匿名工具箱)是一款專業(yè)的元數(shù)據(jù)清理器,使用Python編寫。它屬于Tor旗下的項(xiàng)目,而且是Live 版的隱私增強(qiáng)操作系統(tǒng) Trails 的標(biāo)配應(yīng)用。

與諸如exiftool等只能對有限種類的文件類型進(jìn)行寫入的工具相比,MAT支持從各種各樣的文件中消除元數(shù)據(jù):圖片(png、jpg)、文檔(odt、docx、pptx、xlsx和pdf)、歸檔文件(tar、tar.bz2)和音頻(mp3、ogg、flac)等。

在Linux上安裝MAT

在基于Debian的系統(tǒng)(Ubuntu或Linux Mint)上,已經(jīng)打包好MAT,所以安裝很直接:

$ sudo apt-get install mat

在Fedora上,并沒有預(yù)先生成的MAT軟件包,所以你需要從源碼生成。這是我在Fedora上生成MAT的步驟(不成功的話,請查看教程底部):

$ sudo yum install python-devel intltool python-pdfrw perl-Image-ExifTool python-mutagen$ sudo pip install hachoir-core hachoir-parser$ wget https://mat.boum.org/files/mat-0.5.tar.xz$ tar xf mat-0.5.tar.xz$ cd mat-0.5$ python setup.py install 

使用MAT-GUI匿名元數(shù)據(jù)

一旦安裝好,通過GUI和命令行都可以使用MAT。輸入這個命令啟動MAT的GUI:

$ mat-gui

嘗試清理一個包含如下內(nèi)置元數(shù)據(jù)的實(shí)例文檔文件(如private.odt)。

點(diǎn)擊“添加”按鈕來添加需要清理的文件到MAT中。一旦載入文件,點(diǎn)擊“確認(rèn)”按鈕對所有隱藏的元數(shù)據(jù)信息進(jìn)行掃描。

只要元數(shù)據(jù)被MAT檢測到,“State”狀態(tài)就會被標(biāo)記成“Dirty”。雙擊文件可以查看檢測到的元數(shù)據(jù)。

點(diǎn)擊“清理”按鈕來清除文件中的元數(shù)據(jù)。MAT會自動清空文件中的所有私有元數(shù)據(jù)字段。

清除后的狀態(tài)中不包含任何私有可辨識的痕跡:

從命令行匿名元數(shù)據(jù)

$ mat -c .

正如前面提到的,另一種調(diào)用MAT的方式是從命令行,使用mat命令可達(dá)到。

為了檢查任何敏感的元數(shù)據(jù),先前往文件所在的目錄,然后運(yùn)行:

$ mat -c .

這樣會掃描當(dāng)前目錄和其子目錄下的所有文件,并報(bào)告它們的狀態(tài)(已清理或未清理)。

你可以使用“-d”選項(xiàng)來查看檢測到的真實(shí)元數(shù)據(jù):

$ mat -d input_file> 

如果不為mat命令提供任何選項(xiàng),默認(rèn)操作會移除文件的元數(shù)據(jù)。如果要在清理的過程中保留原始文件的備份,使用“-b”選項(xiàng)。下面命令會清除所有文件的元數(shù)據(jù),并將原始文件存儲為“*.bak”文件。

$ mat -b . 

查看所支持的文件類型,請運(yùn)行:

$ mat -l 

故障排除

當(dāng)前我在Fedora上使用編譯版本的MAT遇到了下列問題。當(dāng)我嘗試在Fedora清除歸檔/文檔文件的元數(shù)據(jù)時(如.gz、.odt、*.docx),MAT因?yàn)橄铝绣e誤失敗。如果你知道如何解決這個問題,請?jiān)谠u論里回復(fù)我。

  File "/usr/lib64/python2.7/zipfile.py", line 305, in __init__    raise ValueError('ZIP does not support timestamps before 1980')ValueError: ZIP does not support timestamps before 1980

總結(jié)

MAT是一款簡單但非常好用的工具,用來預(yù)防從元數(shù)據(jù)中無意泄露私人數(shù)據(jù)。請注意如果有必要,文件內(nèi)容也需要保護(hù)。MAT能做的是消除與文件相關(guān)的元數(shù)據(jù),但并不會對文件本身進(jìn)行任何操作。簡而言之,MAT是一名救生員,因?yàn)樗梢蕴幚泶蠖鄶?shù)常見的元數(shù)據(jù)移除,但不應(yīng)該只指望它來保證你的隱私。[譯者注:養(yǎng)成良好的隱私保護(hù)意識和習(xí)慣才是最好的方法,謝謝閱讀,希望能幫到大家,請繼續(xù)關(guān)注腳本之家,我們會努力分享更多優(yōu)秀的文章。

標(biāo)簽:麗水 銅陵 山南 衢州 新余 潛江 運(yùn)城 保定

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《在Linux系統(tǒng)下移除文件內(nèi)的隱私數(shù)據(jù)的方法和具體步驟》,本文關(guān)鍵詞  在,Linux,系統(tǒng),下移,除,文件,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《在Linux系統(tǒng)下移除文件內(nèi)的隱私數(shù)據(jù)的方法和具體步驟》相關(guān)的同類信息!
  • 本頁收集關(guān)于在Linux系統(tǒng)下移除文件內(nèi)的隱私數(shù)據(jù)的方法和具體步驟的相關(guān)信息資訊供網(wǎng)民參考!
  • 企业400电话

    智能AI客服机器人
    15000

    在线订购

    合计11份范本:公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

    推薦文章