Linux下清除文件中的隐私数据的方法

2016-02-20 03:14 15 1 收藏

清醒时做事,糊涂时读书,大怒时睡觉,无聊时关注图老师为大家准备的精彩内容。下面为大家推荐Linux下清除文件中的隐私数据的方法,无聊中的都看过来。

【 tulaoshi.com - Linux教程 】

我们平时创建的文件、图片都包含着很多信息,很容易被人利用,所以要清除文件中的元数据,以保护个人隐私。下面图老师小编就给大家介绍下如何清除文件中的隐私数据,一起来学习下吧。

典型的数据文件通常关联着元数据,其包含这个文件的描述信息,表现为一系列属性-值的集合。元数据一般包括创建者名称、生成文件的工具、文件创建/修改时期、创建位置和编辑历史等等。几种流行的元数据标准有 EXIF(图片)、RDF(web资源)和DOI(数字文档)等。

虽然元数据在数据管理领域有它的优点,但事实上它会危害你的隐私。相机图片中的EXIF格式数据会泄露出可识别的个人信息,比如相机型号、拍摄相关的GPS坐标和用户偏爱的照片编辑软件等。在文档和电子表格中的元数据包含作者/所属单位信息和相关的编辑历史。不一定这么绝对,但诸如metagoofil一类的元数据收集工具在信息收集的过程中常最作为入侵测试的一部分被利用。

 Linux下清除文件中的隐私数据的方法

对那些想要从共享数据中擦除一切个人元数据的用户来说,有一些方法从数据文件中移除元数据。你可以使用已有的文档或图片编辑软件,通常有自带的元数据编辑功能。在这个教程里,我会介绍一种不错的、单独的元数据清理工具,其目标只有一个:匿名一切私有元数据。

MAT(元数据匿名工具箱)是一款专业的元数据清理器,使用Python编写。它属于Tor旗下的项目,而且是Live 版的隐私增强操作系统 Trails 的标配应用。

与诸如exiftool等只能对有限种类的文件类型进行写入的工具相比,MAT支持从各种各样的文件中消除元数据:图片(png、jpg)、文档(odt、docx、pptx、xlsx和pdf)、归档文件(tar、tar.bz2)和音频(mp3、ogg、flac)等。

在Linux上安装MAT

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com)

在基于Debian的系统(Ubuntu或Linux Mint)上,已经打包好MAT,所以安装很直接:

$ sudo apt-get install mat

在Fedora上,并没有预先生成的MAT软件包,所以你需要从源码生成。这是我在Fedora上生成MAT的步骤(不成功的话,请查看教程底部):

$ sudo yum install python-devel intltool python-pdfrw perl-Image-ExifTool python-mutagen$ sudo pip install hachoir-core hachoir-parser$ wget https://mat.boum.org/files/mat-0.5.tar.xz$ tar xf mat-0.5.tar.xz$ cd mat-0.5$ python setup.py install

使用MAT-GUI匿名元数据

一旦安装好,通过GUI和命令行都可以使用MAT。输入这个命令启动MAT的GUI:

$ mat-gui

尝试清理一个包含如下内置元数据的实例文档文件(如private.odt)。

 Linux下清除文件中的隐私数据的方法

点击添加按钮来添加需要清理的文件到MAT中。一旦载入文件,点击确认按钮对所有隐藏的元数据信息进行扫描。

 Linux下清除文件中的隐私数据的方法

只要元数据被MAT检测到,State状态就会被标记成Dirty。双击文件可以查看检测到的元数据。

 Linux下清除文件中的隐私数据的方法

点击清理按钮来清除文件中的元数据。MAT会自动清空文件中的所有私有元数据字段。

 Linux下清除文件中的隐私数据的方法

清除后的状态中不包含任何私有可辨识的痕迹:

 Linux下清除文件中的隐私数据的方法

从命令行匿名元数据

$ mat -c 。

正如前面提到的,另一种调用MAT的方式是从命令行,使用mat命令可达到。

为了检查任何敏感的元数据,先前往文件所在的目录,然后运行:

$ mat -c 。

这样会扫描当前目录和其子目录下的所有文件,并报告它们的状态(已清理或未清理)。

 Linux下清除文件中的隐私数据的方法

你可以使用-d选项来查看检测到的真实元数据:

$ mat -d 《input_file》

 Linux下清除文件中的隐私数据的方法

如果不为mat命令提供任何选项,默认操作会移除文件的元数据。如果要在清理的过程中保留原始文件的备份,使用-b选项。下面命令会清除所有文件的元数据,并将原始文件存储为*.bak文件。

$ mat -b 。

 Linux下清除文件中的隐私数据的方法

查看所支持的文件类型,请运行:

$ mat -l

 Linux下清除文件中的隐私数据的方法

故障排除

当前我在Fedora上使用编译版本的MAT遇到了下列问题。当我尝试在Fedora清除归档/文档文件的元数据时(如.gz、.odt、*.docx),MAT因为下列错误失败。

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com)

File /usr/lib64/python2.7/zipfile.py, line 305, in __init__ raise ValueError(‘ZIP does not support timestamps before 1980’)ValueError: ZIP does not support timestamps before 1980

总结

MAT是一款简单但非常好用的工具,用来预防从元数据中无意泄露私人数据。请注意如果有必要,文件内容也需要保护。MAT能做的是消除与文件相关的元数据,但并不会对文件本身进行任何操作。简而言之,MAT是一名救生员,因为它可以处理大多数常见的元数据移除,但不应该只指望它来保证你的隐私。

上面就是清除文件中的隐私数据的介绍了,除了需要定期清除外,还要有良好的保护隐私的系统,只有养成保护隐私的习惯,才不会泄露私人数据。

来源:http://www.tulaoshi.com/n/20160220/1635875.html

延伸阅读
标签: 办公软件
    清除单元格和删除单元格不同。清除单元格只是从工作表中移去了单元格中的内容,单元格本身还留在工作表上;而删除单元格则是将选定的单元格从工作表中除去,同时和被删除单元格相邻的其他单元格做出相应的位置调整。例如,在工作表中清除下面的单元格区域“b2:d4”,之后就会看到如图5-16所示的菜单。在图...
标签: 电脑入门
Linux 下的查找命令有好几个,我比较常用的就 whereis 和 find,这里和大家分享一下。 whereis 其中 whereis 主要用来查找命令文件、源代码和 man 帮助文件,使用也很简单,比如 //查找帮助文件 [wyg@server]# whereis -m php php: /usr/share/man/man1/php.1 //查找二进制文件,除了帮助文件外全列出来了 [wyg@server]# wher...
    ReiserFS是一个非常优秀的文件系统。也是最早用于Linux的日志文件系统之一。 ReiserFS的开发者非常有魄力,整个文件系统完全是从头设计的。目前,ReiserFS可轻松管理上百G的文件系统,这在企业级应用中非常重要。 一、ReiserFS的特点 1.先进的日志机制 ReiserFS有先进的日志(Journaling/logging)功...
标签: windows 操作系统
如果只能使用Windows本身提供的工具,那么我们可以认为清空回收站之后,被删除的文件已经彻底清除了。不过事实并非如此,只要有专用的硬件和软件,即使数据已经被覆盖、驱动器已经重新格式化、引导扇区彻底损坏,或者磁盘驱动器不再运转,我们还是可以恢复几乎所有的文件。 一、磁盘如何保存数据 要理解如何恢复已删除的数据...
标签: 服务器
Linux系统下使用Flacon导入CD音频文件中的歌曲 Linux系统下使用Flacon导入CD音频文件中的歌曲  Flacon 是一款 Qt 工具,用于从音频 CD 中提取个人曲目,基于在CUE文件中提供的信息提取如 WavPack、 APE、 FLAC、 WAV 或 True Audio。 该应用程序提供了输出格式具体设置:你可以设置除 ReplayGain 以外的输出质量,压缩等,无...

经验教程

245

收藏

93
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部