百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

小姐姐太多,硬盘不够用?2招搞定NAS视频、文件去重

liuian 2025-07-23 16:08 6 浏览

大家好,这里是Cherry,喜爱折腾、玩数码,热衷于分享数码玩耍经验~

前言

在很多人的NAS里,都有保存大量的文件资料,有些是来源PC电脑的备份,有些是来源手机备份,有些是来源网盘备份,有些则是手动上传。

这些文件或相同、或不同,反正大多数NAS用户都不会去整理,而是让它们就这样静静的躺在那儿,占用着昂贵的硬盘空间

其实不仅是重复问题,还有管理不到位导致的文件多版本也很让人头痛,要找一个文件就需要从X.doc,X(1).doc,X(2).doc,X(3).doc,X(4).doc里找到谁是爸爸,谁是儿子。

下面,我们通过两种方法,来解决NAS里海量文件的重复问题,第一种是所有NAS通用的windows侧操作,第二种是铁威马特有的Deduplication Manager去重工具!

一、通过挂载到Windows去重

1、通过文件服务挂载

对NAS来说,比较通用的方法就是通过SMB/WedDav等方法,将文件夹挂载到windows侧,然后通过windows侧的各种去重软件进行去重。

SMB服务

最常用的挂载方法,windows下在文件管理器输入//ip就可以实现挂载,macos下输入smb://ip来实现挂载。如果NAS使用双网络,可以使用聚合SMB挂载,突破单根网线速率。

WebDav服务

WebDav是一种基于Web的分布式编写和版本控制的超文本传输协议 (HTTP)的扩展,核心是HTTP协议,主要在互联网端提供网络传输服务。PC电脑一般需要通过webdav客户端访问到nas服务上,windows下常用的是Raidrive这个软件,有免费版。

铁威马目前支持SMB\FTP\NFS\WebDav\Rsync等文件服务。

Webdav的话,推荐使用RaiDrive这款支持免费使用的软件挂载,操作方便快捷。

2、使用CZKAWKA去重

在Window侧,比较常用的去重软件有Czkawka、Dupeguru、Krokiet等,我习惯使用的是Czkawka,支持各种类型的文件筛选去重,及硬链接功能。

铁威马的SMB速度很快,机械盘在2.5Gbps网口加持下基本能跑满260Mb/s的读写速度,所有对数千张照片进行复杂算法也不会很慢。

等扫描完毕以后,我们可以根据文件时间、大小、尺寸进行手动或自动去重;也支持通过软链接/硬链接等方式,在保持文件结构不变的情况下减少硬盘占用。

二、更稳妥的官方去重软件

除了挂载到windows外,我们也可以通过NAS自带的去重软件进行操作。比如铁威马就提供了一套简单易用的可视化去重方案——Deduplication Manager

Deduplication Manager支持以存储卷为单位进行去重,会对同一个卷下的所有文件夹进行对比。

在扫描规则上,除了配置删除空文件、限制检查文件大小外,还支持三种不同的文件校验方法。其中md5最快、最笼统;sha1居中;sha256最慢、最准确。

三种校验算法的原理和适用场景:

MD5128位哈希值生成快,但存在碰撞漏洞(不同文件可能生成相同结果),适合非关键场景(如临时文件对比、简单去重),效率优先时可选。

SHA1160位哈希值,曾广泛用于软件/文件校验(如Git版本追踪),已被证明存在碰撞风险,现多用于兼容旧系统或对安全性要求不高的重复文件筛查。

SHA256256位哈希抗碰撞性极强,几乎可视为唯一文件指纹,资源消耗较高但可靠性最佳,适用于高精度文件比对(如数据库去重、科研数据校验),确保“同一文件”判定无争议。

任务完成以后,扫描结果会展示去重文件数、节省空间数据,方便用户理解去重的成果。

对于扫描结果,也支持自动去重和手动去重,一般来说手动自由度会更高一点。可以针对性的选择单独的文件删除。

总结

根据上述两种方案,我们就可以对NAS里各式各样的重复文件就可以say goodbye了。而且不仅仅于文件,其它如视频、图片、其它格式文件等资料也可以进行校验去重。

值得一提的是,如果使用硬链接保留了文件结构的,我们在NAS里看到的磁盘空间是不会减少的,大家不用担心去重失败。

具体的,可以使用ls -il来查看列表里的文件id,如果有两个文件id是一样的,那就说明他们互为硬链接哦~~

相关推荐

基于Spring Security的JWT认证深度解析与实践指南

一、JWT认证核心原理剖析1.JWT令牌结构解析Header:采用HMACSHA256算法示例json{"alg":"HS256","typ&...

入门到精通:电商API的全栈开发指南

在当今电商蓬勃发展的时代,API(应用程序编程接口)作为系统间的“桥梁”,已成为构建高效、可扩展电商平台的核心。全栈开发涉及从前端用户界面到后端服务器、数据库的完整流程,本指南将带你从零基础逐步掌握电...

SpringBoot整合SpringSecurity+JWT

作者|Sans_https://juejin.im/post/5da82f066fb9a04e2a73daec一.说明SpringSecurity是一个用于Java企业级应用程序的安全框架,主要包含...

Spring Boot 集成 JWT 详细指南(springboot集成junit)

SpringBoot集成JWT详细指南在当今的Web应用开发中,安全认证是至关重要的一环。JSONWebToken(JWT)作为一种轻量级的认证和授权机制,因其跨域支持、自包含性以及易...

电商API安全最佳实践:保护用户数据免受攻击

在电商领域,API(应用程序编程接口)是连接用户、商家和支付系统的核心枢纽。它们处理敏感数据,如用户个人信息、支付详情和交易记录。然而,API也常成为黑客攻击的目标,导致数据泄露、欺诈和声誉损失。本文...

Egg.js 异常处理、中间件、jwt,实现接口权限控制

一、自定义异常、异常处理中间件在程序执行时会有各种各样的异常情况,当异常出现我们能从控制台看出异常的原因,但是对前端来说不够人性化,不能够清晰,有些情况要给调用端返回友好的消息提示,利用自定义异常和全...

list列表基本操作(list list)

【实验目的】1、掌握list列表的基本操作【实验原理】列表是Python中最基本的数据结构,列表是最常用的Python数据类型,列表的数据项不需要具有相同的类型。列表中的每个元素都分配一个数字-它...

基于Python的多人拼图游戏(python项目拼图游戏)

开发环境要求本系统的软件开发及运行环境具体如下。操作系统:Windows7、Windows10。Python版本:Python3.7.0。开发工具:PyCharm。运行方法在项目文件中找到mai...

python开发工具PyCharm最新版本新增功能介绍

PyCharmV2022.1支持自定义包存储库的身份验证、改进的TypedDict和Docker的新服务UI。PyCharm官方最新版免费下载试用,历史版本下载,在线文档和帮助文件下载-慧都网...

走马观花看PySide6(官方examples)

准备工作1、安装PythonPython下载地址:https://www.python.org/downloads/2、安装PyCharmPyCharm下载地址:https://www.jetbrai...

【0基础学爬虫】爬虫基础之scrapy的使用

【0基础学爬虫】爬虫基础之scrapy的使用大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章...

手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace

这期教向大家介绍仅仅1.3M的轻量级高精度的关键点人脸检测模型DBFace,并手把手教你如何在自己的电脑端进行部署和测试运行,运行时bug解决。01.前言前段时间DBFace人脸检测库横空出世,...

Scrapy框架的安装(scrapy框架图)

Win+R输入cmd打开命令行我们先把pip升级到最新版,输入代码如下:pipinstall--upgradepip不过一般这种更新方式会经常性出错,安装文件在下载到一半时就会超时报错可以试试...

Pycharm设置本地Python项目解释器

设置Pycharm项目运行的python环境,由于不同的项目使用的python环境是不一样的,需要根据项目配置不同的python环境,比如在电脑上面安装了Python3.11.x和3.9.x两个环境,...

Python支付宝单笔转账接口(python支付宝自动转账)

开发信息接口加签方式为证书模式证书模式好处是可以使用支付宝的转账到支付宝账户,也就是提现功能,公钥模式不能实现转账到支付宝账户。此DEMO利用单笔转账到支付宝账户接口【提现功能】用户可以通过此DEMO...