Python 程序比较两文件夹差异并读取出来

        在客户那边建库，需要把几百个G几十万个文件导入到Oracle里，好不容易导完了才发现中间缺了好几大块数据，约有四分之一吧，郁闷得很。 
        数据是客户从第三方买的，据客户分析是拷贝过来的时候有部分数据漏掉了，但漏掉的数据又没有什么规律，加之文件夹的嵌套层数很多，查找起来很困难。
        客户又从第三方那边拷了一份全的数据，现在对这个问题有两种处理方案，一种是全部重新导一遍，大约得花一周多的时间；另一种方案是把两个数据的差异找出来，把差异的部分追加进去就行了。
        项目的时间比较紧张了，只能选第二种方案，可如何把差异的数据找出来呢，试了几个文件夹比较的工具，处理几百兆的数据都吃力，更不必说这么大量的数据和文件了。
        后来想了想，觉得Python解决这个问题比较方便，就研究了一下Python里的文件和目录操作，很快就完成了下面的一个脚本，可以很好地解决这个问题。
        下面的脚本可以在Python24里很好地运行，在其他版本里没有测试，但用的都是基本功能，应该没有什么问题。
        代码里的PathA是全的数据的文件夹，PathB是不全的数据的文件夹，PathC是个新的空目录，脚本执行完后就把PathA中有且pathB中没有的文件和目录都写到PathC里了，还可以保持原来的目录结构，速度和正确性都很令人满意。
        因为是急用的代码，所以写得不很简洁，也不是很规范，在此留志，一方面供自己以后参考，另一方面也提供给需要使用Python进行文件和目录操作的兄弟们共同参考。
代码如下：




# coding: GB2312

#系统模块
import sys
import os
import shutil
#用于文件查找的模块
from os.path import walk, join, normpath 

#这个是完整的文件夹
PathA = "F:\FullData\"
#这个是缺文件的文件夹
PathB = "F:\IncomplData\"

#这个是目标文件夹
PathC = "F:\DiffData\"

#============================================================
#这个函数是用来递归处理PathA，对PathA里的每个文件和文件夹在PathB中找是否有对应的文件或文件夹
#若找不到，则在PathC中创建目录并拷贝文件
#拷贝文件时使用了shutil模块的copy2函数，以保留文件原来的创建时间和最后更新时间
def visit(arg, dirname, names):
    #把目录打印出来，以监视进度
    print dirname
   
    #得到路径名后，把前面的主路径名去掉
    dir=dirname.replace(PathA,"")
   
    dirnameB = os.path.join(PathB,dir)
    dirnameC = os.path.join(PathC,dir)
   
    if os.path.isdir(dirnameB):
        #若PathB里存在对应的文件夹，再逐个文件判断是否存在
        for file in names:
            if os.path.isfile(os.path.join(dirname
补充：Web开发 , Python ,
上一个：Python调用C程序的2种方法代码讲解
下一个：python之uuid模块详解
更多图片编程知识:
使用Python读取和写入CSV文件

Python调用小黄鸡simsimi

python+pygtk+api写的一个简单的词典

Python中的Datetime

Python线程指南

编程语言之争——PHP vs. RUBY vs. PYTHON

  
更多python疑问解答：
python 把图片转换成base64代码 python 把base64代码转换成图片
利用python进行网络图片下载 python批量下载远程图片
记录Python读写文件的代码和方法
Python如何把图片转为Base64字符串
python用requests.get批量下载网络远程图片的代码
疑难杂症，关于python与C#输出重定向
最近写的一个软件，对照下c#,c++,DELPHI,VB,易语言,PYTHON,PHP等执行效率
利用C#4.0调用IronPython脚本
bat 执行定时python 打开url 谁搞过，帮忙看一下语句有什么问题
求助！在线等！python调用C#的.dll库
Python 快速界面开发？求IDE和资料..中文的最好
python如何读取XML文件中的
.NET运行IronPython脚本错误
新手之前对编程无概念现在想转这行，想尽快入门，java ，python，.net、php、C之间如
新手之前对编程无概念现在想转这行，想尽快入门，java ，python，.net、php、C之间如


  
    站长资源库
    	

      
    asp
php
Delphi
Matlab
JSP
Foxpro
JS
C/C++
C#/ASP.NET
VC++
JAVA
VB
汇编语言
html/css
CGI
XML/UML
wap
网站相关
网页素材
python
微信小程序
thinkphp
如果你遇到编程学习难题：
访问www.zzzyk.com 试试
  
  
  



  


CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络，