Java中获取文件大小的正确方法

本文出处:http://blog.csdn.net/chaijunkun/article/details/22387305,转载请注明。因为本人不按期会整理相关博文,会对相应内容做出完善。所以强烈建议在原始出处查看此文。java


今天写代码时须要实现获取文件大小的功能,目前有两种实现方法,一种是使用File的length()方法;另一种是使用FileInputStream的available()方法,当InputStream未进行read操做时,available()的大小应该是等于文件大小的。可是在处理大文件时,后者会发生问题。咱们来看一下:dom


在例子中,我使用了CentOS 6.5 的安装镜像文件,主要是考虑到这个文件足够大(大于2GB)。工具


1.使用File的length()方法spa

public static void main(String[] args) {
	File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
	if (f.exists() && f.isFile()){
		logger.info(f.length());
	}else{
		logger.info("file doesn't exist or is not a file");
	}
}
咱们看一下输出结果:

4467982336

结果是4.16GB,与Windows上显示的结果一致。.net


接下来咱们看一下经过FileInputStream来获取的文件大小:code

public static void main(String[] args) {
	FileInputStream fis= null;
	try{
		File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
		fis= new FileInputStream(f);
		logger.info(fis.available());
	}catch(Exception e){
		logger.error(e);
	} finally{
		if (null!=fis){
			try {
				fis.close();
			} catch (IOException e) {
				logger.error(e);
			}
		}
	}
}
下面是运行结果:

2147483647
这个结果是否是很眼熟?它是Integer.MAX_VALUE,也就是有符号整型能表示的最大数值。

那么换算成熟悉的单位,这种方式获取的文件大小是多大呢?blog

约等于2GB,这显然不是正确的结果。


究其缘由,File的length()方法返回的类型为long,long型能表示的正数最大值为:9223372036854775807,折算成最大能支持的文件大小为:8954730132868714 EB字节,这个量级将在人类IT发展史上受用不少不少年,而FileInputStream的avaliable()方法返回值是int,在以前也介绍了最大的表示范围,所能支持的最大文件大小为:1.99GB,而这个量级咱们如今很容易就达到了。get


2014年3月31日补充:io

针对流式方法读取大文件大小也不是不可行,只是不能再使用传统的java.io.*下的包了,这里要用到java.nio.*下的新工具——FileChannel。下面咱们来看下示例代码:class

public static void main(String[] args) {
	FileChannel fc= null;
	try {
		File f= new File("D:\\CentOS-6.5-x86_64-bin-DVD1.iso");
		if (f.exists() && f.isFile()){
			fc= new RandomAccessFile(f, "r").getChannel();
			logger.info(fc.size());
		}else{
			logger.info("file doesn't exist or is not a file");
		}
	} catch (FileNotFoundException e) {
		logger.error(e);
	} catch (IOException e) {
		logger.error(e);
	} finally {
		if (null!=fc)){
			try{
				fc.close();
			}catch(IOException e){
				logger.error(e);
			}
		} 
	}
}

使用FileChannel后获得的结果与第一种状况吻合,准确地描述了文件的准确大小。


这里也一样提醒各位技术同仁,涉及到大文件读取的时候,对int类型的数据必定要留个心,以避免出现隐藏的bug,定位起来很困难。