`
v5qqbrowser
  • 浏览: 356985 次
文章分类
社区版块
存档分类
最新评论

android/java 计算大文件的sha1值

 
阅读更多

最近做android的一个小工具,其中一个功能要计算一个apk的sha1值。但是遇到大的文件就会报错。遇到任何问题,首先要发现问题,然后分析问题,最后解决问题。

  1. 发现问题

我调试了一下程序,发现问题出现在下面的代码里如下:

                            File file=new File(path);
			long length=file.length();
	                  DataInputStream in;
			in = new DataInputStream(new FileInputStream(path));
			byte[] buf = new byte[(int) length];   


当我要计算一个大小为50M的apk包时,我的程序直接就报错了,内存溢出。

byte[] buf = new byte[(int) length];   

这行代码,导致内存溢出,一次直接申请50M的内存,导致程序崩溃。

2. 分析问题

当我们发现了问题,通过分析问题,找到了原因。不能一次根据文件大小而申请内存空间,因为判断一下,如果是大文件,我们应该分割成小文件进行对应操作。

3. 解决问题

通过分析问题,我们找到解决问题的大概思路。将大文件分割成小文件进行处理。这个比较容易。代码如下:

               File file=new File(path);
	      FileInputStream in = new FileInputStream(file);
	     MessageDigest messagedigest;
		try {
			messagedigest = MessageDigest.getInstance("SHA-1");
		
	     byte[] buffer = new byte[1024 * 1024 * 10];
	     int len = 0;
	     
	     while ((len = in.read(buffer)) >0) {
	    //该对象通过使用 update()方法处理数据
	      messagedigest.update(buffer, 0, len);
	     }

首先,buffer申请10M大小的空间,调用函数in.read(buffer),每次读取10M的内容赋给buffer,然后通过调用MessageDigest.update进行对应操作(MessageDigest后续介绍)。通过这个方法,把内存溢出解决了。

但是,我遇到一个新的问题。在java,android里面,计算SHA1或者MD5值的时候,不用像C那样按照原理进行操作,sdk里面已经有封装好的类,可以直接调用。这个类就是MessageDigest。计算sha1的时候,都是将整个文件的内容,进行MessageDigest.update,我的理解update就是提交数据。然后调用MessageDigest.digest()进行计算就可以了。之前对MessageDigest不了解,以为我每次messagedigest.update(buffer, 0, len),旧的数据会被新数据覆盖。

通过调研,发现事实不是这样的。

MessageDigest.update()你调用多次,它会将这些数据合并一起,不会覆盖。当你调用digest方法,则说明输入消息结束。进行初始化,update提交的数据丢失。

举了个例子。

//现在有i1、i2和i3,分别是3个字节数组,构成一个消息,计算其散列函数值:
MessageDigest sha1 = MessageDigest.getInstance(“sha-1”);
sha1.Update(i1);
sha1.Update(i2);
sha1.Update(i3);
byte[] hash = sha1.digest();

咱们这样计算出的是这i1,i2,i3组成的字节数组的sha1值,而不是i3值。在一些散列函数实现中,可以通过复制(clone)来获得中间散列数值。如下所示:

//要分别计算:i1,i1和i2,i1、i2和i3的散列数值。
//计算i1 hash
sha1.update(i1);
byte[] i1Hash = sha1.clone().digest();
//计算i1和i2 hash
sha1.update(i2);
byte[] i12Hash = sha1.clone().digest();
//计算i1、i2和i3 hash
sha1.update(i3);
byte[] i123Hash = sha1.digest();

这样,把计算大文件sha1值,内存溢出的问题就解决了。这也让我明白,以后遇到文件方面操作的时候,尽量别一次性读取。

下面贴出计算sha1值的代码,供大家参考。

  /**
	  * 适用于上G大的文件
	  */
	  public static String getFileSha1(String path) throws OutOfMemoryError,IOException {
		  File file=new File(path);
	      FileInputStream in = new FileInputStream(file);
	     MessageDigest messagedigest;
		try {
			messagedigest = MessageDigest.getInstance("SHA-1");
		
	     byte[] buffer = new byte[1024 * 1024 * 10];
	     int len = 0;
	     
	     while ((len = in.read(buffer)) >0) {
	    //该对象通过使用 update()方法处理数据
	      messagedigest.update(buffer, 0, len);
	     }
	    
	   //对于给定数量的更新数据,digest 方法只能被调用一次。在调用 digest 之后,MessageDigest 对象被重新设置成其初始状态。
	     return byte2hex(messagedigest.digest());
		}   catch (NoSuchAlgorithmException e) {
			NQLog.e("getFileSha1->NoSuchAlgorithmException###", e.toString());
				e.printStackTrace();
			}
		catch (OutOfMemoryError e) {
			
			NQLog.e("getFileSha1->OutOfMemoryError###", e.toString());
				e.printStackTrace();
				throw e;
			}
		finally{
			 in.close();
		}
	     return null;
	  }






分享到:
评论

相关推荐

    JAVA上百实例源码以及开源项目

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

    JAVA上百实例源码以及开源项目源代码

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

    java开源包1

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包11

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包6

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包4

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包9

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包101

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包5

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包8

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包10

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包3

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包2

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    java开源包7

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    Java资源包01

    用来计算 MD5、SHA 哈希算法的 Java 类库,支持 "MD5", "SHA", "SHA-1", "SHA-256", "SHA-384", "SHA-512". 高性能RPC框架 nfs-rpc nfs-rpc是一个集成了各种知名通信框架的高性能RPC框架,目前其最好的性能为在采用...

    Swatch-Movies-OMDb:使用Async Task为Android构建的电影查询应用

    SWATCH Swatch是一个电影查询应用程序,它基于搜索的电影显示信息。 入门 这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。...此项目已获得MIT许可证的许可-有关详细信息,请参阅文件

Global site tag (gtag.js) - Google Analytics