title

date

Base64

from：https://blog.csdn.net/wo541075754/article/details/81734770

Base64的由来

目前Base64已经成为网络上常见的传输8Bit字节代码的编码方式之一。在做支付系统时，系统之间的报文交互都需要使用Base64对明文进行转码，然后再进行签名或加密，之后再进行（或再次Base64）传输。那么，Base64到底起到什么作用呢？

在参数传输的过程中经常遇到的一种情况：使用全英文的没问题，但一旦涉及到中文就会出现乱码情况。与此类似，网络上传输的字符并不全是可打印的字符，比如二进制文件、图片等。Base64的出现就是为了解决此问题，它是基于64个可打印的字符来表示二进制的数据的一种方法。这里的二进制说的是狭义的二进制说句，也就是非文本数据，我们称为二进制数据。

电子邮件刚问世的时候，只能传输英文，但后来随着用户的增加，中文、日文等文字的用户也有需求，但这些字符并不能被服务器或网关有效处理，因此Base64就登场了。随之，Base64在URL、Cookie、网页传输少量二进制文件中也有相应的使用。

Base64的编码原理

Base64的原理比较简单，每当我们使用Base64时都会先定义一个类似这样的数组：

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

上面就是Base64的索引表，字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符，这是标准的Base64协议规定。在日常使用中我们还会看到“=”或“==”号出现在Base64的编码结果中，“=”在此是作为填充字符出现，后面会讲到。

具体转换步骤

第一步，将待转换的字符串每三个字节分为一组，每个字节占8bit，那么共有24个二进制位。
第二步，将上面的24个二进制位每6个一组，共分为4组。
第三步，在每组前面添加两个0，每组由6个变为8个二进制位，总共32个二进制位，即四个字节。
第四步，根据Base64编码对照表（见下图）获得对应的值。

0　A　　17　R　　　34　i　　　51　z

1　B　　18　S　　　35　j　　　52　0

2　C　　19　T　　　36　k　　　53　1

3　D　　20　U　　　37　l　　　54　2

4　E　　21　V　　　38　m　　　55　3

5　F　　22　W　　　39　n　　　56　4

6　G　　23　X　　　40　o　　　57　5

7　H　　24　Y　　　41　p　　　58　6

8　I　　25　Z　　　42　q　　　59　7

9　J　　26　a　　　43　r　　　60　8

10　K　　27　b　　　44　s　　　61　9

11　L　　28　c　　　45　t　　　62　+

12　M　　29　d　　　46　u　　　63　/

13　N　　30　e　　　47　v

14　O　　31　f　　　48　w　　　

15　P　　32　g　　　49　x

16　Q　　33　h　　　50　y

从上面的步骤我们发现：

Base64字符表中的字符原本用6个bit就可以表示，现在前面添加2个0，变为8个bit，会造成一定的浪费。因此，Base64编码之后的文本，要比原文大约三分之一。
为什么使用3个字节一组呢？因为6和8的最小公倍数为24，三个字节正好24个二进制位，每6个bit位一组，恰好能够分为4组。

示例说明

以下图的表格为示例，我们具体分析一下整个过程。

第一步：“M”、“a”、"n"对应的ASCII码值分别为77，97，110，对应的二进制值是01001101、01100001、01101110。如图第二三行所示，由此组成一个24位的二进制字符串。
第二步：如图红色框，将24位每6位二进制位一组分成四组。
第三步：在上面每一组前面补两个0，扩展成32个二进制位，此时变为四个字节：00010011、00010110、00000101、00101110。分别对应的值（Base64编码索引）为：19、22、5、46。
第四步：用上面的值在Base64编码表中进行查找，分别对应：T、W、F、u。因此“Man”Base64编码之后就变为：TWFu。

位数不足情况

上面是按照三个字节来举例说明的，如果字节数不足三个，那么该如何处理？

两个字节：两个字节共16个二进制位，依旧按照规则进行分组。此时总共16个二进制位，每6个一组，则第三组缺少2位，用0补齐，得到三个Base64编码，第四组完全没有数据则用“=”补上。因此，上图中“BC”转换之后为“QKM=”；
一个字节：一个字节共8个二进制位，依旧按照规则进行分组。此时共8个二进制位，每6个一组，则第二组缺少4位，用0补齐，得到两个Base64编码，而后面两组没有对应数据，都用“=”补上。因此，上图中“A”转换之后为“QQ==”；

注意事项

大多数编码都是由字符串转化成二进制的过程，而Base64的编码则是从二进制转换为字符串。与常规恰恰相反，
Base64编码主要用在传输、存储、表示二进制领域，不能算得上加密，只是无法直接看到明文。也可以通过打乱Base64编码来进行加密。
中文有多种编码（比如：utf-8、gb2312、gbk等），不同编码对应Base64编码结果都不一样。
举一个中文的例子，汉字“严”（UTF-8编码的）如何转化成Base64编码？

　　首先，“严”的utf-8编码为E4B8A5，写成二进制就是三字节的“11100100 10111000 10100101”。将这个24位的二进制字符串，按照第3节中的规则，转换成四组一共32位的二进制值“00111001 00001011 00100010 00100101”，相应的十进制数为57、11、34、37，它们对应的Base64值就为5、L、i、l。

　　所以，汉字“严”（utf-8编码）的Base64值就是5Lil。

再举例：”严”的GBK（GB2312）编码为：D1CF。写成二进制是：11010001 11001111。

然后，6个一组划分， 00110100 00011100 00111100 第四组没有了，补=。

52 28 60

0 c 8 =

所以”严”的GBK进行Base64编码，转完是0c8=

查看汉字的UTF-8编码，参考：http://www.mytju.com/classcode/tools/encode_utf8.asp

http://www.mytju.com/classcode/tools/base64.asp

延伸

上面我们已经看到了Base64就是用6位（2的6次幂就是64）表示字符，因此成为Base64。同理，Base32就是用5位，Base16就是用4位。大家可以按照上面的步骤进行演化一下。

Java 验证

最后，我们用一段Java代码来验证一下上面的转换结果：

package com.secbro2.blog.utils;

import sun.misc.BASE64Encoder;

/**
 * @author zzs
 */
public class Base64Utils {

	public static void main(String[] args) {
		String man = "Man";
		String a = "A";
		String bc = "BC";

		BASE64Encoder encoder = new BASE64Encoder();
		System.out.println("Man base64结果为：" + encoder.encode(man.getBytes()));
		System.out.println("BC base64结果为：" + encoder.encode(bc.getBytes()));
		System.out.println("A base64结果为：" + encoder.encode(a.getBytes()));
	}
}

打印结果为：

Man base64结果为：TWFu
BC base64结果为：QkM=
A base64结果为：QQ==

以上结果与我们分析所得完全一致。

Base64对图片进行编码

package cc.ewell.mobile.workstation.mqsdktransmittool;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.util.Base64;

/**
 * @Description:
 * @Author: fan
 * @Date: 2020-09-29 15:38
 * @Modify:
 */
public class Base64Test {

    public static void main(String[] args) throws Exception {

        FileInputStream pngInputStream = null;
        FileOutputStream base64OutputStream = null;


        FileInputStream base64InputStream = null;
        FileOutputStream newPngOutputSteam = null;
        try {

            String filepath = "/Volumes/Mechanical/F/mobile-team/XinHuaMDT/ic_launcher.png";
            File file = new File(filepath);

            pngInputStream = new FileInputStream(file);

            System.out.println("file length:" + file.length());
            System.out.println("fileInputStream available:" + pngInputStream.available());

            // 把png图片的数据读到这个数组中
            byte[] pngBytes = new byte[pngInputStream.available()];


            int read = pngInputStream.read(pngBytes);

            if (read == file.length()) {
                System.out.println("读取完成");
            } else {
                System.out.println("读取error");
                return;
            }

            // 对二进制数据进行Base64编码,编码后的数据存储在encodeBytes
            byte[] encodeBytes = Base64.getEncoder().encode(pngBytes);

            File base64File = new File("/Volumes/Mechanical/F/mobile-team/XinHuaMDT/base64.txt");
            if (!base64File.exists()) {
                base64File.createNewFile();
            }

            // 将编码后的数据写入base64.txt
            base64OutputStream = new FileOutputStream(base64File);
            base64OutputStream.write(encodeBytes);
            base64OutputStream.flush();


            // 最后再把base64.txt里的内容读取出来, 解码, 存储成为一张新的图片
            base64InputStream = new FileInputStream(base64File);

            byte[] b = new byte[base64InputStream.available()];
            int read1 = base64InputStream.read(b);


            if (read1 == base64File.length()) {
                System.out.println("读取完成2");
            } else {
                System.out.println("读取error2");
                return;
            }

            byte[] decodeBytes = Base64.getDecoder().decode(b);

            newPngOutputSteam = new FileOutputStream(new File("/Volumes/Mechanical/F/mobile-team/XinHuaMDT/new.png"));
            newPngOutputSteam.write(decodeBytes);
            newPngOutputSteam.flush();


        } finally {
            if (pngInputStream != null) {
                pngInputStream.close();
            }
            if (base64OutputStream != null) {
                base64OutputStream.close();
            }
            if (base64InputStream != null) {
                base64InputStream.close();
            }
            if (newPngOutputSteam != null) {
                newPngOutputSteam.close();
            }
        }
    }
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

9.Base64.md

9.Base64.md

Base64

Base64的由来

Base64的编码原理

具体转换步骤

示例说明

位数不足情况

注意事项

延伸

Java 验证

Files

9.Base64.md

Latest commit

History

9.Base64.md

File metadata and controls

Base64

Base64的由来

Base64的编码原理

具体转换步骤

示例说明

位数不足情况

注意事项

延伸

Java 验证