正文

java中的5个代码性能提升技巧，最高提升近10倍(代码片段)

程序猿阿朗  程序猿阿朗  2022-12-04  402

关键词：

文章持续更新，可以关注公众号程序猿阿朗或访问未读代码博客。
本文 Github.com/niumoo/JavaNotes 已经收录,欢迎Star。

这篇文章介绍几个 Java 开发中可以进行性能优化的小技巧，虽然大多数情况下极致优化代码是没有必要的，但是作为一名技术开发者，我们还是想追求代码的更小、更快，更强。如果哪天你发现程序的运行速度不尽人意，可能会想到这篇文章。

提示：我们不应该为了优化而优化，这有时会增加代码的复杂度。

这篇文章中的代码都在以下环境中进行性能测试。

JMH version: 1.33（Java 基准测试框架）
VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

通过这篇文章的测试，将发现以下几个操作的性能差异。

预先分配 HashMap 的大小，提高 1/4 的性能。
优化 HashMap 的 key，性能相差 9.5 倍。
不使用 Enum.values() 遍历，Spring 也曾如此优化。
使用 Enum 代替 String 常量，性能高出 1.5 倍。
使用高版本 JDK，基础操作有 2-5 倍性能差异。

当前文章属于Java 性能分析优化系列文章，点击可以查看所有文章。

当前文章中的测试使用 JMH 基准测试，相关文章：使用JMH进行Java代码性能测试。

预先分配 HashMap 的大小

HashMap 是 Java 中最为常用的集合之一，大多数的操作速度都非常快，但是 HashMap 在调整自身的容量大小时是很慢且难以自动优化，因此我们在定义一个 HashMap 之前，应该尽可能的给出它的容量大小。给出 size 值时要考虑负载因子，HashMap 默认负载因子是 0.75，也就是要设置的 size 值要除于 0.75。

相关文章：HashMap 源码分析解读

下面使用 JMH 进行基准测试，测试分别向初始容量为 16 和 32 的 HashMap 中插入 14 个元素的效率。

/**
 * @author https://www.wdbyte.com
 */
@State(Scope.Benchmark)
@Warmup(iterations = 3,time = 3)
@Measurement(iterations = 5,time = 3)
public class HashMapSize 

    @Param("14")
    int keys;

    @Param("16", "32")
    int size;

    @Benchmark
    public HashMap<Integer, Integer> getHashMap() 
        HashMap<Integer, Integer> map = new HashMap<>(size);
        for (int i = 0; i < keys; i++) 
            map.put(i, i);
        
        return map;

HashMap 的初始容量是 16，负责因子 0.75，即最多插入 12 个元素，再插入时就要进行扩容，所以插入 14 个元素过程中需要扩容一次，但是如果 HashMap 初始化时就给了 32 容量，那么最多可以承载 32 * 0.75 = 24 个元素，所以插入 14 个元素时是不需要扩容操作的。

# JMH version: 1.33
# VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

Benchmark               (keys)  (size)   Mode  Cnt        Score        Error  Units
HashMapSize.getHashMap      14      16  thrpt   25  4825825.152 ± 323910.557  ops/s
HashMapSize.getHashMap      14      32  thrpt   25  6556184.664 ± 711657.679  ops/s

可以看到在这次测试中，初始容量为32 的 HashMap 比初始容量为 16 的 HashMap 每秒可以多操作 26% 次，已经有 1/4 的性能差异了。

优化 HashMap 的 key

如果 HashMap 的 key 值需要用到多个 String 字符串时，把字符串作为某个类属性，然后使用这个类的实例作为 key 会比使用字符串拼接效率更高。

下面测试使用两个字符串拼接作为 key，和把两个字符串作为 MutablePair 类的属性引用，然后使用 MutablePair 对象作为 key 的运行效率差异。

/**
 * @author https://www.wdbyte.com
 */
@State(Scope.Benchmark)
@Warmup(iterations = 3, time = 3)
@Measurement(iterations = 5, time = 3)
public class HashMapKey 

    private int size = 1024;
    private Map<String, Object> stringMap;
    private Map<Pair, Object> pairMap;
    private String[] prefixes;
    private String[] suffixes;

    @Setup(Level.Trial)
    public void setup() 
        prefixes = new String[size];
        suffixes = new String[size];
        stringMap = new HashMap<>();
        pairMap = new HashMap<>();
        for (int i = 0; i < size; ++i) 
            prefixes[i] = UUID.randomUUID().toString();
            suffixes[i] = UUID.randomUUID().toString();
            stringMap.put(prefixes[i] + ";" + suffixes[i], i);
            // use new String to avoid reference equality speeding up the equals calls
            pairMap.put(new MutablePair(prefixes[i], suffixes[i]), i);
        
    

    @Benchmark
    @OperationsPerInvocation(1024)
    public void stringKey(Blackhole bh) 
        for (int i = 0; i < prefixes.length; i++) 
            bh.consume(stringMap.get(prefixes[i] + ";" + suffixes[i]));
        
    

    @Benchmark
    @OperationsPerInvocation(1024)
    public void pairMap(Blackhole bh) 
        for (int i = 0; i < prefixes.length; i++) 
            bh.consume(pairMap.get(new MutablePair(prefixes[i], suffixes[i])));

测试结果：

# JMH version: 1.33
# VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

Benchmark              Mode  Cnt         Score         Error  Units
HashMapKey.pairMap    thrpt   25  89295035.436 ± 6498403.173  ops/s
HashMapKey.stringKey  thrpt   25   9410641.728 ±  389850.653  ops/s

可以发现使用对象引用作为 key 的性能，是使用 String 拼接作为 key 的性能的 9.5 倍。

不使用 Enum.values() 遍历

我们通常会使用 Enum.values() 进行枚举类遍历，但是这样每次调用都会分配枚举类值数量大小的数组用于操作，这里完全可以缓存起来，以减少每次内存分配的时间和空间消耗。

/**
 * 枚举类遍历测试
 *
 * @author https://www.wdbyte.com
 */
@State(Scope.Benchmark)
@Warmup(iterations = 3, time = 3)
@Measurement(iterations = 5, time = 3)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.MILLISECONDS)
public class EnumIteration 
    enum FourteenEnum 
        a,b,c,d,e,f,g,h,i,j,k,l,m,n;

        static final FourteenEnum[] VALUES;
        static 
            VALUES = values();
        
    

    @Benchmark
    public void valuesEnum(Blackhole bh) 
        for (FourteenEnum value : FourteenEnum.values()) 
            bh.consume(value.ordinal());
        
    

    @Benchmark
    public void enumSetEnum(Blackhole bh) 
        for (FourteenEnum value : EnumSet.allOf(FourteenEnum.class)) 
            bh.consume(value.ordinal());
        
    

    @Benchmark
    public void cacheEnums(Blackhole bh) 
        for (FourteenEnum value : FourteenEnum.VALUES) 
            bh.consume(value.ordinal());

运行结果

# JMH version: 1.33
# VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

Benchmark                   Mode  Cnt         Score         Error  Units
EnumIteration.cacheEnums   thrpt   25  15623401.567 ± 2274962.772  ops/s
EnumIteration.enumSetEnum  thrpt   25   8597188.662 ±  610632.249  ops/s
EnumIteration.valuesEnum   thrpt   25  14713941.570 ±  728955.826  ops/s

很明显使用缓存后的遍历速度是最快的，使用 EnumSet 遍历效率是最低的，这很好理解，数组的遍历效率是大于哈希表的。

可能你会觉得这里使用 values() 缓存和直接使用 Enum.values() 的效率差异很小，其实在某些调用频率很高的场景下是有很大区别的，在 Spring 框架中，曾使用 Enum.values() 这种方式在每次响应时遍历 HTTP 状态码枚举类，这在请求量大时造成了不必要的性能开销，后来进行了 values() 缓存优化。

下面是这次提交的截图：

使用 Enum 代替 String 常量

使用 Enum 枚举类代替 String 常量有明显的好处，枚举类强制验证，不会出错，同时使用枚举类的效率也更高。即使作为 Map 的 key 值来看，虽然 HashMap 的速度已经很快了，但是使用 EnumMap 的速度可以更快。

提示：不要为了优化而优化，这会增加代码的复杂度。

下面测试使用使用 Enum 作为 key，和使用 String 作为 key，在 map.get 操作下的性能差异。

/**
 * @author https://www.wdbyte.com
 */
@State(Scope.Benchmark)
@Warmup(iterations = 3, time = 3)
@Measurement(iterations = 5, time = 3)
public class EnumMapBenchmark 

    enum AnEnum 
        a, b, c, d, e, f, g,
        h, i, j, k, l, m, n,
        o, p, q,    r, s, t,
        u, v, w,    x, y, z;
    

    /** 要查找的 key 的数量 */
    private static int size = 10000;
    /** 随机数种子 */
    private static int seed = 99;

    @State(Scope.Benchmark)
    public static class EnumMapState 
        private EnumMap<AnEnum, String> map;
        private AnEnum[] values;

        @Setup(Level.Trial)
        public void setup() 
            map = new EnumMap<>(AnEnum.class);
            values = new AnEnum[size];
            AnEnum[] enumValues = AnEnum.values();
            SplittableRandom random = new SplittableRandom(seed);
            for (int i = 0; i < size; i++) 
                int nextInt = random.nextInt(0, Integer.MAX_VALUE);
                values[i] = enumValues[nextInt % enumValues.length];
            
            for (AnEnum value : enumValues) 
                map.put(value, UUID.randomUUID().toString());
            
        
    

    @State(Scope.Benchmark)
    public static class HashMapState
        private HashMap<String, String> map;
        private String[] values;

        @Setup(Level.Trial)
        public void setup() 
            map = new HashMap<>();
            values = new String[size];
            AnEnum[] enumValues = AnEnum.values();
            int pos = 0;
            SplittableRandom random = new SplittableRandom(seed);
            for (int i = 0; i < size; i++) 
                int nextInt = random.nextInt(0, Integer.MAX_VALUE);
                values[i] = enumValues[nextInt % enumValues.length].toString();
            
            for (AnEnum value : enumValues) 
                map.put(value.toString(), UUID.randomUUID().toString());
            
        
    

    @Benchmark
    public void enumMap(EnumMapState state, Blackhole bh) 
        for (AnEnum value : state.values) 
            bh.consume(state.map.get(value));
        
    

    @Benchmark
    public void hashMap(HashMapState state, Blackhole bh) 
        for (String value : state.values) 
            bh.consume(state.map.get(value));

运行结果:

# JMH version: 1.33
# VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

Benchmark                  Mode  Cnt      Score      Error  Units
EnumMapBenchmark.enumMap  thrpt   25  22159.232 ± 1268.800  ops/s
EnumMapBenchmark.hashMap  thrpt   25  14528.555 ± 1323.610  ops/s

很明显，使用 Enum 作为 key 的性能比使用 String 作为 key 的性能高出 1.5 倍。但是仍然要根据实际情况考虑是否使用 EnumMap 和 EnumSet。

使用高版本 JDK

String 类应该是 Java 中使用频率最高的类了，但是 Java 8 中的 String 实现相比高版本 JDK ，则占用空间更多，性能更低。

下面测试 String 转 bytes 和 bytes 转 String 在 Java 8 以及 Java 11 中的性能开销。

/**
 * @author https://www.wdbyte.com
 * @date 2021/12/23
 */
@State(Scope.Benchmark)
@Warmup(iterations = 3, time = 3)
@Measurement(iterations = 5, time = 3)
public class StringInJdk 

    @Param("10000")
    private int size;
    private String[] stringArray;
    private List<byte[]> byteList;

    @Setup(Level.Trial)
    public void setup() 
        byteList = new ArrayList<>(size);
        stringArray = new String[size];
        for (int i = 0; i < size; i++) 
            String uuid = UUID.randomUUID().toString();
            stringArray[i] = uuid;
            byteList.add(uuid.getBytes(StandardCharsets.UTF_8));
        
    

    @Benchmark
    public void byteToString(Blackhole bh) 
        for (byte[] bytes : byteList) 
            bh.consume(new String(bytes, StandardCharsets.UTF_8));
        
    

    @Benchmark
    public void stringToByte(Blackhole bh) 
        for (String s : stringArray) 
            bh.consume(s.getBytes(StandardCharsets.UTF_8));

测试结果：

# JMH version: 1.33
# VM version: JDK 1.8.0_151, Java HotSpot(TM) 64-Bit Server VM, 25.151-b12

Benchmark                 (size)   Mode  Cnt     Score     Error  Units
StringInJdk.byteToString   10000  thrpt   25  2396.713 ± 133.500  ops/s
StringInJdk.stringToByte   10000  thrpt   25  1745.060 ±  16.945  ops/s

# JMH version: 1.33
# VM version: JDK 17, OpenJDK 64-Bit Server VM, 17+35-2724

Benchmark                 (size)   Mode  Cnt     Score     Error  Units
StringInJdk.byteToString   10000  thrpt   25  5711.954 ±  41.865  ops/s
StringInJdk.stringToByte   10000  thrpt   25  8595.895 ± 704.004  ops/s

可以看到在 bytes 转 String 操作上，Java 17 的性能是 Java 8 的 2.5 倍左右，而 String 转 bytes 操作，Java 17 的性能是 Java 8 的 5 倍。关于字符串的操作非常基础，随处可见，可见高版本的优势十分明显。

一如既往，当前文章中的代码示例都存放在 github.com/niumoo/JavaNotes.

参考

https://richardstartin.github.io/posts/5-java-mundane-performance-tricks
https://github.com/spring-projects/spring-framework/issues/26842
https://github.com/spring-projects/spring-framework/commit/7f1062159ee9926d5abed7cadc2b36b6b7fc242e

可以微信搜一搜 程序猿阿朗 或访问 程序猿阿朗博客 。
本文 Github.com/niumoo/JavaNotes 已经收录，欢迎Star。

java中的5个代码性能提升技巧，最高提升近10倍(代码片段)

...优化而优化，这有时会增加代码的复杂度。这篇文章中的代码都在以下环境中进行性能测试。JMHversion:1.33（Java基准测试框架）VMversion:JDK17,OpenJDK64-BitServerVM,17+35-2724通过这篇文章的测试，将发现以下几个操作的... 查看详情

我只改五行代码，接口性能提升了10倍！(代码片段)

背景某公司的一个ToB系统，因为客户使用的也不多，没啥并发要求，就一直没有经过压测。这两天来了一个“大客户”，对并发量提出了要求：核心接口与几个重点使用场景单节点吞吐量要满足最低500/s的要求... 查看详情

10倍，boostkit鲲鹏全局缓存3大创新技术助力ceph性能提升

...的痛点，采用三大创新技术，有效的提高了Ceph的性能，最高可以将Ceph性能提升10倍。本文分享自华为云社区《【云驻共创】BoostKit鲲鹏全局缓存技术助力Ceph性能提升10倍，真香》，作者：查看详情

10个步骤让你的应用提升10倍性能

点击上方“朱小厮的博客”，选择“设为星标”后台回复"书"，获取后台回复“k8s”，可领取k8s资料- 目录 - 建议一：使用反向代理服务器让应用更快更安全建议二：增加负载均衡服务器建议三&#x... 查看详情

glm国产大模型训练加速：性能最高提升3倍，显存节省1/3，低成本上手(代码片段)

作者｜BBuf、谢子鹏、冯文2017年，Google提出了Transformer架构，随后BERT、GPT、T5等预训练模型不断涌现，并在各项任务中都不断刷新SOTA纪录。去年，清华提出了GLM模型（https://github.com/THUDM/GLM），不同... 查看详情

重磅官宣：nacos2.0性能提升10倍

简介：Nacos2.0作为一个跨代版本，彻底解决了Nacos1.X的性能问题，将性能提升了10倍。作者：席翁继Nacos1.0发布以来，Nacos迅速被成千上万家企业采用，并构建起强大的生态。但是随着用户深入使用，逐渐暴露一些性能问题，因... 查看详情

这48个java技术点，让你的面试成功率提升5倍！

JAVA基础（文末有彩蛋）JAVA中的几种基本类型，各占用多少字节？下图单位是bit,非字节1B=8bit String能被继承吗？为什么？不可以，因为String类有final修饰符，而final修饰的类是不能被继承的，实现细节不允许改变。平常我... 查看详情

pytorch实现苹果m1芯片gpu加速：训练速度提升7倍，性能最高提升21倍

...对每个MetalGPU系列的独特特性进行微调的内核来优化计算性能。新设备将机器学习计算图和原语映射到MPS提供的MPSGraph框架和优化内核上。此外，因为每台搭载AppleSilicon的Mac都有统一的内存架构，为GPU提供了直接访问完整... 查看详情

7-10倍写入性能提升:剖析wiredtiger数据页无锁及压缩黑科技

...文由袁荣喜向「高可用架构」投稿，通过分析WiredTiger源代码，剖析其卓越性能的背后实现。袁荣喜，学霸君工程师，2015年加入查看详情

javascript的工作原理：解析抽象语法树（ast）+提升编译速度5个技巧(代码片段)

...的概述！JavaScript是如何工作的：深入V8引擎&编写优化代码的5个技巧！JavaScript是如何工作的：内存管理+如何处理4个常见的内存泄漏!JavaScript是如何工作的：事件循环和异步编程的崛起+5种使用async/await更好地编码方式！JavaScrip... 查看详情

meta公司内部项目-raptorx：将presto性能提升10倍(代码片段)

目录概要速览存储分离化存在的问题RaptorX：搭建分层缓存解决方案Metastore版本化的缓存文件列表缓存片段结果缓存文件描述符和footer缓存Alluxio数据缓存软亲和调度Performance性能UserGuide用户指南概要速览RaptorX是Meta（前“Fa... 查看详情

var值计算性能千倍提升——某头部外资银行实例分享

...秒降至10毫秒以下；整体报表查询速度提升近5倍。打破性能瓶颈，释放业务潜力IRSVaR计算：从40分钟至3.5秒VaR值是银行风险控制中最基础的风险度量指标之一，可以用来度量在一定时间区间内，某个投资组合或资产价值可能出... 查看详情

我只改五行代码，接口性能提升了10倍！

提升python代码性能的六个技巧(代码片段)

文章目录前言为什么要写本文？1、代码性能检测1.1、使用timeit库1.2、使用memory_profiler库1.3、使用line_profiler库2、使用内置函数和库3、使用内插字符串f-string4、使用列表推导式5、使用lru_cache装饰器缓存数据6、针对循环结构的... 查看详情

我只改五行代码，接口性能提升了10倍！(代码片段)

👇👇关注后回复 “进群” ，拉你进程序员交流群👇👇今天给大家分享一篇接口性能优化干货文章。原文链接：https://juejin.cn/post/7185479136599769125背景某公司的一个ToB系统，因为客户使用的也不多ÿ... 查看详情

提升java字符串编码解码性能的技巧(代码片段)

简介：常见的字符串编码有LATIN1、UTF-8、UTF-16、GB18030，他们各有各的特点，且之间的转换比较复杂。本文将为大家介绍提升Java字符串编码解码性能的技巧。作者|温绍锦(高铁)来源|阿里开发者公众号1常见字符串编码常... 查看详情

13倍性能，3倍稳定性提升！ucloud云硬盘做了这些事

近期，我们推出高性能SSD云盘，满足用户对高性能的场景需求。SSD云盘相比普通云盘，IOPS提升了13倍，稳定性提升了3倍，平均时延降低了10倍。为了做到这些，我们从去年10月份开始对云盘的架构进行了重新设计，充分减少时延... 查看详情