leetcode第三题(longestsubstringwithoutrepeatingcharacters)三部曲之三:两次优化(代码片段)

程序员欣宸 程序员欣宸     2022-11-30     797

关键词:

欢迎访问我的GitHub

  • 本文是《LeetCode第三题(Longest Substring Without Repeating Characters)三部曲》的第三篇,之前的两篇文章列出了思路并写出了Java代码,虽然在LeetCode网站提交通过,但是成绩并不理想,40多毫秒的速度,与诸多优秀的方案有不小差距,
    今天就来一起优化代码,提升速度;

原有代码

  • 这里再回顾一下原有代码:
public int lengthOfLongestSubstring(String s) 
        //窗口的起始位置,窗口的结束为止,最长记录
        int left = 0, right = 0, max = 0;

        //表示窗口内有哪些值
        Set<Character> set = new HashSet<>();

        while (right < s.length()) 
            //例如"abcdc",窗口内是"abcd",此时right等于[4],
            //发现窗口内有array[right]的值,就缩减窗口左边,
            //缩到窗内没有array[right]的值为止,
            //当left一路变大,直到left=3的时候,窗口内已经没有array[right]的值了
            if (set.contains(s.charAt(right))) 
                //假如窗口内是"abc",当前是"c",那么下面的代码只会将"a"删除,left加一,再次循环
                //而新一次循环依旧发现"c"还在set中,就再把"b"删除,left再加一...
                set.remove(s.charAt(left++));
             else 
                //窗口内没有array[right]的时候,就把array[right]的值放入set中,表示当前窗口内有哪些值
                set.add(s.charAt(right++));

                if ((right - left) > max) 
                    max = right - left;
                
            
        

        return max;
    

第一次优化

  • 这次的重点是HashSet对象,此对象保存窗口中的所有元素,每加入一个新元素之前都检查HashSet中是否存在该元素;

  • 如下图所示,代码中通过set.addset.remove方法将HashSet中的内容始终与窗口中的内容保持一致:

  • 优化前:判断一个元素是否在窗口中,现在的做法是以HashSet中为准,当判定某个元素要从窗口中移除,就调用HashSet的remove方法从HashSet中删除;
  • 上述的代码可以优化,优化后可以不用执行HashSet的remove方法,具体的逻辑是使用HashMap替代HashSet,HashMap的key是字符串的元素,value是元素在数组中的位置,举个例子,当left=1,right=3时,整体的效果是下图这样的,HashMap中已经保存了"a"、"b"、"c"三个元素作为key,而value就是它们在数组中的下标:

  • 现在要检查数组中下标为4的元素"b":以"b"为key查找HashMap,如果不存在就表示不在窗口中,如果存在,就用对应的value=1去和left比较,如果小于left就表示不在窗口中,如果大于或者等于left就表示在窗口中,如下图所示:

  • 这里要注意的是:hashmap中任意一个value,表示的是某个元素在整个数组中的位置,而不是在窗口中的位置,因为程序中不会对hashmap做remove操作;
  • 接着上面的图分析,"b"元素被发现在窗口中存在后,除了将left调整为2,right调整为4,还要调用HashMap的put方法,将"b"元素的位置从原来的1更新为4;
  • 另外还有个优化点:假设当前窗口中是"abc",而检查的元素是"b",之前的代码中,要执行两次循环:先删除"a",left加一,再删除"b",left再加一,现在用了HashMap就能得到"b"的位置,直接将left改为"b"的下一个位置即可,不需要执行两次循环了;
  • 以上就是优化思路了,用HashMap取代HashSet,不再执行remove方法,对代码的调整并不大,调整后的完整代码如下:
public int lengthOfLongestSubstring(String s) 
        int left =0, right =0, max = 0;
        Map<Character,Integer> map = new HashMap<>();
        while (right<s.length())
            //map中如果不存在就表示不在窗口中
            if(map.containsKey(s.charAt(right)))
                int pos = map.get(s.charAt(right));
                //map中如果存在,再检查value和left,来判断是否在窗口中
                if(pos>=left)
                    //注意这又是个优化点,假设当前窗口中是"abc",而检查的元素是"b",
                    //之前的代码中,要执行两次循环:先删除"a"再删除"b",
                    //现在用了HashMap就能得到"b"的位置,直接将left改为"b"的下一个位置即可,不需要执行两次循环了
                    left = pos + 1;
                
            
            map.put(s.charAt(right), right++);
            if((right-left)>max)
                max = right-left;
            
        

        return max;
    
  • 提交上述代码到LeetCode,这次的成绩是27毫秒,比之前好了不少,如下图:

  • 然而,这个成绩依然很平庸,因为它还有可优化之处,接下来再次优化;

第二次优化

  • 第一次的优化点是消除remove方法和while循环次数,第二次优化则是针对HashMap,每次处理新的元素都涉及到HashMap的操作,如果您对HashMap的内容有所了解,就知道计算hashcode、创建EntrySet,调用equals方法这些操作会被频繁执行,如果能省去这些操作,那么性能应该会有明显提升,问题是:如何才能去掉HashMap而不影响功能呢?
  • 我们先明确HashMap在程序中的作用:保存一个元素在数组中的位置,所以优化的方向就是寻找HashMap的替代品;
  • 假设一共可能出现二十六种字符:从"a"到"z",那就简单了,用一个长度为26的int数组来记录每个字符的位置,array[0]的值就是元素"a"的位置,array[1]的值就是元素"b"的位置,array[2]的值就是元素"c"的位置,如下图所示,图中的数字97是"a"的ASCII码:

  • 按照上面的设计,array[0]=3就表示"a"元素在整个数组中最后一次出现的位置是3,array[1]=1表示"b"元素在整个数组中最后一次出现的位置是1,array[2]=2就表示"c"元素在整个数组中最后一次出现的位置是2,如下图:

  • 按照以上设计是不是就可以立即编码并提交到LeetCode了呢?我当时就是这么做的,很不幸因为测试没有通过而提交失败了,没通过的原因是:字符串中不仅会有"a"到"z"的小写,还有大写字母、空格字符、加减乘除等字符,遇到这些字符时,我们之前设计的长度26的数组就不够用了,看来要重新设计数组;

  • 新的数组总长度是95,这是因为所有英文可见字符一共是95个,从空格开始,到"`"结束,如下图的三个红框所示:

  • 如上所示,长度为95的数组,可以将所有可见字符都纳入进来,array[0]保存的是空格字符的位置,因此计算字符"a"在array数组中的下标就从之前的a-97=0变成了a-32=65

  • 另外要注意的是,这个数组中每个元素初始值都是-1,表示字符串中没有这个元素(或者说还没有处理到);
  • 按照上述思路优化后的代码如下所示,可见改动并不大,只是把HashMap相关的地方全部改成了上述的数组逻辑:
public int lengthOfLongestSubstring(String s) 
        int left =0, right =0, max = 0;

        int[] array = -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                       -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
                -1, -1, -1, -1, -1;

        int offset;
        while (right<s.length())
            //offset表示当前处理的元素在array数组中的下标,
            //如果当前元素是空格,那么减去32后等于0,array[offset]即array[0],
            //这个array[0]的值就是空格字符在字符串中的位置
            offset = s.charAt(right) - 32;

            if(array[offset]>-1)
                int pos = array[offset];

                if(pos>=left)
                    left = pos + 1;
                
            

            array[offset] = right++;

            if((right-left)>max)
                max = right-left;
            
        

        return max;
    
  • 将以上代码提交到LeetCode,顺利通过,成绩提升到17ms,超过了99.94%的java方案,如下图:

  • 最终效果证明这次优化的方向和结果都是正确的,之前已经有朋友问过优化思路从何而来,其实灵感来自桶排序,思想是类似的;

  • 至此,LeetCode第三题的解题思路、编码实现、优化实战就全部完成了,希望能给读者您在解题过程中带来一些参考,刷题之路,大家一起努力!

欢迎关注51CTO博客:程序员欣宸

算法入门01线性枚举(简单-第三题)leetcode876(代码片段)

...0c;和我一起打卡!🌞《光天化日学C语言》🌞LeetCode太难?上简单题!🧡《C语言入门100例》🧡LeetCode太简单?大神盘他!🌌《 查看详情

第一次leetcode周赛总结(代码片段)

...批办法枚举导师的排列组合(大佬的姿势唠嗑第一次参加leetcode周赛,心情有点小激动,给我的感觉是,前两题送分,第三题可能暴力枚举,也可能是dp,第四题上难度,代码量迅速上升。这次的周赛ÿ... 查看详情

第三题

查看详情

可信考试第三题-20220722

/**Copyright(c)HuaweiTechnologiesCo.,Ltd.2019-2020.Allrightsreserved.*Description:上机编程认证*Note:缺省代码仅供参考,可自行决定使用、修改或删除*只能importGo标准库 查看详情

第三题(非实验5)

#ifndefBOOK_H#defineBOOK_H#include<string>usingstd::string;classBook public: Book(stringisbnX,stringtitleX,floatpriceX):isbn(isbnX),title(titleX),price(priceX) voidprint(); private: string 查看详情

c_cpp第三题(代码片段)

查看详情

java实验九第三题

答案我也是嫖的!https://blog.csdn.net/qq_37246345/article/details/1032650371importjava.io.BufferedReader;2importjava.io.BufferedWriter;3importjava.io.File;4importjava.io.FileInputStream;5importjava.io.FileWri 查看详情

java实验九第三题

答案我也是嫖的!https://blog.csdn.net/qq_37246345/article/details/1032650371importjava.io.BufferedReader;2importjava.io.BufferedWriter;3importjava.io.File;4importjava.io.FileInputStream;5importjava.io.FileWri 查看详情

软件测试section1.2.exercises第三题

publicintfindLast(int[]x,inty){//Effects:IfX==nullthroNullPointerException//elsereturntheindexofthelastelement//inxthatequalsy.//Ifnosuchelementexists,return-1for(inti=x.length-1;i>0;i--){if(x[i]== 查看详情

2014百度之星资格赛第三题

XorSumTimeLimit:2000/1000MS(Java/Others)    MemoryLimit:132768/132768K(Java/Others)TotalSubmission(s):7837    AcceptedSubmission(s):3350ProblemDescriptionZeus和P 查看详情

bzoj4929:第三题

Description给定n,b,c,d,e以及A0,A1,···,An−1,定义xk=b×c^4k+d×c^2k+ef(x)=Sigma(Aix^i),0<=i<=n-1请你求出f(x0),f(x1),···,f(xn−1)对10^6+3取模的值。Inp 查看详情

test20181016b君的第三题(代码片段)

题意B君的第三题(haskell)题目描述大学四年,我为什么,为什么不好好读书,没找到和你一样的工作。B君某天看到了这样一个题,勾起了无穷的回忆。输入(n,k)和一棵(n)个点的树,有边权,没有点权。两点(i,j)之间的距离(D(i,j))定... 查看详情

16年第七届蓝桥杯第三题_

方格填数如下的10个格子  +--+--+--+  |  |  | |+--+--+--+--+|  | |  | |+--+--+--+--+|  | |  |+--+--+--+(如果显示有问题, 查看详情

回文素数-2015校内选拔第三题

10301是个5位的素数。它有个特点,把数字倒过来还是它本身,具有这样特征的素数,我们称之为:回文素数。105011060111311这些都是5位的回文素数。请你计算一下,像这样的5位数的回文素数,一共有多少个?请填写这个表示个数... 查看详情

c高级第一次作业函数题第三题

函数题第三题voidsum_diff(floatop1,floatop2,float*psum,float*pdiff)*psum=op1+op2; pdiff=op1-op2; psum,pdiff是地址psum,pdiff是值,所以对op1,op2做和差分别交给psum,*pdiff。*psum,*pdiff分别指向op1,op2的和差. 查看详情

test20181018b君的第三题(代码片段)

题意B君的第三题(shenyang)题目描述客似云来,万里无云B君得到了一个数组(a_1,a_2,dots,a_n)。B君想通过修改让数组中个每对数都互质。每次使一个数+1或者-1的代价是1。不能将(a_i)修改为0或者负数。问至少多少代价才可以让所有数两... 查看详情

看雪.tsrc2017ctf秋季赛第三题

看雪.TSRC2017CTF秋季赛第三题wp这是一道很简单的题,反调试的坑略多。这道题采用了很多常用的反调试手段,比如调用IsDebuggerPresent、进程名检查等等。另外也有利用SEH的非常规检测方法。现在的OD插件能轻松对付常规反调试,暗... 查看详情

test20181019b君的第三题(代码片段)

题意B君的第三题(urumqi)题目描述风雨如晦,鸡鸣不已。B君最近在研究自己的学长都在做什么工作,每个学长属于一个公司。B君会获得一些信息,比如x和y在相同公司,x和y在不同公司。如果当前信息和之前记住的所有信息都不矛... 查看详情