早上好,我的leetcode 【hash】(第二期)

news/2024/6/1 22:34:24 标签: leetcode, 算法, 哈希算法

写在前面:坚持才是最难的事情

C++代码还是不方便写,改用python了,TAT


文章目录

  • 1.两数之和
  • 49. 字母异位词分组
  • 128.最长连续序列

1.两数之和

你好,梦开始的地方~

在这里插入图片描述
https://leetcode.cn/problems/two-sum/description/?envType=study-plan-v2&envId=top-100-liked

直接两个for循环

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {

        int size = nums.size();
        for (int i = 0; i < size; i++ ){
            for (int j = i + 1; j < size; j++){
                if (nums[i] + nums[j] == target){
                    return {i ,j};
                }
            }
        }
        return {};
    }
};

时间复杂度:O( N 2 N^2 N2),其中N是数组中的元素数量。最坏情况下数组中任意两个数都要被匹配一次
空间复杂度:O (1)。

最容易想到的方法是枚举数组中的每一个数 x,寻找数组中是否存在 target - x。方法一的时间复杂度较高的原因是寻找 target - x 的时间复杂度过高。因此,我们需要一种更优秀的方法,能够快速寻找数组中是否存在目标元素。如果存在,我们需要找出它的索引。

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        unordered_map<int, int> hashtable;
        for (int i = 0; i < nums.size(); ++i){
            auto it = hashtable.find(target - nums[i]);
            // 如果找到了就返回
            if (it != hashtable.end()){
                return {it->second, i};
            }
            // 都保存这个数的位置
            hashtable[nums[i]] = i;
        }
        return {};

    }
};

49. 字母异位词分组

在这里插入图片描述
https://leetcode.cn/problems/group-anagrams/description/?envType=study-plan-v2&envId=top-100-liked

思路:将字符串排序,字符串排序后相同的放在一起

由于互为字母异位词的两个字符串包含的字母相同,因此对两个字符串分别进行排序之后得到的字符串一定是相同的,故可以将排序之后的字符串作为哈希表的键。

class Solution {
private:
    unordered_map<string, vector<string>> hash;
    vector<vector<string>> ans;
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        for (const auto& str : strs){
            string tmp = str;
            sort(tmp.begin(), tmp.end());
            hash[tmp].emplace_back(str);
        }
        for (const auto& one: hash){
            ans.emplace_back(one.second);
        }
        return ans;
    }
};

时间复杂度 : O ( n k log ⁡ k ) :O(nk\log k) :O(nklogk),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长度。需要遍历 n n n 个字符串,对于每个字符串,需要 O ( k log ⁡ k ) O(k\log k) O(klogk) 的时间进行排序以及 O ( 1 ) O(1) O(1) 的时间更新哈希表,因此总时间复杂度是 O ( n k log ⁡ k ) O(nk\log k) O(nklogk)

空间复杂度: O ( n k ) O(nk) O(nk),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长
度。需要用哈希表存储全部字符串。


方法二:计数
由于互为字母异位词的两个字符串包含的字母相同,因此两个字符串中的相同字母出现的次数一定是相同的,故可以将每个字母出现的次数使用字符串表示,作为哈希表的键。

由于字符串只包含小写字母,因此对于每个字符串,可以使用长度为 26 的数组记录每个字母出现的次数。、

还是python写比较方便,C++太不熟悉了TAT

class Solution(object):
    def groupAnagrams(self, strs):
        """
        :type strs: List[str]
        :rtype: List[List[str]]
        """
        mp = collections.defaultdict(list);

        for st in strs:
        	# 记录字母出现的次数
            counts = [0] * 26
            for ch in st:
            	# 字母出现记录+1
            	# ord() 函数返回一个字符的Unicode码点,因此 ord(ch) 返回字符 ch 的Unicode码点
                counts[ord(ch) - ord("a")] += 1
            
            # 两个字符串中的相同字母出现的次数一定是相同的,放在一起
            mp[tuple(counts)].append(st)
        
        return list(mp.values())

时间复杂度 : O ( n ( k + ∣ Σ ∣ ) ) :O(n(k+|\Sigma|)) :O(n(k+∣Σ∣)),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的的最大长度,Σ 是字符集,在本题中字符集为所有小写字母, ∣ Σ ∣ = 26 |\Sigma|=26 ∣Σ∣=26。需要遍历 n n n 个字符串,对于每个字符串,需要 O ( k ) O(k) O(k) 的时间计算每个字母出现的次数, O ( ∣ Σ ∣ ) O(|\Sigma|) O(∣Σ∣) 的时间生成哈希表的键, 以及 O ( 1 ) O(1) O(1) 的时间更新哈希表,
因此总时间复杂度是 O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣))

空间复杂度: O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣)),其中 n n n s t r s strs strs 中的字符串的数量, k k k s t r s strs strs 中的字符串的最大
长度,Σ 是字符集,在本题中字符集为所有小写字母, ∣ Σ ∣ = 26 |\Sigma|=26 ∣Σ∣=26。需要用哈希表存储全部字符串,而记录每个字符串中每个字母出现次数的数组需要的空间为 O ( ∣ Σ ∣ ) O(|\Sigma|) O(∣Σ∣), 在渐进意义下小于 O ( n ( k + ∣ Σ ∣ ) ) O(n(k+|\Sigma|)) O(n(k+∣Σ∣)),忽略不计。

128.最长连续序列

在这里插入图片描述
https://leetcode.cn/problems/longest-consecutive-sequence/description/?envType=study-plan-v2&envId=top-100-liked

我们考虑枚举数组中的每个数 x x x,考虑以其为起点,不断尝试匹配 x + 1 , x + 2 , ⋯ x+1,x+2,\cdots x+1,x+2,是否存在,假设最长匹配到了 x + y x+y x+y,那么以 x x x 为起点的最长连续序列即为 x , x + 1 , x + 2 , ⋯   , x + y x,x+1,x+2,\cdots,x+y x,x+1,x+2,,x+y, 其长度为
y + 1 y+1 y+1, 我们不断枚举并更新答案即可。

对于匹配的过程,暴力的方法是 O ( n ) O(n) O(n) 遍历数组去看是否存在这个数,但其实更高效的方法是用一
个哈希表存储数组中的数,这样查看一个数是否存在即能优化至 O ( 1 ) O(1) O(1) 的时间复杂度。

仅仅是这样我们的算法时间复杂度最坏情况下还是会达到 O ( n 2 ) O(n^2) O(n2)
即外层需要枚举 O ( n ) O(n) O(n) 个数,内层需要暴力匹配 O ( n ) O(n) O(n) 次), 无法满足题目的要求。

但仔细分析这个过程,我们会发现其中执行了很多不必要的枚举,如果已知有一个 x , x + 1 , x + 2 , ⋯   , x + y x,x+1,x+2,\cdots,x+y x,x+1,x+2,,x+y 的连续序列,而我们却重新从 x + 1 x+1 x+1 , x + 2 x+2 x+2 或者是 x + y x+y x+y 处开始尝试匹配,那么得到的结果肯定不会优于枚举 x x x 为起点的答案,因此我们在外层循环的时候碰到这种情况跳过即可。

那么怎么判断是否跳过呢? 由于我们要枚举的数 x x x一定是在数组中不存在前驱数 x − 1 x- 1 x1的,不然按
照上面的分析我们会从 x − 1 x-1 x1 开始尝试匹配,因此我们每次在哈希表中检查是否存在 x − 1 x-1 x1 即能判断是否需要跳过了。

class Solution(object):
    def longestConsecutive(self, nums):
        """
        :type nums: List[int]
        :rtype: int
        """
        longest_streak = 0
        num_set = set(nums)

        for num in num_set:
            if num - 1 not in num_set:
                current_num = num
                current_streak = 1

                while current_num + 1 in num_set:
                    current_num += 1
                    current_streak += 1

                longest_streak = max(longest_streak, current_streak)

        return longest_streak    

时间复杂度: O ( n ) O(n) O(n),其中 n n n 为数组的长度。具体分析已在上面正文中给出。
空间复杂度: O ( n ) O(n) O(n)。哈希表存储数组中所有的数需要 O ( n ) O(n) O(n) 的空间。

在 Python 中,使用 in 操作符来判断元素是否存在于 set 中,其平均时间复杂度是 O(1)。这是因为 set 是基于哈希表实现的,在大多数情况下,通过哈希函数将元素映射到哈希表的特定位置,可以在常数时间内进行查找操作。当然,如果出现哈希冲突,时间复杂度可以增高到 O(n)。但是在平均情况下,查询元素是否在 set 中仍然是效率很高的操作。


http://www.niftyadmin.cn/n/5269176.html

相关文章

如何在PHP中使用WebSocket进行实时通信?

在PHP中使用WebSocket进行实时通信涉及到创建WebSocket服务器和与客户端建立WebSocket连接。以下是一般的步骤&#xff1a; 选择WebSocket库&#xff1a; 首先&#xff0c;您需要选择一个合适的PHP WebSocket库。一些流行的WebSocket库包括 Ratchet、ReactPHP、PHP-Websockets …

day25_软件设计模式

设计原则 1&#xff09;创建软件应用程序是为了满足不断变化和发展的需求。一个成功的应用程序还应该提供一种简单的方法来扩展它以满足不断变化的期望。如果在设计和开发软件时应用一组面向对象的设计原则和模式&#xff0c;则可以避免或解决这些常见问题。 2&#xff09;面…

HQL优化之数据倾斜

group by导致倾斜 前文提到过&#xff0c;Hive中未经优化的分组聚合&#xff0c;是通过一个MapReduce Job实现的。Map端负责读取数据&#xff0c;并按照分组字段分区&#xff0c;通过Shuffle&#xff0c;将数据发往Reduce端&#xff0c;各组数据在Reduce端完成最终的聚合运算。…

华为OD机试真题-多段线数据压缩-2023年OD统一考试(C卷)

题目描述: 下图中,每个方块代表一个像素,每个像素用其行号和列号表示。 为简化处理,多段线的走向只能是水平、竖直、斜向45度。 上图中的多段线可以用下面的坐标串表示:(2, 8), (3, 7), (3, 6), (3, 5), (4, 4), (5, 3), (6, 2), (7, 3), (8, 4), (7, 5)。 但可以发现,这…

【C语言(十)】

字符函数和字符串函数 一、字符分类函数 C语言中有⼀系列的函数是专门做字符分类的&#xff0c;也就是⼀个字符是属于什么类型的字符的。这些函数的使用都需要包含⼀个头文件是 ctype.h 这些函数的使用方法非常类似&#xff0c;我们就讲解⼀个函数的事情&#xff0c;其他的非…

什么是PHP的迭代器和生成器?

PHP中的迭代器&#xff08;Iterator&#xff09;和生成器&#xff08;Generator&#xff09;是用于处理和遍历数据集合的有用工具。它们使数据遍历更加灵活、高效&#xff0c;并减少了内存消耗。以下是它们的概述&#xff1a; 迭代器&#xff08;Iterator&#xff09;&#xff…

关于在Java中打印“数字”三角形图形的汇总

之前写过一篇利用*打印三角形汇总&#xff0c;网友需要查看可以去本专栏查找之前的文章&#xff0c;这里利用二维数组嵌套循环打印“数字”三角形&#xff0c;汇总如下&#xff0c;话不多说&#xff0c;直接上代码&#xff1a; /*** 打印如下数字三角形图形*/ public class Wo…

GoogLeNet(pytorch)

亮点与创新&#xff1a; 1. 引入Inception基础结构 2. 引入PW维度变换卷积&#xff0c;启迪后续参数量的优化 3. 丢弃全连接层&#xff0c;使用平均池化层&#xff08;大大减少模型参数&#xff09; 4. 添加两个辅助分类器帮助训练&#xff08;避免梯度消失&#xff0c;用于…