Skip to main content

295.从数据流中找到中位数

标签: heap, design

难度: Hard

通过率: 52.67%

原题链接: https://leetcode.com/problems/find-median-from-data-stream/description/

题目描述

中位数是有序整数列表中的中间值。如果列表的大小为偶数,则没有中间值,中位数是两个中间值的平均值。实现 MedianFinder 类:

解题思路

为了在数据流中找到中位数,可以使用两个堆来实现。重点在于如何动态维护两个堆的大小和数据关系。

  1. 小顶堆和大顶堆组合

    • 使用两个堆:一个最大堆 max_heap 和一个最小堆 min_heap
    • 最大堆 max_heap 用于存储数据流中较小的一半元素,堆顶元素是最大值。
    • 最小堆 min_heap 用于存储数据流中较大的一半元素,堆顶元素是最小值。
    • 平衡原则:保持两个堆的大小平衡,或让最大堆的大小比最小堆大1。
  2. 添加数字的操作

    • 初始时将新数 num 添加到最大堆。然后将最大堆的堆顶元素提取放到最小堆。
    • 如果最小堆的大小超过最大堆,将最小堆的堆顶元素重新放入最大堆。
    • 通过这种方式,两个堆随时保持平衡,且中位数可以很快计算出来。
  3. 寻找中位数的操作

    • 如果两个堆大小相等,中位数为两个堆顶元素的平均数。
    • 如果最大堆比最小堆多一个元素,中位数就是最大堆的堆顶,即较小的一半中的最大值。

代码实现

import heapq

class MedianFinder:
def __init__(self):
"""初始化两个堆:max_heap 用于存储较小的一半(最大堆),min_heap 用于存储较大的一半(最小堆)"""
self.max_heap = [] # 最大堆,保存较小的一半
self.min_heap = [] # 最小堆,保存较大的一半

def addNum(self, num: int) -> None:
# 将新数加入最大堆
heapq.heappush(self.max_heap, -num)
# 最大堆的堆顶元素移入最小堆
heapq.heappush(self.min_heap, -heapq.heappop(self.max_heap))

# 保持最大堆的大小不小于最小堆
if len(self.max_heap) < len(self.min_heap):
heapq.heappush(self.max_heap, -heapq.heappop(self.min_heap))

def findMedian(self) -> float:
# 如果总数为奇数,返回最大堆堆顶
if len(self.max_heap) > len(self.min_heap):
return -self.max_heap[0]
# 如果总数为偶数,返回两个堆顶的平均值
return (-self.max_heap[0] + self.min_heap[0]) / 2.0

复杂度分析

时间复杂度

每次加入数字的时间复杂度为 O(logn)O(\log{}n),因为需要往堆中添加和移除元素。查找中位数的时间复杂度为 O(1)O(1),因为中位数是在堆顶元素计算出来的。

空间复杂度

空间复杂度为 O(n)O(n),其中 nn 是添加到数据结构中的元素数量,因为需要存储所有的元素。