Txing

欢迎来到 | 伽蓝之堂

0%

Q945 使数组唯一的最小增量-中等-排序

945. 使数组唯一的最小增量

Question

给定整数数组 A,每次 move 操作将会选择任意 A[i],并将其递增 1。

返回使 A 中的每个值都是唯一的最少操作次数。

Example 1:

输入:[1,2,2] 输出:1 解释:经过一次 move 操作,数组将变为 [1, 2, 3]。

Example 2:

输入:[3,2,1,2,1,7] 输出:6 解释:经过 6 次 move 操作,数组将变为 [3, 4, 1, 2, 5, 7]。 可以看出 5 次或 5 次以下的 move 操作是不能让数组的每个值唯一的。

提示:

  • 0 <= A.length <= 40000
  • 0 <= A[i] < 40000

Approach 1: 直接方法(运行超时)

很明显,把混乱的数组排序后可以方便快速处理。这里是每一步检查元素是否满足,如果是则

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
class Solution:
def minIncrementForUnique(self, A) -> int:
A.sort()
res = 0
i = 0
while( i < len(A)-1 ):
if A[i] >= A[i+1]:
A[i+1] = A[i+1] + 1
res += 1
else:
i += 1

return res


def main():
A = [3,2,1,2,1,7]
solution=Solution().minIncrementForUnique(A)
print(solution)


if __name__ == "__main__":
main()

算法时间复杂度过大,导致输入数据较大的情况下,运行超时。因此必须对算法进行优化。

由于 的范围为 ,我们可以用数组统计出每个数出现的次数,然后对于每个重复出现的数,我们暴力地将它递增,直到它增加到一个没有重复出现的数为止。但这样的方法的时间复杂度较大,可以达到 ,例如数组 A 中所有元素都是 1 的情况。

因此,我们不能对重复出现的数暴力的进行递增,而是用以下的做法:当我们找到一个没有出现过的数的时候,将之前某个重复出现的数增加成这个没有出现过的数。注意,这里 「之前某个重复出现的数」 是可以任意选择的,它并不会影响最终的答案,因为将 P 增加到 X 并且将 Q 增加到 Y,与将 P 增加到 Y 并且将 Q 增加到 X 都需要进行 (X + Y) - (P + Q) 次操作。

例如当数组 A 为 [1, 1, 1, 1, 3, 5] 时,我们发现有 3 个重复的 1,且没有出现过 2,4 和 6,因此一共需要进行 (2 + 4 + 6) - (1 + 1 + 1) = 9 次操作。

Approach 2: 计数

算法

首先统计出每个数出现的次数,然后从小到大遍历每个数 x:

  • 如果 x 出现了两次以上,就将额外出现的数记录下来(例如保存到一个列表中);

  • 如果 x 没有出现过,那么在记录下来的数中选取一个 v,将它增加到 x,需要进行的操作次数为 x - v。

我们还可以对该算法进行优化,使得我们不需要将额外出现的数记录下来。还是以 [1, 1, 1, 1, 3, 5] 为例,当我们发现有 3 个重复的 1 时,我们先将操作次数减去 1 + 1 + 1。接下来,当我们发现 2,4 和 6 都没有出现过时,我们依次将操作次数增加 2,4 和 6。这种优化方法在方法二中也被使用。

注意事项

虽然 A[i] 的范围为 [0, 40000),但我们有可能会将数据递增到 40000 的两倍 80000。这是因为在最坏情况下,数组 A 中有 40000 个 40000,这样要使得数组值唯一,需要将其递增为 [40000, 40001, ..., 79999],因此用来统计的数组需要开到 80000。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def minIncrementForUnique1(self, A) -> int:
count = [0] * 80000
# 建立一个 Hash 表,记录每个元素出现的次数
for x in A:
count[x] += 1
# taken记录从冗余数中取走了几个
ans = taken = 0
for x in range(80000):
if count[x] >= 2:
taken += count[x] - 1
ans -= x * (count[x] - 1)
elif taken > 0 and count[x] == 0:
taken -= 1
ans += x

return ans

复杂度分析

  • 时间复杂度:O(L),其中 L 的数量级是数组 A 的长度加上其数据范围内的最大值,因为在最坏情况下,数组 A 中的所有数都是数据范围内的最大值。

  • 空间复杂度:O(L),需要长度 L 的数组统计每个数出现的次数。

Approach 3: 排序

思路

我们可以将数组先进行排序,再使用方法一中提及的优化方法。

算法

将数组排完序后,我们对数组进行线性扫描,会有两种情况:

  • 如果 A[i-1] == A[i],我们将操作次数减去 A[i],并将重复的数的个数增加 1;

  • 如果 A[i-1] < A[i],则区间 里的数都是没有出现过的,所以我们可以将之前重复的数变为这个区间范围内的数。设当前重复的数的个数为 taken,则我们最多可以改变 give = min(taken, A[i] - A[i - 1] - 1) 个数,即区间 的长度与 taken 二者的较小值。它们的操作数对答案的贡献为:

在扫描完数组后,如果仍然有重复的数,即 taken 不为 0,我们可以将这些数变为区间 中的数,其中 A[n - 1] 是数组 A 中的最后一个数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
def minIncrementForUnique2(self, A) -> int:
A.sort()
A.append(100000)
ans = taken = 0

for i in range(1, len(A)):
if A[i - 1] == A[i]:
taken += 1
ans -= A[i]
else:
give = min(taken, A[i] - A[i - 1] - 1)
ans += give * (give + 1) // 2 + give * A[i - 1]
taken -= give

return ans

复杂度分析

  • 时间复杂度:,其中 N 是数组 A 的长度,即排序的时间复杂度。

  • 空间复杂度:,排序需要额外 的栈空间。