[백준] (9020) 골드바흐의 추측 [Python]

PS/백준

[백준] (9020) 골드바흐의 추측 [Python]

munsik22 2025. 3. 16. 13:58

🔗 문제 링크

https://www.acmicpc.net/problem/9020

문제

1보다 큰 자연수 중에서 1과 자기 자신을 제외한 약수가 없는 자연수를 소수라고 한다. 예를 들어, 5는 1과 5를 제외한 약수가 없기 때문에 소수이다. 하지만, 6은 6 = 2 × 3 이기 때문에 소수가 아니다.
골드바흐의 추측은 유명한 정수론의 미해결 문제로, 2보다 큰 모든 짝수는 두 소수의 합으로 나타낼 수 있다는 것이다. 이러한 수를 골드바흐 수라고 한다. 또, 짝수를 두 소수의 합으로 나타내는 표현을 그 수의 골드바흐 파티션이라고 한다. 예를 들면, 4 = 2 + 2, 6 = 3 + 3, 8 = 3 + 5, 10 = 5 + 5, 12 = 5 + 7, 14 = 3 + 11, 14 = 7 + 7이다. 10000보다 작거나 같은 모든 짝수 n에 대한 골드바흐 파티션은 존재한다.
2보다 큰 짝수 n이 주어졌을 때, n의 골드바흐 파티션을 출력하는 프로그램을 작성하시오. 만약 가능한 n의 골드바흐 파티션이 여러 가지인 경우에는 두 소수의 차이가 가장 작은 것을 출력한다.

입력

첫째 줄에 테스트 케이스의 개수 T가 주어진다. 각 테스트 케이스는 한 줄로 이루어져 있고 짝수 n이 주어진다.
4 ≤ n ≤ 10,000

출력

각 테스트 케이스에 대해서 주어진 n의 골드바흐 파티션을 출력한다. 출력하는 소수는 작은 것부터 먼저 출력하며, 공백으로 구분한다.

테스트 케이스

예제 입력	예제 출력
3 8 10 16	3 5 5 5 5 11

입력으로 주어지는 정수 n이 항상 짝수인 점에서 착안해, n을 구성하는 a와 b의 초기값을 n/2로 설정했다. a와 b가 소수가 아니면 a-1, b+1에 대해 다시 골드바흐 검사를 수행하고, 둘 다 소수면 그 때의 b-a가 바로 골드바흐 파티션이다.

첫 번째로, 소수 판별 알고리즘을 사용해 문제를 풀어보았다.

def is_prime(n):
    if(n == 1):
        return False
    for i in range(2, n):
        if(n % i == 0):
            return False
    return True

def gold(a, b):
    if(is_prime(a) and is_prime(b)):
        print(a, b)
        return
    else:
        gold(a-1, b+1)
        
t = int(input())
for _ in range(t):
    n = int(input())
    gold(n//2, n//2)

이 코드의 길이는 358B이며, 메모리 사용은 32424KB, 실행 시간은 3640ms이다.

두 번째로, 에라토스테네스의 체 알고리즘을 사용해 문제를 풀어보았다.

def sieve(n):
    arr = [i for i in range(n+1)]
    end = int(n**(1/2))
    for i in range(2, end+1):
        if arr[i] == 0: continue
        for j in range(i*i, n+1, i): arr[j] = 0
    return [i for i in arr[2:] if arr[i]]

def gold(a, b, s):
    if(a in s and b in s):
        print(a, b)
        return
    else:
        gold(a-1, b+1, s)

t = int(input())
for _ in range(t):
    n = int(input())
    s = sieve(n)
    gold(n//2, n//2, s)

이 코드의 길이는 441B, 메모리 사용은 33448KB, 실행 시간은 3956ms이다.

분명 공부할 때는 에라토스테네스의 체 알고리즘이 일반적인 소수 판별 알고리즘보다 시간 효율성이 더 뛰어나다고 했는데, 실제 결과로는 sieve을 사용한 두 번째 코드의 시간이 더 오래 걸렸다. 🤯

개선점

리스트 대신 집합을 사용하자: 해시 테이블을 사용하기 때문에 집합에서의 검색은 O(1)의 시간복잡도를 가진다.
재귀함수 대신 반복문을 사용하자: 재귀 호출은 스택 오버플로우를 유발할 수 있으며, 성능 저하를 초래할 수 있다.
소수 생성 최적화: 에라토스테네스의 체 알고리즘에서 arr 배열을 사용할 때, 소수를 찾는 과정을 좀 더 최적화할 수 있다. 예를 들어, 짝수는 2만 제외하고는 소수가 아니므로, 홀수만 검사하도록 개선할 수 있다.

개선사항을 반영한 코드는 다음과 같다.

def sieve(n):
    arr = [True] * (n + 1)
    arr[0], arr[1] = False, False
    end = int(n**(1/2))
    for i in range(2, end+1):
        if arr[i]:
            for j in range(i*i, n+1, i): arr[j] = False
    return {i for i in range(n + 1) if arr[i]}

def gold(n, s):
    a, b = n // 2, n // 2
    while a > 0:
        if a in s and b in s:
            print(a, b)
            return
        a -= 1
        b += 1

t = int(input())
for _ in range(t):
    n = int(input())
    s = sieve(n)
    gold(n, s)

코드 길이는 523B, 메모리 사용은 32412KB, 실행 시간은 2536ms로, 여전히 오래 걸리긴 하지만 첫 번째 작성한 코드보다도 1초 가량 더 빨라졌다. 🚀