에라토스테네스의 체 - 메르텐스 제2정리 증명 | sillysillyman.kim

메르텐스의 제2정리 증명

⚠️ 이 글은 나의 수학적 이해를 바탕으로 쓴 글이 아니다. 에라토스테네스의 체의 시간복잡도를 공부하다가 메르텐스의 제2정리가 필요하다는 것을 알게 되었는데, 수학 전공자가 아니다 보니 각 단계의 계산을 따라가는 것은 가능해도, 왜 이 도구들을 꺼내야 하는지 그 증명 전략의 동기를 스스로 떠올리기는 어려웠다. 그래서 전적으로 AI의 도움을 받아 증명 과정을 정리했다. 증명의 정확성을 내가 완전히 보장할 수는 없지만, 이 증명이 궁금한 분들에게 참고가 되었으면 하는 마음으로 공유한다.

메르텐스의 제2정리란

메르텐스의 제2정리(Mertens' second theorem)는 소수의 역수의 합이 어떤 속도로 증가하는지를 정확히 알려주는 정리이다:

\sum_{p \leq N} \frac{1}{p} = \ln \ln N + M + O\left(\frac{1}{\ln N}\right)

여기서

M \approx 0.2615

은 마이셀-메르텐스(Meissel–Mertens) 상수이다. 이 등식에 의해 소수의 역수의 합은 정확히

\Theta(\log \log N)

으로 증가한다.

이 정리가 왜 중요한지 간단히 언급하면, 에라토스테네스의 체의 시간복잡도가

O(N \log \log N)

임을 증명하는 핵심 근거가 된다. 자세한 내용은 이전 글 에라토스테네스의 체 - 구현과 시간복잡도를 참조하자.

증명은 세 단계로 진행한다.

1단계: $\vartheta(N) = O(N)$ (체비셰프 상한)

체비셰프 세타 함수(Chebyshev theta function)를 정의한다:

\vartheta(N) = \sum_{p \leq N} \ln p

N

이하의 모든 소수에 자연로그를 취한 것의 합이다. 이 함수에 대해

\vartheta(N) \leq 2N \ln 2

임을 보인다.

핵심은 이항계수

\binom{2n}{n}

의 크기이다. 이항 정리에 의해:

(1 + 1)^{2n} = \sum_{k = 0}^{2n} \binom{2n}{k} \geq \binom{2n}{n} = \frac{(2n)!}{(n!)^2}

좌변은

\binom{2n}{n}

을 포함한 모든 항의 합이고, 각 항이 양수이므로

\binom{2n}{n} \leq 4^n

이다.

한편,

n < p \leq 2n

인 소수

p

는

p \leq 2n

이므로

(2n)!

에는 인수로 등장하지만,

p > n

이므로

n!

에는 등장하지 않는다. 따라서

p

는

\binom{2n}{n} = \frac{(2n)!}{(n!)^2}

의 약수이다. 서로 다른 소수들은 서로소이므로 그 곱 역시

\binom{2n}{n}

의 약수이다. 양의 정수의 약수는 항상 그 수 이하이므로:

\prod_{n < p \leq 2n} p \leq \binom{2n}{n} \leq (1+1)^{2n}=4^n

양변에 로그를 취하면 곱의 로그는 로그의 합이고

\ln\prod_{n < p \leq 2n} p =\sum_{n < p \leq 2n} \ln p = \vartheta(2n) - \vartheta(n)

이므로:

\vartheta(2n) - \vartheta(n) \leq \ln 4^{n} = 2n \ln 2

이를 텔레스코핑하면 (편의상

N = 2^m

이라 하자):

\vartheta(N) = \vartheta(2^m) = \sum_{k = 0}^{m - 1} \left[\vartheta(2^{k+1}) - \vartheta(2^{k})\right] \leq \sum_{k = 0}^{m - 1} 2^{k+1} \ln 2 < 2N \ln 2

일반적인

N

에 대해서도

\vartheta(N) \leq \vartheta(2^{\lceil \log_2 N \rceil}) \leq 2 \cdot 2^{\lceil \log_2 N \rceil} \ln 2 \leq 4N \ln 2

이므로

\vartheta(N) = O(N)

이 성립한다.

2단계: $\sum_{p \leq N} \frac{\ln p}{p} = \ln N + O(1)$

먼저 폰 망골트 함수(von Mangoldt function)

\Lambda(n)

을 정의한다:

\Lambda(n) = \begin{cases} \ln p & \text{if } n = p^k \text{ (소수의 거듭제곱)} \\ 0 & \text{otherwise} \end{cases}

폰 망골트 함수의 핵심 성질은 다음과 같다:

\ln n = \sum_{d \mid n} \Lambda(d)

예를 들어

\ln 12 = \Lambda(1) + \Lambda(2) + \Lambda(3) + \Lambda(4) + \Lambda(6) + \Lambda(12) = 0 + \ln 2 + \ln 3 + \ln 2 + 0 + 0 = \ln 2 + \ln 2 + \ln 3 = \ln 12

이다. 이 성질은 소인수분해의 유일성으로부터 증명할 수 있다.

이 성질을 활용하여

\sum_{n \leq N} \ln n

을 두 가지 방식으로 표현한다.

좌변: 스털링 근사(

N! \approx \left(\frac{N}{e}\right)^N \sqrt{2\pi N}

, 팩토리얼 근사 공식)에 의해

\begin{aligned} \sum_{n=1}^{N} \ln n = \ln N! &\approx \ln\left(\left(\frac{N}{e}\right)^N \sqrt{2\pi N}\right) \\ &= N\ln N - N + \frac{1}{2}\ln(2\pi N) \\ &= N \ln N - N + O(\ln N) \end{aligned}

우변:

\ln n = \sum_{d \mid n} \Lambda(d)

를 대입하고, 약수에 대한 합의 순서를 교환하면

\sum_{n = 1}^{N} \ln n = \sum_{n = 1}^{N} \sum_{d \mid n} \Lambda(d) = \sum_{d = 1}^{N} \Lambda(d) \left\lfloor \frac{N}{d} \right\rfloor

d

가

n

의 약수인 쌍

(n, d)

를 세는 순서를 바꾼 것이다. 각

d

에 대해

d \mid n

이고

n \leq N

인

n

의 개수는

\lfloor N/d \rfloor

개이다.

\lfloor N/d \rfloor = N/d - \{N/d\}

(여기서

\{x\}

는 소수 부분,

0 \leq \{x\} < 1

)이므로:

\sum_{d = 1}^{N} \Lambda(d) \left\lfloor \frac{N}{d} \right\rfloor = N \sum_{d = 1}^{N} \frac{\Lambda(d)}{d} - \sum_{d = 1}^{N} \Lambda(d) \left\{\frac{N}{d}\right\}

오차항을 처리하자.

0 \leq \{N/d\} < 1

이므로:

\left|\sum_{d=1}^{N} \Lambda(d)\left\{\frac{N}{d}\right\}\right| < \sum_{d=1}^{N} \Lambda(d) = \psi(N)

여기서

\psi(N) = \sum_{n \leq N} \Lambda(n) = \vartheta(N) + \sum_{p^k \leq N,\; k \geq 2} \ln p

이다. 소수 거듭제곱 부분은:

\sum_{p^k \leq N,\; k \geq 2} \ln p \leq \sum_{p \leq \sqrt{N}} \ln p \cdot \left\lfloor \frac{\ln N}{\ln p} \right\rfloor \leq \sqrt{N} \ln N = O(\sqrt{N} \ln N)

1단계에서

\vartheta(N) = O(N)

을 보였으므로

\psi(N) = O(N)

이다. 따라서:

N \sum_{d = 1}^{N} \frac{\Lambda(d)}{d} = N \ln N - N + O(N)

양변을

N

으로 나누면:

\sum_{d = 1}^{N} \frac{\Lambda(d)}{d} = \ln N + O(1)

이제

\Lambda(d)/d

의 합에서 소수 항과 소수 거듭제곱 항을 분리한다:

\sum_{d = 1}^{N} \frac{\Lambda(d)}{d} = \sum_{p \leq N} \frac{\ln p}{p} + \sum_{p^k \leq N,\; k \geq 2} \frac{\ln p}{p^k}

소수 거듭제곱 항은 유계 상수이다.

p \geq 2

이므로

\frac{1}{1-p^{-1}} = \frac{p}{p-1} \leq 2

임을 이용하면:

\sum_{p^k \leq N,\; k \geq 2} \frac{\ln p}{p^k} \leq \sum_{p} \sum_{k = 2}^{\infty} \frac{\ln p}{p^k} = \sum_{p} \frac{\ln p}{p^2} \cdot \frac{1}{1 - p^{-1}} \leq \sum_{p} \frac{2\ln p}{p^2} < \sum_{n = 2}^{\infty} \frac{2 \ln n}{n^2} < \infty

따라서:

\sum_{p \leq N} \frac{\ln p}{p} = \ln N + O(1)

3단계: 아벨 합산법으로 $\sum \frac{1}{p}$ 으로 변환

\sum_{p \leq N} \frac{1}{p}

를 구하고 싶은데, 2단계에서 알고 있는 것은

\sum_{p \leq N} \frac{\ln p}{p}

이다. 두 식의 관계는:

\frac{1}{p} = \frac{\ln p}{p} \cdot \frac{1}{\ln p}

이므로

\frac{1}{\ln p}

라는 가중치를 분리해내야 한다. 이를 위해 아벨 합산법(Abel summation)을 사용한다.

아벨 합산법: 수열

{a_n}

과 연속미분가능 함수

f

에 대해,

A(x) = \sum_{n \leq x} a_n

이라 하면:

\sum_{n \leq N} a_n f(n) = A(N)f(N) - \int_1^{N} A(t) f'(t) dt

여기서

a_p = \frac{\ln p}{p}

(소수일 때),

a_n = 0

(소수가 아닐 때),

f(t) = \frac{1}{\ln t}

로 놓는다.

A(x) = \sum_{p \leq x} \frac{\ln p}{p} = \ln x + R(x), \; R(x) = O(1)

f'(t) = -\frac{1}{t(\ln t)^2}

이므로:

\begin{aligned} \sum_{p \leq N} \frac{1}{p} &= \sum_{p \leq N} \frac{\ln p}{p} \cdot \frac{1}{\ln p} \\ &= \frac{A(N)}{\ln N} - \int_2^{N} A(t) \cdot \left(-\frac{1}{t(\ln t)^2}\right) dt \\ &= \frac{A(N)}{\ln N} + \int_2^{N} \frac{A(t)}{t(\ln t)^2} dt \end{aligned}

A(t) = \ln t + R(t)

를 대입하면:

\begin{aligned} &= \frac{\ln N + R(N)}{\ln N} + \int_2^{N} \frac{\ln t + R(t)}{t(\ln t)^2} dt \\ &= 1 + \frac{R(N)}{\ln N} + \int_2^{N} \frac{1}{t \ln t} dt + \int_2^{N} \frac{R(t)}{t(\ln t)^2} dt \end{aligned}

각 항을 정리하면:

$\frac{R(N)}{\ln N} = O\left(\frac{1}{\ln N}\right)$
$\int_2^{N} \frac{1}{t \ln t} dt = \ln \ln N - \ln \ln 2$ ( $\frac{1}{t \ln t}$ 의 부정적분은 $\ln \ln t$ )
$\int_2^{N} \frac{R(t)}{t(\ln t)^2} dt$ 는 $R(t) = O(1)$ 이고 $\int_2^{\infty} \frac{1}{t(\ln t)^2} dt < \infty$ 이므로 수렴한다

첫째 항의

1

, 둘째 항의

-\ln \ln 2

, 셋째 항의 수렴값을 합쳐서 상수

M

이라 하자.

따라서:

\sum_{p \leq N} \frac{1}{p} = \ln \ln N + M + O\left(\frac{1}{\ln N}\right)

이것이 메르텐스의 제2정리이다. 여기서

M \approx 0.2615

은 마이셀-메르텐스(Meissel–Mertens) 상수이다.

\blacksquare

에라토스테네스의 체 - 메르텐스 제2정리 증명

메르텐스의 제2정리 증명

메르텐스의 제2정리란

1단계: ϑ(N)=O(N)\vartheta(N) = O(N)ϑ(N)=O(N) (체비셰프 상한)

2단계: ∑p≤Nln⁡pp=ln⁡N+O(1)\sum_{p \leq N} \frac{\ln p}{p} = \ln N + O(1)∑p≤N​plnp​=lnN+O(1)

3단계: 아벨 합산법으로 ∑1p\sum \frac{1}{p}∑p1​으로 변환

참고

1단계: $\vartheta(N) = O(N)$ (체비셰프 상한)

2단계: $\sum_{p \leq N} \frac{\ln p}{p} = \ln N + O(1)$

3단계: 아벨 합산법으로 $\sum \frac{1}{p}$ 으로 변환