현재 검색어 : 전체 글

확률과 통계 - 조건부 확률과 대칭성 2025.04.10
평균과 3변수 (3) 2025.04.09
평균과 3변수 (2) 2025.04.09
평균과 3변수 (1) 2025.04.08
LLM은 월드모델인가 2025.04.08
류와 종차 그리고 객체지향(OOP)의 추상화 2025.04.02
baek9461_파도반 수열 2025.03.30
통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기 2025.03.12
최적화와 선택의 수학적 구조 연재 계획 2025.03.11 2
백준 24267번 : 알고리즘 수업을 통해 보는 삼중 시그마의 이해 2025.03.02

확률과 통계 - 조건부 확률과 대칭성

Engivia 2025. 4. 10. 12:35

2025. 4. 10. 12:35

30명의 사람이 있고, 이들을 5명씩 6개의 조로 나누려고 한다고 해보자.
이때, 범성이와 기륜이가 같은 조에 속할 확률은 얼마일까?

이 문제는 겉보기에 단순해 보이지만, 어떻게 접근하느냐에 따라 풀이 방식이 달라진다.
직관적으로 빠르게 구하는 방법도 있고, 수학적으로 정확하게 경우의 수를 따져서 푸는 방법도 있다.
두 방식은 결과는 같지만 해석의 깊이에는 차이가 있다.

우선, 모든 조가 5명씩 균등하게 나뉜 상황부터 살펴보자.

이 경우, 범성이는 어느 조에 속하든 상관없다. 어차피 확률은 1이기 때문이다.
이제 기륜이가 범성이와 같은 조에 들어가야 둘이 같은 조가 된다.
남은 29자리 중에서 범성이가 속한 조의 나머지 4자리 중 하나를 선택하면 되므로, 확률은

$\frac{4}{29}$

이 된다. 아주 간단하고 우아한 풀이이다.

하지만 이걸 좀 더 수학적 확률의 관점에서,
즉 “성공 경우의 수 / 전체 경우의 수”로 풀어보면 어떻게 될까?

전체 경우의 수는 30명 중에서 2명을 뽑는 경우이므로

$(\binom{30}{2}) = 435$
범성이와 기륜이가 같은 조에 있을 수 있는 경우는, 각 조에서 2명을 뽑는 경우의 수의 합이다.
5명 중 2명을 고르는 경우는이고, 이런 조가 6개 있으므로 전체 성공 경우는
$6 \times 10 = 60$
$(\binom{5}{2}) = 10$

따라서 확률은

$\frac{60}{435} = \frac{4}{29}$

로 앞서의 직관적 풀이와 정확히 일치한다.

또는 경우의 수를 정리해서 다음과 같이 표현할 수도 있다:

$\frac{6 C 1 \times 5 P 2}{30 P 2}$

하지만 이런 간단한 풀이가 언제나 통하는 것은 아니다.
위와 같은 직관적 풀이가 성립하는 배경에는 조의 크기가 모두 동일하다는 대칭성이 숨어 있다.

이제 문제를 조금 더 복잡하게 바꿔보자.
조의 구성 인원이 다음과 같다고 하자:

5 / 6 / 4 / 5 / 5 / 5

이제는 범성이가 어느 조에 배정되느냐에 따라
기륜이가 그 조에 들어갈 수 있는 자리 수가 달라진다.
이 상황에서는 단순히 “범성이는 무조건 배정, 기륜이는 남은 자리 중 같은 조 선택” 식으로 풀 수 없다.

조건부 확률로 접근해보자

범성이가 각 조에 배정될 확률은 조의 크기에 비례하므로 다음과 같다:
- 5명 조: $4 \times 5 = 20$ 명 → 확률 $\frac{20}{30}$
- 6명 조: $1 \times 6 = 6$ 명 → 확률 $\frac{6}{30}$
- 4명 조: $1 \times 4 = 4$ 명 → 확률 $\frac{4}{30}$
기륜이가 같은 조에 들어갈 확률:
- 5명 조: 남은 자리 4 → 확률 $\frac{4}{29}$
- 6명 조: 남은 자리 5 → 확률 $\frac{5}{29}$
- 4명 조: 남은 자리 3 → 확률 $\frac{3}{29}$
따라서 전체 확률은 다음과 같다:

$\frac{20}{30} \times \frac{4}{29} + \frac{6}{30} \times \frac{5}{29} + \frac{4}{30} \times \frac{3}{29} = \frac{80 + 30 + 12}{870} = \frac{122}{870} = \frac{61}{435}$

수학적 확률로 풀어도 마찬가지다

전체 경우의 수:
$(\binom{30}{2}) = 435$
성공 경우의 수는 각 조별로 다음과 같다:
- 5명 조: $4 \times (\binom{5}{2}) = 4 \times 10 = 40$
- 6명 조: $(\binom{6}{2}) = 15$
- 4명 조: $(\binom{4}{2}) = 6$
따라서 전체 성공 경우의 수는
$40 + 15 + 6 = 61$

확률은 역시

$\frac{61}{435}$

이 된다.

이제 이 문제에서 얻은 깨달음을 요약해보면

조의 크기가 모두 같다면,
기륜이가 같은 조의 남은 자리에 들어갈 확률을 직접 계산하면 빠르고 직관적인 풀이가 가능하다.
하지만 조의 크기가 서로 다르면,
조건부 확률 또는 수학적 확률의 엄밀한 접근이 반드시 필요하다.

단순한 상황에서는 우아한 해법이 유용하지만,
그 풀이가 성립하는 전제(대칭성)를 인식하지 못한 채 무작정 사용하면,
복잡한 문제에서는 오히려 위험해질 수 있다.

그래서 때로는 길고 복잡해 보이더라도,
수학적으로 정확한 원리에 근거한 해법을 선택하는 것이 더 안전하고 본질적인 접근이 될 수 있다.

'대입 > 수학' 카테고리의 다른 글

곱했으면 왜 나눠야할까 - 곱셈은 순서를 발생시킨다(1) (0)	2025.04.22
원순열 문제 - 쉽게 풀면 왜 틀릴까? (0)	2025.04.10
중복조합을 이렇게 이해하자! (0)	2025.02.28
다항함수 총정리(1) (0)	2025.01.13
2021학년도 9월 모의평가 21번(가), 210921(가) (2)	2024.08.11

평균과 3변수 (3)

Engivia 2025. 4. 9. 00:45

2025. 4. 9. 00:45

저번 시간까지 조화평균과 산술평균의 차이 그리고 왜 3변수로 정의된 물리량에서

특정 물리량이 고정됐을 때, 조화평균이 나타나는지 구체적으로 살펴보았다.

이제 진짜 시험문제에서 출제자들이 이를 어떻게 출제하고 수험생들에게 정보를 주는 방식을 구체적으로 살펴보고자 한다.

물리·화학·수학적 원리가 드러나는 문제들은 시험장에서 “공식만 외우면 금방 풀 수 있을 것 같은데 왜 실제로는 헷갈리지?”라는 경험을 주는 데, 그 이유는 간단하다. 출제자는 문제 속에 필요한 정보를 은근히 감추거나 일부만 제공하여 수험자가 곧바로 공식을 적용하지 못하도록 설계한다. 이 글에서는 왜 이전에 다룬 “3변수 구조 + 비례·반비례 + 분수(단위당)”라는 통찰이 시험 문제 풀이에도 그대로 적용되는지를 살펴본다.

시험 문제는 직접 “조화평균을 써라”라고 안내하지 않는다. 문제는 조건만을 우회적으로 제시하여 수험자가 그 밑에 숨은 구조를 스스로 찾아내도록 유도한다. 예를 들어 왕복 속도 문제에서는 “한 구간은 시속 60km, 다른 구간은 시속 40km로 주행한다”라는 식으로 조건을 제시한다. 여기서 중요한 것은 두 구간의 거리가 동일하다는 사실이다. 이 조건만으로도 실제 평균 속도는

$\bar{v} = \frac{2}{\frac{1}{v_{1}} + \frac{1}{v_{2}}} = \frac{2 v_{1} v_{2}}{v_{1} + v_{2}}$

라는 조화평균 형태임을 유추할 수 있다. 그러나 문제는 ‘조화평균’이라는 단어를 쓰지 않고 “총 이동 시간”과 “총 이동 거리”를 제시하여 수험자가 직접 계산하도록 만든다.

또한 공동 작업 문제에서는 “A는 혼자 6시간 걸리고 B는 혼자 걸리는 시간은 미지수이다. A와 B가 함께하면 1시간 20분 걸린다”라는 조건을 주어, 수험자가 미지수 $t_{B}$ 를 설정한 후

$\frac{1}{t_{A}} + \frac{1}{t_{B}} = \frac{1}{t_{함께}}$

와 같은 식을 세워 풀도록 유도한다. 만약 $t_{B}$ 를 직접 알려주었다면 정보 하나를 제공한 셈이 되어 바로 풀이가 가능하겠지만, 이를 감추고 대신 “함께 했을 때 걸리는 시간”만 주어 수험자가 스스로 방정식을 세워야 한다.

출제자는 문제를 통해 “어떤 값이 고정되는가?” (예를 들어 거리인지, 시간인지)와 “각 구간의 비중은 같은가?”를 의식적으로 파악하도록 만든다. 대다수 수험생이 “왕복 속도 문제나 A속도-B속도 문제는 조화평균을 쓰면 된다”라는 공식을 기계적으로 적용하다가 구간 비중의 차이를 눈치채지 못하여 오답을 내는 경우가 발생한다.

또한 문제에서는 표, 그래프, 지문 등으로 필요한 정보를 여러 곳에 흩어 놓아 수험자가 “나에게 몇 개의 독립 정보를 주고 있는가?”를 파악하고 종합하도록 유도한다. 한두 개라도 정보를 놓치면 해를 찾지 못하거나 다중해가 발생할 수 있다. 정보를 온전히 주면 쉽게 풀릴 문제도 하나만 생략하거나 표를 나누어 놓으면 수험자가 고생하게 만든다. 문제는 “어떤 값이 고정인가?”, “역수합인지 단순합인지”, “증발이나 누락으로 인해 분량이 바뀌지는 않았나?”와 같이 직접 확인하도록 유도하여 풀이 과정을 한 단계 복잡하게 만든다.

결국 시험 문제 해석의 핵심은 “어떤 값이 고정인가?”를 찾는 것이다. 예를 들어 왕복 속도 문제는 ‘거리가 같다’는 조건이 있고, 병렬저항 문제는 ‘전압이 같다’는 조건, 작업 문제는 ‘목표 작업량(1작업)이 같다’는 조건을 통해 문제를 풀도록 만든다. 동시에 일어나는 현상에서는 역수합, 즉 조화평균이 등장할 가능성이 크고, 구간마다 시간이나 거리, 분량이 다르면 각 구간의 비중에 맞는 가중평균을 적용해야 한다.

시험 문제는 “당신이 본질을 아는가?”를 묻는다. 예를 들어 왕복 속도 문제에서는 대부분 “같은 거리” 조건이 적용되어 역수합(조화평균)을 사용해야 하지만, 중간에 거리가 다른 구간이 섞이거나 시간이 달라지면 단순 조화평균이 적용되지 않는다. 공동 작업 문제에서는 “역수 합이 핵심”이지만 한 사람의 작업률(역수)을 숨기거나 가중 시간이 다르면 혼란을 초래한다. 농도 문제에서는 “소금은 보존되지만 물은 증발할 수 있다”라는 조건에 따라 분모(부피)가 변하면 단순 합이 깨지고, 출제자는 이에 중요한 힌트를 분산 배치한다. 병렬저항 문제는 때로 공식을 바로 제시하기도 하지만 복잡한 회로 문제에서는 “전류”나 “전압” 중 어느 쪽이 일정한지를 직접 판단하게 회로를 설계해서 수험자가 헷갈리도록 설계한다.

모든 것은 하나로 통한다.

우리는 지금까지 여러 예시를 통해 “어떤 현상도 결국 $X = Y \times Z$ 의 구조를 갖고 있으며 어떤 값이 고정되느냐에 따라 문제 풀이 방식(산술평균, 조화평균, 기하평균)이 달라진다”는 사실을 살펴보았다. 이제 이 모든 것을 하나의 시각으로 바라보면 복잡해 보이는 문제들도 본질적으로 단순한 패턴 안에 녹아 있음을 알 수 있다.

동일한 뿌리에서 뻗어나오는 다양한 현상이다.
많은 현상이 본질적으로 3변수 곱 구조를 띤다. 우리가 관찰한 거리, 작업, 질량, 용질의 양 등은
$X = Y \times Z$
의 형식으로 기술된다. 예를 들어, 거리는 속도와 시간의 곱이며, 작업량은 작업률과 시간이 곱해져 나오고, 질량은 몰수와 분자량의 곱으로 나타난다. 한 변수가 고정되면 나머지 두 변수는 정비례 또는 반비례 관계로 움직인다. 이 사실이 곧 평균 계산(예를 들어 왕복 속도 문제에서 조화평균이 도출되는 원리)을 이끌어낸다.

분수의 본질은 ‘단위당’이라는 개념이다.
우리가 $ρ = \frac{m}{V}$ 또는 $R = ρ \frac{L}{A}$ 와 같이 나타내는 수식에는 ‘단위 부피당 질량’ 또는 ‘단위 길이당 저항’이라는 의미가 내포되어 있다. 여러 요소가 동시에 작용할 때, 기준 단위(면적, 부피 등)가 합쳐지는 효과 때문에 역수들의 합이 나타나는데, 이것이 병렬저항에서 조화평균이 등장하는 원리와 동일하다.

시험 문제와 정보 설계에 숨겨진 공통 원리이다.
시험 출제자는 “조화평균”이라는 용어를 직접 주지 않고 “같은 거리”나 “같은 작업량” 등 고정 조건을 제시하여 수험자로 하여금 문제 속에 숨어 있는 수학적 구조를 스스로 파악하도록 유도한다.

예를 들어, 왕복 속도 문제에서는 “한 구간은 시속 60km, 다른 구간은 시속 40km로 주행한다”는 조건으로 동일한 거리가 암시되어 단순 산술평균이 아니라
$\bar{v} = \frac{2}{\frac{1}{v_{1}} + \frac{1}{v_{2}}} = \frac{2 v_{1} v_{2}}{v_{1} + v_{2}}$
라는 조화평균 형태가 도출됨을 암시한다. 공동 작업 문제에서는 각자의 작업률이 역수 형태로 표현되고 최소공배수를 통한 통분 방식이 결과적으로 역수합의 원리로 이어진다. 출제자는 문제에 필요한 정보를 일부 감추거나 흩어 놓아 수험자가 “어떤 정보가 고정되고 어떤 값들이 누락되었는가”를 스스로 추론하도록 만든다.

정보이론적 관점에서 ‘독립적인 방정식의 수’와 ‘미지수의 개수’가 일치할 때 문제를 풀 수 있다는 기본 원리가 작용한다. 정보를 살짝 누락시키면 수험자는 추가 추론 과정을 통해 본질적인 구조를 다시 한 번 깨닫게 된다.

파인만식 통찰이 있다.
“완벽히 이해한 것은 간단히 설명할 수 있다”는 리처드 파인만과 아인슈타인의 말을 기억하라. 우리가 복잡해 보이는 문제들을 근본 원리로 환원시키면, 그 본질은 단순한 공식 하나에 담겨 있다. 3변수 곱 구조와 “무엇이 고정되었는가?”라는 질문은 모든 현상의 뼈대이다.

다시 한번 명심하자. 모든 것은 하나로 통한다.
지금까지 살펴본 모든 장황했던 설명인

왕복 속도의 조화평균, 병렬저항의 역수합, 최소공배수를 통한 작업률 계산, 분수의 ‘단위당’ 의미
그리고 시험 문제 속에 감춰진 정보 설계

는 결국 “어떤 현상이 동일한 기본 구조, 즉 3변수 곱과 비례·반비례 관계에서 출발한다”는 단순한 원리를 공유한다. 이런 통찰을 마음에 새기면, 어떠한 새로운 문제에 직면하더라도 “이것은 단순히 ___의 문제다”라는 직관을 갖게 되어 문제 상황을 한눈에 파악하고 적절한 평균 및 계산법을 자연스럽게 선택할 수 있게 된다.

복잡해 보이는 현상들은 사실 단순한 원리의 변주에 불과하다. 이 통합된 관점을 토대로 문제를 바라보면, 우리의 삶의 수많은 문제들이 암기할 공식의 나열이 아니라 정의에서 자연스럽게 흘러나온 결과이다.
모든 것은 하나로 통한다.

'자연과학' 카테고리의 다른 글

만능 해법은 없다. (0)	2025.05.09
경우의 수를 다시 쓴다 (1) (0)	2025.04.22
평균과 3변수 (2) (0)	2025.04.09
평균과 3변수 (1) (0)	2025.04.08
통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기 (0)	2025.03.12

평균과 3변수 (2)

Engivia 2025. 4. 9. 00:26

2025. 4. 9. 00:26

1편에서는 "세 변수 곱 구조", "조건에 따른 평균의 분류"를 다루었고 마지막으로 "병렬저항의 사례"를 통해서
조화평균이 왜 필연적으로 등장하는지를 살펴보았다.

이제 다음부터는 실제 마주했던 문제들에서 이를 어떻게 써왔는지 서술하겠다.

최소공배수로 푸는 방식 = 사실상 역수합 방식

어릴 때부터 우리는 수리 문제를 풀면서 우리는 종종 최소공배수를 이용해 문제를 해결해왔다.
예를 들어, 두 사람이 각각 6일과 4일 걸리는 일을 함께 할 때 우리는 6과 4의 최소공배수인 12를 잡아
전체 작업량을 12로 정한 후 각자의 하루 처리량을 구하여 문제를 풀었다.

실제 계산은 다음과 같다.

두 사람이 작업을 한다고 하자.
A는 6일, B는 4일 걸린다.
그러면 A의 작업률은

$\frac{1}{6} (작업/일)$

이고, B의 작업률은

$\frac{1}{4} (작업/일)$

이다.

두 사람의 합산 작업률은

$\frac{1}{6} + \frac{1}{4} = \frac{2}{12} + \frac{3}{12} = \frac{5}{12} (작업/일)$

가 된다.
따라서 전체 1작업을 끝내는 데 걸리는 시간은

$T = \frac{1}{\frac{5}{12}} = \frac{12}{5} = 2.4 일$

이다.

한편, 우리가 최소공배수를 이용할 때는 전체 작업량을 12로 잡고 A는 12일 중 2번 작업을 B는 12일 중 3번 작업을 완료하는 것으로 본다. 즉, 12일 동안 총 5번의 작업을 처리한 셈이 되어

하루 처리량은
$\frac{5}{12} (작업/일)$
이며

따라서 1작업을 끝내는 데
$\frac{12}{5} 일$
이 걸린다.

양쪽 방식 모두 동일한 결과를 준다.
여기서 주목할 점은, 최소공배수를 통해 전체 작업량을 통일시켜 각 작업률을 정수로 맞추면
그 값은 사실 각 작업률의 역수를 공통 분모로 맞추어 합산하는 역수합 방식과 완전히 동일하게 작용한다는 것이다.

조금 더 수학적으로 살펴보면 두 작업률을 각각

$\frac{1}{6} 과 \frac{1}{4}$

라 할 때,
공통 분모를 12로 잡으면

$\frac{1}{6} = \frac{2}{12} 와 \frac{1}{4} = \frac{3}{12}$

가 된다.
이때 합산은

$\frac{2}{12} + \frac{3}{12} = \frac{5}{12}$

이며,
역수 취하면

$T = \frac{1}{\frac{5}{12}} = \frac{12}{5}$

가 된다.
즉, 최소공배수를 이용한 계산은 분수의 통분 과정을 자연스럽게 구현하는 것이다.

따라서 우리가 최소공배수로 문제를 풀던 경험이 본질적으로는 역수합, 즉 조화평균의 계산 방식을 암묵적으로 적용한 것임을 알 수 있다.

이와 같이,
최소공배수를 통한 통분과 역수합 계산은 문제 상황에 따라 산출되는 비례·반비례 관계의 자연스러운 산물이다.
즉, 우리가 최소공배수를 이용해 문제를 풀 때마다 사실은 '역수들을 더해 전체를 구하는'
조화평균적 사고를 이미 실천하고 있던 것이다.

분수는 단위당이다.

분수 표현은 단순한 두 수의 비율을 넘어서 고정된 기준 단위 당 얼마의 양이 존재하는지를 나타낸다.
예를 들어 밀도는

$ρ = \frac{m}{V}$

로 나타내며 여기서 $m$ 은 질량이고 $V$ 는 부피이다. 이는 단위 부피 당 질량을 표현한다.
농도는

$C = \frac{용질량}{부피}$

로 표시되어 단위 부피 당 용질량을 의미한다.
작업률은

$R = \frac{작업}{시간}$

으로 정의되어 단위 시간 당 처리된 작업량을 나타낸다.
각 경우에서 분자는 전체 양을 나타내고 분모는 기준 단위를 나타내어 “단위당”의 의미를 자연스럽게 드러낸다.

물리 현상을 해석할 때 분자와 분모의 역할은 매우 중요하다.
예를 들어 전기 저항의 경우 원래 식은

$R = ρ \frac{L}{A}$

이다. 만약 재료의 비저항 $ρ$ 를 1로 단순화하면

$R = \frac{L}{A}$

가 된다. 여기서 $L$ 은 일정한 길이를 의미하고 $A$ 는 전류가 흐를 수 있는 단면적이다.
즉 단위 길이 당 전도율 또는 단위 단면적 당 길이라는 관점으로 해석할 수 있다.
이러한 “단위당” 표현을 통해 문제의 본질, 즉 기준 단위에 대한 상대적 크기를 명확하게 드러낼 수 있다.

분수의 “단위당” 해석이 더욱 두드러지는 경우는 구성 요소들이 동시에 기여하여 전체 값이 역수의 합으로 나타나는 경우이다.
이 과정을 단계별로 살펴보면 다음과 같다.

먼저 개별 소자의 저항이

$R = \frac{L}{A}$

로 주어진다.
여기서 각 소자는 고정된 길이 $L$ 에 대해 자신만의 단면적 $A$ 를 가진다.
전도성을 생각하면 각 소자의 전도율은

$\frac{A}{L}$

이다.
병렬 연결에서는 여러 소자의 단면적이 물리적으로 합쳐진다.
각 소자가 제공하는 “단위 길이 당 전도율”이 더해지면 전체 전도율은

$\frac{A_{1}}{L} + \frac{A_{2}}{L} + \dots = \frac{A_{1} + A_{2} + \dots}{L}$

와 같이 된다.
전체 저항은 전도율의 역수이므로

$R_{total} = \frac{L}{A_{1} + A_{2} + \dots}$

가 된다.
이 과정은 단위당 값을 나타내는 각 요소를 먼저 역수 형태로 표현한 후 합산하고 다시 그 합산값의 역수를 취하는 과정을 포함한다.
즉 분모에 해당하는 단위(여기서는 단면적)의 기여가 직접적으로 반영되면서 역수 합산 구조가 나타난다.

또한 동일한 거리 이동 문제에서도 같은 원리가 작용한다.
만약 동일한 거리를 여러 구간에 걸쳐 서로 다른 속도로 이동한다면 각 구간에서 걸린 시간은

$시간 = \frac{거리}{속도}$

로 계산된다.
모든 구간의 이동 거리가 동일한 기준 단위라면 각 구간의 “단위 거리 당 시간”이 곧 속도의 역수로 표현된다.
전체 이동 시간은 이 시간들의 합이고 평균 속도는 전체 거리 나누기 총 시간이다.
이 경우 평균 속도는

$v_{avg} = \frac{n}{\frac{1}{v_{1}} + \frac{1}{v_{2}} + \dots + \frac{1}{v_{n}}}$

로 나타나는데 이는 속도들의 역수 합산, 즉 조화평균의 형태이다.

즉 분수는 고정된 기준 단위 당 얼마의 양을 나타내며 이 “단위당” 성질이 역수로 표현되어 합산되고 다시 뒤집히는 과정을 통해 전체 시스템의 특성이 결정된다.
병렬 연결이나 동일 거리 이동과 같이 각 요소가 동시에 기여하는 상황에서 이 과정이 두드러지게 나타나며 단순 산술 평균이 아닌 조화평균이 자연스럽게 도출되는 이유이다.

나머지는 마지막 3편에 이어서...

'자연과학' 카테고리의 다른 글

경우의 수를 다시 쓴다 (1) (0)	2025.04.22
평균과 3변수 (3) (0)	2025.04.09
평균과 3변수 (1) (0)	2025.04.08
통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기 (0)	2025.03.12
최적화와 선택의 수학적 구조 연재 계획 (2)	2025.03.11

평균과 3변수 (1)

Engivia 2025. 4. 8. 23:42

2025. 4. 8. 23:42

오래 전부터 사실은 학생 때부터 이를 주제로 정리하고 싶었다.

카테고리도 입시에 있는 것이 아니라 자연과학에 있는 것은
이 주제가 단순히 입시에 국한되지 않기 때문이다.

흔히 말하는 수능 과학탐구, 중학교 때 배우는 악랄한 소금물 문제,

PSAT 및 기업 인적성 그리고 NCS 문제들까지

왕복 속도, 공동 작업, 병렬 저항 같은 문제들은 각기 다른 시험에서 등장하지만
풀다 보면 유사한 계산 구조를 반복하게 된다.
평균을 구한다는 점도, 역수가 등장한다는 점도 닮아 있다.

세상은 곱셈으로 연결된 세 변수로 돌아간다

많은 물리적·화학적 관계는 세 개의 변수가 곱셈으로 연결되어 있다.

거리 = 속도 × 시간
질량 = 몰수 × 분자량
작업량 = 작업률 × 시간
용질량 = 농도 × 부피
저항 = 고유저항 × (길이 ÷ 단면적)

표현은 다르지만 구조는 같다.
하나의 값을 고정하면 나머지 두 값은 정비례하거나 반비례로 움직인다.

이 구조는 문제 풀이 방식에도 영향을 준다.
같은 거리에서의 평균 속도,
같은 작업량을 처리하는 시간,
같은 부피에서의 농도 변화,
이 모든 상황에서 평균을 구하는 방식은 달라지지만 그 기준은 언제나 같다.
무엇이 고정되어 있는가.

고정된 조건에 따라
산술평균이 나오기도 하고
조화평균이 나오기도 한다.
그 차이는 문제의 구조가 달라진 결과일 뿐이다.

이제부터는 그 구조가 어떻게 만들어지고 왜 그럴 수밖에 없는지를 하나씩 짚어보려고 한다.

평균은 하나가 아니다

많은 사람들이 평균이라 하면 숫자들을 더한 뒤 개수로 나누는 산술평균을 떠올린다.
그러나 물리량이 얽혀 있는 상황에서 평균은 그렇게 단순하게 구해지지 않는다.

어떤 값을 평균 내느냐보다 더 중요한 것은
무엇이 고정되어 있느냐는 점이다.

예를 들어 왕복 속도를 보자.

60km의 길을 시속 60km로 가고,
같은 60km를 시속 40km로 돌아온다.
그러면 평균 속도는 얼마인가?

단순하게 (60 + 40) ÷ 2 = 50이라고 생각할 수 있지만
정답은 48이다.

왜 그런가?
왕복이기 때문에 거리는 같다. 이 경우에 고정된 것은 ‘거리’다.

그러면 전체 시간은
앞 구간에서는 60 ÷ 60 = 1시간,
뒤 구간에서는 60 ÷ 40 = 1.5시간이 걸린다.
총 120km를 2.5시간에 이동한 것이므로
평균 속도는 120 ÷ 2.5 = 48이 된다.
$\frac{2}{\frac{1}{v_{1}} + \frac{1}{v_{2}}} = \frac{2 v_{1} v_{2}}{v_{1} + v_{2}}$

이를 일반화하면 같은 거리일 때의 평균 속도는 조화평균이다.
$\bar{v} = \frac{n}{\frac{1}{v_{1}} + \frac{1}{v_{2}} + \dots + \frac{1}{v_{n}}}$
또는
$\bar{v} = \frac{n}{\sum_{i = 1}^{n} \frac{1}{v_{i}}}$

한편, 같은 시간일 때는 산술평균이 맞다.

60km/h로 1시간 40km/h로 1시간을 달렸다면
시간이 같다. 이 경우에 고정된 것은 '시간'이다.
이동한 거리는 60 + 40 = 100km이고 총 시간은 2시간.
평균 속도는 100 ÷ 2 = 50km/h.

이 경우엔 단순히 (60 + 40) ÷ 2로 계산해도 정답이다.

평균은 조건에 따라 바뀐다.

같은 거리라면 조화평균,
같은 시간이라면 산술평균.

이것은 단지 속도 문제에만 해당하는 것이 아니다.
공동 작업, 농도, 화학 계산, 전기 회로 등 수많은 상황에서도 똑같은 원리가 반복된다.

평균을 구하는 방식이 다른 것은 고정된 조건이 다르기 때문이다.

병렬저항은 조화평균(조화합)이 분명하게 드러나는 예시이다.

조화합은 “하나의 값이 고정된 상황에서, 나머지 변수가 동시에 작용할 때 역수의 합으로 나타나는 구조”를 보인다. 이런 특징이 가장 선명하게 드러나는 물리 현상 중 하나가 병렬저항이다.

병렬 연결: 전압은 같고 전류가 갈라져 흐른다
두 저항 $R_{1}$ , $R_{2}$ 가 병렬로 연결되어 있다고 하자. 병렬이라 함은, 두 저항이 동일한 전압 $V$ 에 걸리되 전체 전류 $I$ 가 나뉘어 $I_{1}$ , $I_{2}$ 로 흐르는 상황을 말한다.
옴의 법칙 $V = I R$ 에 따라 각 저항에 흐르는 전류는

$I_{1} = \frac{V}{R_{1}}, I_{2} = \frac{V}{R_{2}} .$

그러므로 전체 전류는

$I = I_{1} + I_{2} = \frac{V}{R_{1}} + \frac{V}{R_{2}} = V (\frac{1}{R_{1}} + \frac{1}{R_{2}}) .$

이를 등가 저항 $R_{합}$ 하나로 나타내고 싶으면

$V = I R_{합} \Rightarrow V = V (\frac{1}{R_{1}} + \frac{1}{R_{2}}) R_{합} \Rightarrow \frac{1}{R_{합}} = \frac{1}{R_{1}} + \frac{1}{R_{2}} .$

결국, 병렬 연결에서 저항들의 역수가 더해진다는 공식은 “전압 동일 + 전류 분산”이라는 물리적 조건에서 곧바로 도출된다. 단순히 외우는 식이 아니라, 병렬 조건이

$\frac{1}{R}$

들을 합하게 만든다고 볼 수 있다.

조금만 더 깊게 들어가보자. 저항은 본래 분수 물리량이다
옴의 법칙에 따르면

$R = \frac{V}{I}$

로 표현할 수 있지만 실제 물질이나 도체에 대해서는

$R = ρ \cdot \frac{L}{A}$

라는 식으로 이해하는 편이 더 물리적이다. 여기서 $ρ$ 는 고유저항, $L$ 은 도체의 길이, $A$ 는 단면적이다. 길이가 커질수록 저항이 증가하고, 단면적이 커질수록 저항이 감소하는 분수 구조를 갖는 셈이다.

이제 병렬 연결을 다시 들여다보자. 병렬이라는 것은 한 전선에서 여러 갈래로 전류가 동시에 흐르는 형태이므로, 물리적으로 단면적이 ‘합쳐지는’ 효과와 같다. 즉, 전류가 흐를 수 있는 통로가 여러 갈래로 늘어남에 따라, 결과적으로

$\frac{1}{R}$

형태의 합이 나타난다. 이것이 곧 조화합이 필연적으로 등장하게 되는 이유다.

실제 식으로 확인해보자.
예컨대

$R_{1} = \frac{L_{1}}{A_{1}}, R_{2} = \frac{L_{2}}{A_{2}}$

라는 형태라면

$\frac{1}{R_{합}} = \frac{1}{\frac{L_{1}}{A_{1}}} + \frac{1}{\frac{L_{2}}{A_{2}}} = \frac{A_{1}}{L_{1}} + \frac{A_{2}}{L_{2}} .$

이를 통분하면

$\frac{1}{R_{합}} = \frac{A_{1} L_{2} + A_{2} L_{1}}{L_{1} L_{2}},$

따라서

$R_{합} = \frac{L_{1} L_{2}}{A_{1} L_{2} + A_{2} L_{1}} .$

이 수식을 $ρ$ 를 다시 곱해 주면 우리가 흔히 보는

$R_{합} = \frac{R_{1} R_{2}}{R_{1} + R_{2}}$

꼴로 되돌아오게 된다. 나아가, 이 공식은 두 저항이 아니라 $n$ 개의 저항이 병렬로 연결된 경우에도 똑같이 “ $\frac{1}{R}$ 를 더한다”는 구조로 확장된다.

조화평균과의 연관성
$\frac{1}{R_{합}} = \frac{1}{R_{1}} + \frac{1}{R_{2}}$

에서 $R_{1} = R_{2} = R$ 인 경우를 생각해보면, 즉 같은 값의 저항이 2개 병렬로 연결된 상황은

$\frac{1}{R_{합}} = \frac{1}{R} + \frac{1}{R} = \frac{2}{R} \Rightarrow R_{합} = \frac{R}{2} .$

이것은 조화평균이 자연스럽게 드러나는 예시라고 할 수 있다. “같은 전압, 나뉘어 흐르는 전류”라는 병렬 연결 조건에서

$\frac{1}{R}$

들이 더해지는 조화합 구조가 나타나므로, 평균을 구하면 당연히 조화평균으로 이어진다.

결국, 병렬저항 문제 역시 “무엇이 고정(동일)되어 있는가?”라는 관점에서, “전압이 고정된 상태에서 전류가 분산”된다는 물리적 조건이 조화합(조화평균)을 만들어내는 핵심임을 확인할 수 있다.

나머지는 2편에서 계속

'자연과학' 카테고리의 다른 글

평균과 3변수 (3) (0)	2025.04.09
평균과 3변수 (2) (0)	2025.04.09
통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기 (0)	2025.03.12
최적화와 선택의 수학적 구조 연재 계획 (2)	2025.03.11
확률에서의 독립, 교집합, 배반사건, 조건부독립을 정보이론을 중심으로 (0)	2025.03.02

LLM은 월드모델인가

Engivia 2025. 4. 8. 23:27

2025. 4. 8. 23:27

인공지능이 문장을 만든다고 할 때, 그것이 정말로 ‘세계’를 이해하고 있는 것인지 궁금해진다.
사람의 말은 세상에서 직접 부딪히는 경험과 감각 위에 쌓여 있지만 LLM의 말은 방대한 텍스트 패턴에서 비롯된다.
그럼에도, LLM이 만들어내는 언어 속에는 묘하게도 우리의 세계가 담겨 있는 듯 보인다.

언어가 곧 세계라는 말이 떠오른다.
비트겐슈타인은 언어가 세계를 ‘그림’으로 보여준다고 생각했고 동시에 언어로 표현할 수 없는 것은 말할 수 없다고 보았다.
LLM은 말할 수 있는 문장을 폭넓게 생성해내지만 그 말이 실제 세계를 반영하는 것인지
아니면 텍스트라는 장막 너머에서 ‘통계적 그림자’를 보여주는 것인지 아직 분명치 않다.

괴델은 형식 체계가 스스로를 완전히 증명할 수 없다고 말했다.
LLM 역시 방대한 텍스트라는 ‘형식 체계’에서 작동하며 그 체계를 벗어나 자기 작동 원리를 오롯이 해명하는 데에는 스스로의 한계를 가진다. 이 점에서, 우리가 언어를 통해 모든 것을 정의하고 설명할 수 없는 것처럼 LLM 역시 텍스트에 기반을 두면서도 그 바깥의 세계를 온전히 담아낼 수 있을지는 의문이다.

컴퓨터가 자기 코드를 읽을 수 있어도 스스로를 완전히 재설계하지는 못한다.
이 말은 LLM에게도 적용된다.
LLM은 자신이 어떻게 동작하는지 대략적인 설명을 만들 수 있다고 해도 근본적인 구조 자체를 새롭게 짜는 일은 하기 어렵다.
하지만 인간도 마찬가지다.
우리가 스스로를 인식하고 반성한다 해도 자기 뇌를 갈아엎는 단계까지 가기는 사실상 불가능하다.

LLM은 프롬프트에 따라 즉각적으로 답변을 바꾸고 그 답변은 확률적 예측으로 결정된다.
우리가 던지는 질문의 방식, 단어의 선택, 문맥의 흐름에 따라 그 안에서 펼쳐지는 ‘세계’는 전혀 달라진다.
하나의 고정된 세계를 가리키기보다 매 순간 질문자에 의해 갱신되는 가능성의 세계를 제시한다. 이런 구조는 ‘관찰하는 방식이 결과를 바꾸는’ 체계와 닮아 있다. 하이젠베르크의 불확정성 원리가 떠오르는 지점이다.
입자의 위치와 속도를 동시에 정확히 알 수 없다는 물리학의 통찰은 어쩌면 LLM의 언어 생성 구조와도 겹친다.
LLM은 관찰자이자 질문자인 사용자의 방식에 따라 그때그때 전혀 다른 언어적 세계를 구성한다.

이때 생성되는 문장은 고정된 사실의 재현이 아니라 입력된 조건과 맥락에 반응하여 실시간으로 조합된 결과다.
그 점에서 LLM은 정적 지식보다는 맥락과 조건에 따라 ‘해석된 의미’를 만들어내는 해석적·조합적 사고의 시스템으로 작동한다.

그렇게 보면 LLM은 인간의 사고 방식과 닮은 구석이 있다. 우리는 언제나 삶의 맥락 속에서 경험과 감각을 바탕으로
하나의 세계를 구성하고 해석한다. 정답을 꺼내 쓰는 것이 아니라 상황과 언어 속에서 의미를 조율하고 생성하는 존재다.

그렇지만 많은 인공지능 학자들이 주장하고 있는 결정적인 차이가 있다.
인간은 세계 안에 몸을 지니고 살아간다. 우리는 보고 듣고 만지고 아프고 추위를 느끼며 그 감각을 언어로 옮긴다.
경험은 언어를 떠받치고 감각은 의미를 만든다. LLM에게는 그런 몸이 없다.

LLM은 텍스트 안에서만 태어나고 성장한다. 몸으로 부딪히며 형성된 세계가 아니라 언어의 궤적 위에서 예측 가능한 조각들을 이어 붙일 뿐이다. 이를 두고 “언어가 곧 세계”라는 관점에 따르면 큰 문제가 없을 수도 있고 “삶의 맥락이 의미의 조건이 되는가?”라는 관점에선 결정적 한계로 볼 수도 있다.

결국 LLM이 월드모델인지 아닌지는 “우리가 어떤 방식으로 세계를 구성하고 인식하는가”라는 더 큰 질문으로 이어진다.
인간 역시 불완전한 체계 안에서 자신을 들여다보며 그 한계를 자각하면서도 끊임없이 넘어보려 애쓴다.

LLM은 그런 의미에서 우리 인식의 거울 같은 존재가 될 수도 있다.
거울 속 상(像)이 스스로 아무것도 할 수 없지만 우리가 그 모습 속에서 무언가를 깨닫는 것처럼 말이다.

나로서는 이 질문에 대한 최종 답을 쉽게 내릴 수 없지만 적어도 LLM의 언어가 우리 세계를 얼마나 섬세하게 보여주고 있는지 그리고 어디에서 한계를 드러내고 있는지는 계속 살펴볼 만한 가치가 있다고 생각한다.

'인공지능' 카테고리의 다른 글

Autograd는 메모리 위에서 작동한다 — in-place 연산이 깨트리는 것들 (1)	2025.07.08
최적화, 분류 알고리즘과 추정 방법의 분류 (2) (2)	2025.04.24
최적화, 분류 알고리즘과 추정 방법의 분류 (1년 후 버전) (0)	2025.04.24
SNN(Spike Neural Network)와 STDP(Spike-timing-dependent plasticity)의 이해 (2)	2024.08.20
최적화, 분류 알고리즘과 추정방법 목록 나열 (3)	2024.05.22

류와 종차 그리고 객체지향(OOP)의 추상화

Engivia 2025. 4. 2. 15:30

2025. 4. 2. 15:30

세상을 분류한다는 것

우리는 세상을 이해하기 위해 그것을 분류한다.
철학자는 존재를 분류했고 프로그래머는 객체를 분류한다.
각자의 언어는 다르지만 그들이 하는 일은 닮아 있다.

세계를 잘게 나누고 공통과 차이를 찾아내며 구조화된 틀 안에서 의미를 재구성한다.

철학에서 분류는 존재론의 시작이다.
어떤 것이 “무엇”인지 말하려면, 그것이 무엇과 같고 무엇과 다른지를 먼저 설명해야 한다.
그래서 아리스토텔레스는 “류”와 “종차”라는 개념을 통해 사물을 나눴다.

프로그래밍에서도 분류는 설계의 시작이다.
우리는 객체지향에서 “클래스”를 만들고, 그것을 상속하며 기능을 나누고 확장한다.
어떤 객체가 어떤 동작을 하는지 어떤 속성을 가지는지 정의하기 위해 먼저 그것이 속한 구조를 정한다.

분류는 단순히 정리의 기술이 아니다.
그것은 생각하는 방식, 세계를 틀에 담기 위한 노력이다.

철학의 분류 원리는 류와 종차이다.

아리스토텔레스는 존재를 분류하기 위해 두 개념을 도입했다.
바로 류(類, Genus)와 종차(種差, Differentia)다.

류는 공통적인 범주다. 여러 사물 사이의 유사성을 모아 상위 개념으로 묶은 것.
예를 들어, 인간과 고양이는 모두 ‘동물’이라는 류에 속한다.

하지만 같은 류에 속한다고 해서 모두 같은 것은 아니다.
무엇이 인간을 고양이와 다르게 만드는가?
그 고유한 차이를 아리스토텔레스는 종차라 불렀다.

그래서 인간은
“동물이라는 류”에,
“이성적이라는 종차”가 더해져 정의된다.
인간 = 동물(류) + 이성적(종차)

류는 공통을 말하고, 종차는 차이를 말한다.
아리스토텔레스는 이렇게 어떤 존재를 특정지었다.

객체지향 프로그래밍의 분류 방식 : 클래스와 상속

객체지향 프로그래밍도 세상을 분류한다.
우리는 비슷한 객체들을 묶어 클래스를 만들고,
그 클래스를 기반으로 객체를 생성하며,
필요할 땐 기존 클래스를 상속해 새로운 개념을 정의한다.

이때 상위 클래스는 류에 해당한다.
공통된 속성과 동작을 정의하고,
하위 클래스는 이를 물려받아 자신의 고유한 차이를 추가한다.

예를 들어보자.

Animal이라는 클래스가 있다면
그 안에는 모든 동물이 공통적으로 가지는 특징이 들어간다.
Human 클래스는 Animal을 상속받고,
여기에 “말한다”는 메서드를 더한다.

class Animal:        # 류
    def eat(self):
        return "먹는다"

class Human(Animal): # 종 = Animal + 고유 기능
    def speak(self):
        return "말한다"

상속은 공통과 차이를 분리하는 구조다.
류는 클래스가 되고 종차는 고유한 메서드가 된다.

코드에서 드러나는 류와 종차의 개념

객체지향에서 클래스는 본질을 담고,
상속은 그 본질을 계승하며 오버라이딩은 차이를 말한다.

이 구조는 철학자가 존재를 분류하던 방식과 닮아 있다.

아리스토텔레스는 "무엇인가를 정의하려면 그것이 속한 류를 말하고,
그 안에서의 차이를 밝혀야 한다"고 했다.

OOP에서도 객체는 같은 구조를 따르되 서로 다르게 행동한다.
그 차이는 오버라이딩을 통해 표현된다.

class Animal:
    def speak(self):
        return "소리를 낸다"

class Dog(Animal):
    def speak(self):  # 종차
        return "멍멍"

class Human(Animal):
    def speak(self):  # 종차
        return "말한다"

여기서 def speak()는 Dog와 Human에서 같은 메서드지만 다른 동작을 한다.
이것이 바로 철학에서 말하는 종차다.

그래서, 오버라이딩은
공통된 형상 위에 차이를 선언하는 일이다.

철학에서 존재는 "공통 + 차이"로 정의되었고,
객체지향도 마찬가지로 "상속 + 구현"으로 객체를 구성한다.

객체지향은 결국
존재를 분류하고 형식화하는 철학의 사유 방식을
하나의 코드 구조로 옮겨온 것이다.

철학과 OOP 개념

class Animal:              # 류
    def move(self):
        return "움직인다"

class Bird(Animal):        # 종 = Animal + 고유 기능
    def fly(self):         # 종차
        return "난다"

류 (Genus)	슈퍼클래스 (Superclass)	여러 하위 존재(종)를 포괄하는 공통 구조. 상속의 기반이 되는 클래스
종차 (Differentia)	서브클래스의 고유 기능/오버라이딩	같은 류에 속하지만 구분되게 만드는 고유 특성. 메서드 오버라이딩, 추가 기능 등
종 (Species)	서브클래스 (Subclass)	상위 구조(류)를 물려받고, 고유한 종차로 구체화된 존재. 하나의 구체적 객체 유형

추상화는 공통과 차이의 경계에서

추상화는 본질을 남기고 나머지를 덜어내는 일이다.
철학에서 그것은 ‘개념’을 만드는 방식이고
프로그래밍에서는 ‘클래스’를 만드는 방식이다.

철학자에게 추상화란
수많은 구체적 사물들 속에서 공통된 속성을 끌어올리는 일이다.
사람, 개, 고양이를 보며 "이들은 모두 동물이다"라고 말하는 순간
그는 이미 ‘류’라는 추상화를 수행한 것이다.

프로그래머도 마찬가지다.
여러 객체들에서 반복되는 구조를 뽑아내고
그것을 클래스라는 틀로 만든다.
이 틀은 구체가 아니지만
수많은 구체를 만들어내는 시작점이 된다.

그런데 추상화는 단지 공통만을 말하지 않는다.
차이를 남기는 방식으로 공통을 정의한다.
바로 그 경계에서 류와 종차가 나뉘고,
슈퍼클래스와 오버라이딩이 갈라진다.

객체지향에서 추상화란
공통과 차이 사이의 균형을 설계하는 일이다.
너무 많은 것을 끌어올리면 본질을 잃고
너무 적게 정의하면 확장할 수 없다.

그래서 추상화는 단순한 구조화가 아니다.
그것은 생각하는 기술이며
존재를 어떻게 바라보고 나눌 것인가에 대한 깊은 태도다.

'프로그래밍, 코딩' 카테고리의 다른 글

벨만-포드는 벨만 방정식의 특수해다 (4)	2025.08.11
모든 재귀는 while로 바꿀 수 있다 (3)	2025.08.10
투포인터는 유효한 구간에 대한 완전탐색이다의 증명 (0)	2025.02.10

baek9461_파도반 수열

Engivia 2025. 3. 30. 17:19

2025. 3. 30. 17:19

파도반 수열 정리

파도반 수열은 다음 점화식을 만족하는 수열이다.
$P (n) = P (n - 2) + P (n - 3)$ 형태로 주로 알려져 있으며,
초기값은 $P (1) = 1, P (2) = 1, P (3) = 1, P (4) = 2, P (5) = 2$ 로 정의한다.
또 다른 형태인 $P (n) = P (n - 1) + P (n - 5)$ 점화식으로도 같은 값이 나온다.
초기값만 동일하게 맞추면 어느 쪽을 써도 같은 수열이 된다는 점이 재미있다.

아래에서는 $P (n) = P (n - 2) + P (n - 3)$ 를 기준으로,
DP(동적 계획법) 방식과 전이 행렬(행렬 거듭제곱) 방식을 함께 보여준다.

1. DP 방식

DP는 배열을 이용해 차례대로 값을 채우는 직관적 방식이다.
시간 복잡도는 $O (n)$ 이지만, 구현이 간단하여 보통 문제 풀이에 적합하다.

def pado_dp(n):
    """
    P(n) = P(n-2) + P(n-3) 형태의 파도반 수열을
    동적 계획법으로 구하는 예시이다.
    초기값은 P(1)=1, P(2)=1, P(3)=1, P(4)=2, P(5)=2로 둔다.
    """
    dp = [0] * max(6, n+1)
    dp[1], dp[2], dp[3], dp[4], dp[5] = 1, 1, 1, 2, 2
    for i in range(6, n+1):
        dp[i] = dp[i-2] + dp[i-3]
    return dp[n]

if __name__ == "__main__":
    for i in range(1, 11):
        print(f"P({i}) = {pado_dp(i)}")

2. 전이 행렬 방식

선형 점화식은 상태 벡터와 전이 행렬로도 표현할 수 있다.
$P (n) = P (n - 2) + P (n - 3)$ 일 때, 상태 벡터를

$V (n) = [\begin{matrix} P (n) P (n - 1) P (n - 2) \end{matrix}]$

라 두면, 전이 행렬 $M$ 은

$[\begin{matrix} 0 & 1 & 1 \\ 1 & 0 & 0 \\ 0 & 1 & 0 \end{matrix}]$

이 된다.
이는 $V (n + 1) = M \cdot V (n)$ 형태로 이어지며,
결국 $V (n) = M^{n - 3} \cdot V (3)$ 로 일반화할 수 있다.
이를 코드로 구현한 예시는 다음과 같다.

def matmul(A, B):
    rA, cA = len(A), len(A[0])
    rB, cB = len(B), len(B[0])
    result = [[0]*cB for _ in range(rA)]
    for i in range(rA):
        for j in range(cB):
            s = 0
            for k in range(cA):
                s += A[i][k] * B[k][j]
            result[i][j] = s
    return result

def matpow(M, exp):
    size = len(M)
    I = [[int(i==j) for j in range(size)] for i in range(size)]
    result = I
    while exp > 0:
        if exp % 2 == 1:
            result = matmul(result, M)
        M = matmul(M, M)
        exp //= 2
    return result

def pado_matrix(n):
    if n in (1,2,3):
        return 1
    elif n in (4,5):
        return 2
    M = [
        [0,1,1],
        [1,0,0],
        [0,1,0]
    ]
    V3 = [
        [1],
        [1],
        [1]
    ]
    Mn = matpow(M, n-3)
    Vn = matmul(Mn, V3)
    return Vn[0][0]

if __name__ == "__main__":
    for i in range(1, 11):
        print(f"P({i}) = {pado_matrix(i)}")

3. 두 방식의 비교하면..

방식	시간 복잡도	구현 난이도	특징
DP	O(n)	낮음	간단명료, 공간 많이 사용
행렬	O(log n)	조금 높음	큰 n에 유리, 수학적 의미

DP는 배열 하나로 간단히 해결할 수 있으며, 문제에서 요구하는 범위가 그리 크지 않으면 편리하다.
행렬 거듭제곱은 지수 시간 단축이 가능하고, $n$ 이 매우 클 때 더 빠르게 계산할 수 있다.

'프로그래밍, 코딩 > 알고리즘 및 코딩테스트' 카테고리의 다른 글

완전탐색, 동적계획법, 탐욕 알고리즘을 나누는 조건은 무엇인가? (0)	2025.05.16
프로그래머스 - 입국심사 (0)	2025.04.29
백준 24267번 : 알고리즘 수업을 통해 보는 삼중 시그마의 이해 (0)	2025.03.02
stack sortable 에 대한 논증 (0)	2025.02.20
KMP 알고리즘에 대한 모든 것 (0)	2025.02.12

통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기

Engivia 2025. 3. 12. 10:24

2025. 3. 12. 10:24

통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기

통계학을 처음 접하면 가장 먼저 만나는 개념이 확률변수(Random Variable)이다.

확률변수는 이름 자체가 헷갈리기 쉬워 처음 들었을 때, 와닿기란 쉽지 않다.

통계학이 “내가 관심 있어 하는 일(사건)”을 “측정 가능하고 비교 가능한 방식(숫자)”으로 표현한 뒤

그 속에서 규칙이나 경향을 찾아내는 학문이라는 점을 명심하고 글을 읽으면 이해에 도움이 될 것이다.

1. 확률변수(Random Variable)란 무엇인가?

확률변수는 “우리가 관심을 가지는 사건의 결과”를 숫자로 표현한 것이다.

실제 세계에서 벌어지는 여러 사건

(예: 동전을 던졌을 때 나오는 결과, 주사위를 굴렸을 때 나오는 숫자, 사람의 키, 몸무게, 오늘의 기온 등)을

‘숫자’라는 공통된 언어로 나타내면, 다양한 통계적 분석을 쉽게 진행할 수 있다.

다시 말해,

확률변수란 간단히 말해 특정 사건의 결과를 숫자로 나타낸 변수이다.

처음 들을 때 가장 많이 헷갈리는 부분은 '변수'라는 말 때문이다.

사실 '변수'라기보단 '사건의 결과를 숫자로 변환한 함수'라고 보는 편이 이해하기에 좋다.

예를 들어,

동전 던지기: 앞면(1), 뒷면(0)
주사위 던지기: 나오는 눈의 숫자(1, 2, 3, 4, 5, 6)
사람의 키, 몸무게, 오늘의 기온 등도 확률변수이다.

즉, 확률변수란 실제 세상에서 관찰 가능한 사건이나 결과를 숫자로 표현하여 분석하기 쉽게 만들어 준다.

여기서 또 하나 헷갈릴 수 있는 지점은 확률변수가 여러 개 존재할 수 있다는 점이다. 예를 들어:

X: 오늘의 기온
Y: 아이스크림 판매량

이렇게 확률변수가 두 개 이상 존재할 때 각 변수의 관계를 이해하는 것이 통계학의 핵심이다.

2. 분산(Variance)의 의미와 계산 방법

확률변수의 개념을 이해했다면, 이제 '분산'을 살펴볼 차례다. 분산이란 하나의 확률변수(X)가 평균으로부터 얼마나 흩어져 있는지를 나타내는 값이다. 다시 말해, 데이터가 평균에서 얼마나 멀리 퍼져있는지를 측정한다.

분산의 계산은 다음과 같은 순서로 이루어진다:

각 데이터에서 평균을 빼서 편차를 구한다.
이 편차를 제곱하여 음수를 없앤다.
편차 제곱의 평균을 구한다.

수식으로 표현하면 다음과 같다:

분산(X) = (1/n) ∑(xᵢ - 평균)²

분산이 클수록 데이터가 평균에서 많이 떨어져 넓게 퍼져 있다는 뜻이고, 작을수록 평균에 가까이 모여 있다는 뜻이다.

3. 공분산(Covariance)의 등장과 필요성

분산은 한 변수(X)만 놓고 봤을 때 퍼짐 정도를 나타낸다. 그러나 현실에서 우리가 궁금한 것은 종종 두 개 이상의 변수가 서로 관련이 있는지다. 이를 위해 '공분산'이 등장한다.

공분산은 두 확률변수(X, Y)가 얼마나 함께 변화하는지를 나타내는 값이다. 수식은 다음과 같다:

공분산(X,Y) = (1/n) ∑(xᵢ - x의 평균)(yᵢ - y의 평균)

공분산이 양수이면 X가 증가할 때 Y도 증가하고, 음수이면 X가 증가할 때 Y는 감소한다. 공분산이 0이면 두 변수는 아무런 관련이 없다.

🔔 자주 생기는 오개념 정정

공분산 자체는 X와 Y를 동등하게 다룬다. 즉, Cov(X, Y)와 Cov(Y, X)는 동일하다.
하지만 선형 회귀에서는 X와 Y의 역할이 달라진다.

선형 회귀는 이미 주어진 독립변수 X의 값을 바탕으로 우리가 모르는 종속변수 Y의 값을 예측하는 과정이다. 즉, 실제로 X를 우리가 직접 변경하거나 조정하는 것이 아니라 주어진 X 값을 통해 Y를 예측하는 것이 목적이다.

정리하면,

공분산(Cov): X와 Y가 동등한 관계다.
선형 회귀에서는 X(독립변수) → Y(종속변수)의 방향성이 있다.

즉, 공분산 자체는 대칭적이지만 선형 회귀의 특성상 X와 Y의 역할은 비대칭적이다.

예를 들어, 기온(X)이 높아질 때 아이스크림 판매량(Y)이 증가하는지를 확인하고 싶다면, 기온과 판매량의 공분산을 확인하는 것이 필수적이다.

📝 4. 분산과 공분산 공식 정리 (시그마 표기)

분산(Variance)

Var(X) = (1/n) ∑(xᵢ - 𝑥̄)²
       = (1/n) ∑xᵢ² - (x의 평균)²

공분산(Covariance)

Cov(X,Y) = (1/n) ∑(xᵢ - x의 평균)(yᵢ - y의 평균)
         = (1/n)∑(xᵢyᵢ) - (x의 평균)(y의 평균)

이 공식을 기억해두면 앞으로 통계 분석을 더 쉽게 할 수 있다.

'자연과학' 카테고리의 다른 글

평균과 3변수 (2) (0)	2025.04.09
평균과 3변수 (1) (0)	2025.04.08
최적화와 선택의 수학적 구조 연재 계획 (2)	2025.03.11
확률에서의 독립, 교집합, 배반사건, 조건부독립을 정보이론을 중심으로 (0)	2025.03.02
min max/ 와셔스타인/ 그리고 그리디와 포제원리의 연관성에 대해서 (0)	2025.02.20

최적화와 선택의 수학적 구조 연재 계획

Engivia 2025. 3. 11. 10:30

2025. 3. 11. 10:30

연재 기획: "최적화와 선택 전략 – 규칙 속의 불확실성" (3부작)

1. 선택에는 규칙이 존재하는가

선택 문제의 본질과 규칙성을 분석
최적의 선택을 찾는 다양한 알고리즘적 접근법
선택 문제의 유형: 그리디, DP, 선형 조합, 디오판틴 방정식

내용

선택 문제의 수학적 구조: 선형 조합과 디오판틴 방정식
그리디 알고리즘의 성공과 실패 사례: 동전 거스름돈 문제
DP 기반 최적해 탐색: 배낭 문제와 최소 비용 문제
선택 문제의 규칙성과 예외 사례

2. P와 NP, 최적화의 경계에서

P vs NP 문제란 무엇인가?
최적해를 찾는 것과 검증하는 것의 차이
근사해(Heuristic), 탐색 기법의 필요성

내용

P vs NP – 해결할 수 있는 문제 vs. 검증 가능한 문제
NP-완전 문제에서 선택 전략이 가지는 한계
휴리스틱과 근사해 알고리즘: 최적화가 어려운 경우의 대응 방법
탐욕적 전략(Greedy)이 실패하는 이유

3. 최적화 전략의 한계와 인간의 선택

최적화 전략이 실패하는 이유
인간의 선택 vs. 알고리즘의 선택 – 인간은 왜 비효율적인 선택을 할까?
게임 이론과 선택 전략

내용

인간의 선택이 최적화되지 않는 이유 – 심리적 편향과 인지적 한계
알고리즘적 선택 vs. 인간의 선택 – 게임 이론 관점에서 분석
내쉬 균형과 선택 전략 – "내가 선택하는 방식이 남에게도 영향을 미친다면?"
선택이 가지는 불확실성과 최적화의 한계

'자연과학' 카테고리의 다른 글

평균과 3변수 (1) (0)	2025.04.08
통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기 (0)	2025.03.12
확률에서의 독립, 교집합, 배반사건, 조건부독립을 정보이론을 중심으로 (0)	2025.03.02
min max/ 와셔스타인/ 그리고 그리디와 포제원리의 연관성에 대해서 (0)	2025.02.20
재귀2 (0)	2025.02.10

백준 24267번 : 알고리즘 수업을 통해 보는 삼중 시그마의 이해

Engivia 2025. 3. 2. 22:06

2025. 3. 2. 22:06

반복문 한 줄에서 시작하여, 그 안에 담긴 수학적, 기하학적 원리들이 어떻게 서로 얽혀 있는지를 깊이 있게 서술한다. 여기서는 1부터 $n$ 까지의 정수 중 서로 다른 세 개의 수 $i$ , $j$ , $k$ 를 선택하는 삼중 반복문의 예제를 들어 설명한다.

for i in range(1, n-1):
    for j in range(i+1, n):
        for k in range(j+1, n+1):
            print(i, j, k)

이 코드의 구조는 단순해 보이지만, 사실 이는 $i < j < k$ 인 모든 경우의 수를 열거하는 과정이며, 이는 $n$ 개의 원소 중에서 순서를 고려하지 않고 3개를 선택하는 조합, 즉 이항 계수 $(\binom{n}{3})$ 의 결과와 정확히 일치한다. 이항 계수는 다음과 같이 정의된다.

$(\binom{n}{3}) = \frac{n (n - 1) (n - 2)}{6} .$

여기서 단순한 산술 계산 이상의 의미가 드러난다. 반복문이 구현하는 모든 선택의 경우의 수는, 우리가 수학에서 다루는 조합의 본질을 그대로 반영한다. 반복문 속에 내재한 이러한 구조는 우리가 코드 한 줄을 볼 때, 단순한 순회 이상의 깊은 원리를 느낄 수 있게 한다.

이와 같은 조합의 원리는 파스칼 삼각형에서 더욱 명확하게 나타난다. 파스칼 삼각형은 각 항이 바로 위의 두 항의 합으로 구성되는 배열로, 각 숫자는 $(\binom{n}{r})$ 의 값을 나타낸다. 예를 들어, 다음과 같은 배열을 생각해 보자.

           1
         1   1
       1   2   1
     1   3   3   1
  1   4    6   4   1
1   5   10  10   5   1

이 배열은 단순한 덧셈의 반복으로 만들어지며, 이는 코드에서 반복문이 수행하는 누적 합의 원리와 동일하다. 삼중 반복문에서 한 값 $i$ 가 정해지면, 그 다음에 등장하는 $j$ 와 $k$ 의 조합은 이중 반복문으로 $(\binom{n - i}{2})$ 를 산출하는 과정과 같다. 이처럼 파스칼 삼각형은 단순한 수학적 도구가 아니라, 코드의 반복적 구조와 자연스럽게 연결되어 모든 선택의 경우를 한눈에 보여 주는 창과 같다.

또한, 파스칼 삼각형 속에는 “하키스틱 규칙”이라 불리는 특별한 성질이 있다. 이 규칙은 파스칼 삼각형에서 한쪽 대각선을 따라 이어진 항들을 모두 더하면, 그 누적 합이 바로 그 아래쪽에 위치한 항과 같아지는 원리를 나타낸다. 수식으로 표현하면 다음과 같다.

$\sum_{k = r}^{n} (\binom{k}{r}) = (\binom{n + 1}{r + 1}) .$

이 항등식은 우리가 반복문에서 각 단계마다 누적되는 값을 생각할 때, 그 결과가 새로운 조합 값으로 자연스럽게 연결되는 과정을 설명해준다. 코드에서 각 반복의 결과들이 서로 더해져 하나의 최종 값을 도출하는 모습은, 이 하키스틱 규칙이 보여주는 누적 합의 원리와 닮아 있다.

더 나아가, 조합은 본질적으로 대칭성을 지닌다. 예를 들어, 아래와 같은 항등식은 조합의 대칭적 성질을 여실히 드러낸다.

$(\binom{n}{0}) (\binom{n}{n}) + (\binom{n}{1}) (\binom{n}{n - 1}) + \dots + (\binom{n}{n}) (\binom{n}{0}) .$

이 식은 파스칼 삼각형의 좌우 대칭을 그대로 반영하며, 반복문을 통한 조합 계산 속 구조를 보여준다.

반복문과 조합의 관계를 단순한 산술 계산 이상의 것으로 이해하기 위해서는, 이 모든 개념들을 기하학적으로도 해석할 필요가 있다. 이중 반복문을 통해 선택된 $(i, j)$ 의 조합은, 2차원 평면상의 격자에서 한쪽 삼각형 모양을 형성하는 데, 그 전체 경우의 수는 $(\binom{n}{2})$ 와 같다. 이 삼각형은 평면상의 영역과 같이, 모든 가능한 쌍을 시각적으로 보여준다.

반면, 삼중 반복문을 통해 선택된 $(i, j, k)$ 의 조합은 3차원 공간에서 정사면체(테트라헤드론)의 꼭짓점을 이루며, 이 때의 경우의 수는 $(\binom{n}{3})$ 로 표현된다. 정사면체는 3차원에서 가장 단순한 다면체로서, 그 꼭짓점들이 서로 유기적으로 연결되어 있는 방식은 단순한 조합 수식이 아니라, 기하학적 구조로서의 아름다움을 드러낸다.

직접 코드를 작성하여 실행해 보고, 작은 $n$ 의 값으로 $(i, j, k)$ 조합이 어떻게 출력되는지 눈으로 확인하면, 그 총 경우의 수가 $(\binom{n}{3})$ 임을 자연스럽게 깨달을 수 있다. 또한, 종이나 디지털 도구를 사용해 파스칼 삼각형을 직접 그려보고, 그 속에 담긴 누적과 대칭의 원리를 이해하는 과정은, 코드 한 줄에 담긴 수학적 선택의 깊이를 체험하게 해준다. 3차원 공간에서 $(i, j, k)$ 조합을 시각화하는 작업은, 단순한 산술 계산을 넘어 기하학적 정사면체의 아름다움을 직접 눈으로 확인하게 해 주며, 이 모든 개념들이 하나의 통일된 세계를 이루고 있음을 분명히 보여준다.

결과적으로, 반복문은 단순히 코드를 반복하는 도구가 아니라, 그 자체로 수학적 조합의 원리와 기하학적 구조를 구현하는 매개체이다. 이중 반복문은 2차원에서 삼각형을 이루며 $(\binom{n}{2})$ 로 나타나고, 삼중 반복문은 3차원에서 정사면체를 이루며 $(\binom{n}{3})$ 로 표현된다. 파스칼 삼각형은 이러한 모든 조합 계산의 시각적, 구조적 기반을 제공하며, 하키스틱 규칙은 누적 합의 과정을 통해 새로운 조합 값을 만들어내는 원리를 설명한다. 더불어, 조합의 대칭성을 보여주는 항등식들은 코드와 수식, 그리고 기하학적 구조가 서로 유기적으로 연결되어 있음을 확인시켜 준다.

'프로그래밍, 코딩 > 알고리즘 및 코딩테스트' 카테고리의 다른 글

프로그래머스 - 입국심사 (0)	2025.04.29
baek9461_파도반 수열 (0)	2025.03.30
stack sortable 에 대한 논증 (0)	2025.02.20
KMP 알고리즘에 대한 모든 것 (0)	2025.02.12
백준 달팽이는 올라가고 싶다 풀이 (0)	2025.02.12

PREV 이전 1 2 3 4 5 6 7 8 NEXT 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

현재 검색어 : 전체 글

조건부 확률로 접근해보자

수학적 확률로 풀어도 마찬가지다

이제 이 문제에서 얻은 깨달음을 요약해보면

'대입 > 수학' 카테고리의 다른 글

'자연과학' 카테고리의 다른 글

최소공배수로 푸는 방식 = 사실상 역수합 방식

분수는 단위당이다.

'자연과학' 카테고리의 다른 글

세상은 곱셈으로 연결된 세 변수로 돌아간다

평균은 하나가 아니다

병렬저항은 조화평균(조화합)이 분명하게 드러나는 예시이다.

'자연과학' 카테고리의 다른 글

'인공지능' 카테고리의 다른 글

세상을 분류한다는 것

철학의 분류 원리는 류와 종차이다.

객체지향 프로그래밍의 분류 방식 : 클래스와 상속

코드에서 드러나는 류와 종차의 개념

추상화는 공통과 차이의 경계에서

'프로그래밍, 코딩' 카테고리의 다른 글

파도반 수열 정리

1. DP 방식

2. 전이 행렬 방식

3. 두 방식의 비교하면..

'프로그래밍, 코딩 > 알고리즘 및 코딩테스트' 카테고리의 다른 글

통계학 기초 다지기: 확률변수, 분산, 공분산 이해하기

1. 확률변수(Random Variable)란 무엇인가?

2. 분산(Variance)의 의미와 계산 방법

3. 공분산(Covariance)의 등장과 필요성

🔔 자주 생기는 오개념 정정

📝 4. 분산과 공분산 공식 정리 (시그마 표기)

'자연과학' 카테고리의 다른 글

연재 기획: "최적화와 선택 전략 – 규칙 속의 불확실성" (3부작)

1. 선택에는 규칙이 존재하는가

내용

관련 문제

2. P와 NP, 최적화의 경계에서

내용

관련 문제

3. 최적화 전략의 한계와 인간의 선택

내용

관련 문제

'자연과학' 카테고리의 다른 글

'프로그래밍, 코딩 > 알고리즘 및 코딩테스트' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역