
제1회: AI도 못 찾는 패턴이 있다
제1회: AI도 못 찾는 패턴이 있다
AI 시대가 도래하면서 한 가지 생각이 들었습니다. 이 세상의 많은 것들이 일종의 패턴을 지니고 있고, 우리는 수많은 변수와 외부적인 요인으로 인해 이를 모르고 살고 있는 것 아닐까.
유행하는 음악, 패션, 잘나가는 유튜브 영상에도 특정 패턴이 존재하지 않을까요? 실제로 AI는 이미 인간이 50년간 풀지 못한 단백질 구조를 해독했고, 2,000년 전 고대 지상화를 발견했으며, 고래의 소리에서 인간이 듣지 못한 문법 체계까지 감지해냈습니다.
AI가 대량의 데이터 분석을 통해 숨겨진 패턴을 찾아낸다면, 불치병의 원인을 발견하거나 인류가 지금까지 풀지 못했던 숙제를 해결할 수 있다고 생각합니다. 이러한 생각을 4회에 걸쳐 이야기합니다.
우리는 패턴의 시대에 살고 있습니다.
2016년, 구글 딥마인드의 알파고가 이세돌 9단을 꺾었을 때 세상은 충격에 빠졌습니다. 수천 년간 ‘신의 영역’이라 불리던 바둑에서 AI가 인간이 상상하지 못한 수를 두며 승리한 것입니다. 바둑의 경우의 수는 우주의 원자 수보다 많다고 알려져 있지만, AI는 그 안에서 인간이 보지 못한 패턴을 찾아냈습니다.
그로부터 약 10년이 지난 지금, AI의 패턴 발견 능력은 바둑판을 넘어 과학, 의학, 고고학까지 확장되고 있습니다. 50년간 풀리지 않던 단백질 구조 예측 문제를 AI가 해결해 노벨상을 받았고, 페루 나스카 사막에서 100년간 430개를 찾은 고대 지상화를 AI가 6개월 만에 303개 추가로 발견했습니다. 향유고래의 클릭 소리에서 인간이 듣지 못한 언어 체계까지 감지해냈습니다.
이런 사례들을 보면 자연스럽게 이런 생각이 듭니다.
‘세상 모든 것에 패턴이 있고, AI가 그것을 찾아낼 수 있는 시대가 온 것 아닐까?’
그래서 한 가지 실험을 해보았습니다. 한국에서 가장 대중적인 확률 게임인 로또 6/45의 전체 당첨 데이터, 1회부터 1,214회까지를 AI에 넣고 분석한 것입니다. 45개 번호 중 6개를 맞추는 이 게임에 22년치 데이터가 축적되어 있으니, 혹시 AI라면 당첨 확률이 높은 번호의 패턴을 찾아낼 수 있지 않을까 하는 기대를 품고서 말입니다.
1,214회의 데이터가 말해준 것
분석 결과는 명쾌했습니다. 카이제곱 검정이라는 통계 기법으로 45개 번호의 출현 빈도를 검증한 결과, 검정 통계량이 유의수준 5%의 임계값에 미치지 못했습니다. 통계학적으로 이는 ‘45개 번호가 균등하게 나오고 있으며, 특정 번호가 더 잘 나온다는 증거가 없다’는 뜻입니다. 패턴이 없다는 것을, 데이터가 스스로 증명한 셈입니다.
물론 개별 번호의 출현 횟수에는 차이가 있었습니다. 어떤 번호는 다른 번호보다 수십 회 더 나오기도 했습니다. 이것을 ‘패턴’이라고 부를 수 있을까요? 1,214회의 추첨에서 이 정도의 편차는 동전을 1,000번 던졌을 때 앞면이 520번 나오는 것과 같은 수준의 통계적 잡음에 불과합니다. 45개 번호 모두 기대값 범위 안에서 정상적으로 출현하고 있었습니다.
흥미로운 사례도 있었습니다. 2024년 12월 1,152회에서는 30, 31, 32, 35, 36, 37이라는 모든 번호가 30번대에 위치하는 결과가 나왔습니다. 2025년 3월 1,162회에서도 20번대에 몰리는 유사한 사태가 발생했습니다. 이런 극단적 조합이 나오면 사람들은 ‘뭔가 있다’고 느낍니다. 하지만 이 역시 814만 가지 조합 중 하나가 실현된 것일 뿐, 어떤 패턴의 증거가 아닙니다.
왜 AI도 로또는 못 푸는가
핵심은 이것입니다. 패턴이 존재할 수 있는 시스템과, 패턴이 존재하지 않도록 설계된 시스템은 근본적으로 다릅니다.
바둑에는 규칙 기반의 전략 구조가 있습니다. 단백질에는 아미노산 서열이 3차원으로 접히는 물리화학적 법칙이 있습니다. 나스카 지상화에는 고대인들이 남긴 시각적 패턴이 있습니다. AI가 이런 영역에서 혁신을 만드는 것은 숨겨진 인과 구조를 데이터로 역추적했기 때문입니다.
반면 로또 추첨기는 물리적으로 무작위성을 보장하도록 공학적으로 설계된 시스템입니다. 45개의 공이 기계 안에서 회전하며 나오는 결과에 경제 상황이나 외부 요인이 인과적으로 개입할 경로 자체가 없습니다. 1,214회의 데이터가 있어도 그것은 독립적인 시행의 기록이지, 연속된 패턴의 기록이 아닙니다.
심리학에서는 이를 ‘아포페니아(Apophenia)’라고 부릅니다. 인간의 뇌는 패턴 인식에 최적화된 기계여서, 무작위 데이터에서도 의미 있는 패턴을 ‘보는’ 경향이 있습니다. 구름에서 동물 모양을 찾고, 주식 차트에서 의미 없는 추세를 읽는 것도 같은 메커니즘입니다. 이것을 ‘도박사의 오류’라고도 합니다. 앞면이 5번 연속 나왔다고 해서 6번째도 앞면일 확률이 올라가지 않는데도, 우리의 직관은 그렇게 느끼게 만듭니다.
AI 시대의 진짜 리터러시
AI가 엄청난 데이터를 분석할 수 있는 시대가 되었다는 것은 사실입니다. 하지만 그 능력이 만능은 아닙니다. AI도 데이터 안에 인과 구조가 없으면 의미 있는 패턴을 찾을 수 없습니다. 오히려 위험한 것은 AI가 없는 패턴을 ‘있는 것처럼’ 찾아내는 과적합(Overfitting)이라는 현상입니다. 과거 데이터에서는 완벽하게 들어맞지만 미래에는 전혀 맞지 않는, 가짜 패턴을 만들어내는 것입니다. 금융 업계에서 백테스트는 완벽하지만 실전에서 박살나는 퀀트 전략이 대표적인 예입니다.
AI 시대의 진짜 리터러시는 패턴을 찾는 능력이 아니라, 진짜 패턴과 가짜 패턴을 구분하는 능력입니다.
로또 1,214회의 데이터는 그 구분의 출발점을 보여줍니다. 인과 구조가 있는 곳에서 AI는 인간을 초월하는 패턴을 찾아냅니다. 그러나 인과 구조가 없는 곳에서는, 아무리 정교한 AI라도 814만 분의 1이라는 확률 앞에서 무력합니다.
다음 회에서는 그 반대편의 이야기를 하겠습니다. AI가 인간이 수십 년, 수백 년간 찾지 못한 패턴을 발견해낸 사례들. 50년간 풀리지 않던 문제가 어떻게 풀렸는지, 100년간 보이지 않던 것이 어떻게 보이게 되었는지를 다루겠습니다.

