AI가 학력 격차를 4분의 3 좁혔다 — 콘센트를 뽑자 격차가 되살아났다

학력이 높은 사람과 낮은 사람을 같은 책상에 앉혀 동일한 업무 과제를 풀게 하면, 결과는 갈린다. 그런데 두 사람 손에 똑같이 생성형 AI를 쥐여주자 그 격차가 4분의 3이나 줄었다. 1,174명을 대상으로 한 무작위 통제실험의 이 결과는 “AI가 학력의 운동장을 평평하게 만든다”는 희망적 헤드라인으로 소비되기 좋다. 하지만 같은 실험의 후속 데이터는 정반대를 가리킨다. AI가 좁힌 것은 능력이 아니라 능력의 ‘임대료’였고, 도구를 빼앗자 격차는 되살아났다 — 평준화는 노동자가 소유한 자산이 아니라, 콘센트가 꽂혀 있는 동안만 작동하는 임대물이며, 그래서 생산성의 동등은 협상력의 동등으로 환전되지 않는다.

한 줄 요약: AI가 학력 간 생산성 격차를 4분의 3 좁힌 건 사실이지만, 도구를 치우면 격차가 재출현하고 같은 도구를 고학력자가 더 잘 부린다 — AI는 격차를 없앤 게 아니라 ‘누가 과제를 하느냐’에서 ‘누가 도구를 더 깊이 부려 그 잉여를 가져가느냐’로 격차의 위치를 옮겼다.

0.548SD

AI 없는 통제집단에서 고학력자가 저학력자를 앞선 격차 (표준편차)

NBER 작업논문 w34851 / 무작위 통제실험 (2026)

0.139SD

AI를 쥐여주자 줄어든 격차 — 약 4분의 3 축소

NBER 작업논문 w34851 (2026)

1,174명

25~45세 성인 대상 인센티브 부여 업무형 과제 실험

NBER 작업논문 w34851 (2026)

70.6%

한국 25~34세 고등교육 이수율 — OECD 1위 (평균 40.4%)

OECD 교육지표 / 교육부 (2025)

0.548에서 0.139로 — 실제로 무슨 일이 일어났나

실험 설계는 깔끔하다. 25~45세 성인 1,174명을 모아 인센티브가 걸린 업무형 문제해결 과제를 풀게 했다. 절반은 맨손으로, 절반은 생성형 AI 조수와 함께. 그리고 과제가 끝난 뒤 AI 없이 푸는 후속 모듈을 하나 더 붙였다. 이 후속 모듈이 이 연구의 진짜 심장이다.

1차 결과는 선명하다. AI가 없을 때 고학력 참가자는 저학력 참가자를 0.548 표준편차 앞섰다. 그런데 양쪽 모두에게 AI를 붙이자 이 격차가 0.139 표준편차로 주저앉았다. 초기 격차의 약 4분의 3이 사라진 것이다. 연구진의 표현 그대로, “AI는 모든 참가자의 성과를 높였고, 저학력자에게서 그 상승폭이 훨씬 컸다.”

여기까지만 보면 결론은 자명해 보인다. AI는 평등의 도구다. 교육이라는 진입장벽을 무너뜨리고, 출발선이 다른 사람들을 같은 지점에 세운다. 실제로 이 한 문장이 대부분의 보도와 요약이 가져갈 결론일 것이다. 문제는, 같은 논문이 그 결론을 스스로 무너뜨리고 있다는 점이다.

콘센트를 뽑으면: 평준화는 ‘임대’였다

후속 모듈에서 AI를 치웠을 때 무슨 일이 벌어졌는가. 연구진의 서술은 신중하지만 방향은 분명하다. AI를 쓴 참가자들이 도구가 사라진 뒤에도 통제집단보다 못하지는 않았다 — 즉 단순 ‘대리 수행(delegation)’만은 아니었다. 저학력 참가자는 향상분의 일부를 보유했다. 그러나 같은 문장이 이렇게 끝난다. “상당한 학력 격차가 다시 벌어진다(a sizable education gap re-emerges).”

실험 데이터 — 후속 모듈 도구를 쥐고 있을 땐 격차가 0.139SD까지 좁혀졌지만, 도구를 빼자 학력 격차가 다시 “상당한” 수준으로 되살아났다. 평준화 효과의 상당 부분이 참가자의 능력이 아니라 손에 들린 도구에서 나왔다는 뜻이다.

더 결정적인 단서가 그 뒤에 숨어 있다. 논문은 “조수를 집중적으로 사용하면 참가자가 스스로 시간과 노력을 얼마나 들이든 강한 과제 성과가 나온다”고 적는다. 도구만 잘 부리면 지금 당장의 결과는 좋다는 뜻이다. 그런데 같은 문장이 단서를 단다. “후속 성과가 유의하게 높아지는 건 집중적 AI 사용이 지속적 노력과 결합될 때뿐이다.” 풀어 쓰면 이렇다 — AI에 기대 결과만 뽑아내고 스스로의 노력을 생략한 사람에게는, 도구가 사라진 순간 남는 것이 거의 없다. 학습으로 전환되어 몸에 남는 향상은 AI 사용과 자기 노력이 함께 갔을 때만 일어났다.

이건 ‘능력의 평준화’가 아니라 ‘능력의 임대’다. 핵심이다. 빌린 능력은 빌린 동안만 내 것이고, 반납하는 순간 원래의 격차가 드러난다. 연구진 스스로 마지막 문장에서 이 구분을 명문화한다 — AI는 “과제 수행상의 유효 생산성 격차(effective productivity differences in task execution)“를 좁히지만, “기저의 인적자본 격차(underlying human-capital differences)“는 계속해서 도구 없는 성과와 도구를 부리는 능력을 좌우한다고. 평준화된 것은 ‘지금 이 과제의 결과물’이고, 평준화되지 않은 것은 ‘사람 그 자체’다.

같은 도구, 다른 추출력 — 격차는 사라지지 않고 위로 옮겨갔다

여기서 두 번째 균열이 벌어진다. 채팅 로그 분석은 저학력 참가자가 “AI로부터 상당한 도움을 성공적으로 끌어냈다”고 말한다. 그러나 바로 이어서, 고학력 참가자는 “여러 측면에서 도구를 다소 더 효과적으로 사용했다(use the tool somewhat more effectively across several margins)“고 적는다. 같은 도구를 쥐었는데, 그 도구에서 더 많은 것을 뽑아내는 능력 자체에 학력의 그림자가 다시 드리운 것이다.

여기서부터는 논문의 결과가 아니라 그 결과에서 자연스럽게 이어지는 추론임을 분명히 해 두자. 이번 실험의 과제는 단일하고 비교적 단순한 업무형 문제였다. 도구도 일반적인 생성형 AI 조수 하나였다. 이 단순한 환경에서조차 고학력자의 ‘추출력’이 더 높았다면, 도구가 더 복잡해지고 정교한 프롬프트·검증·반복·도구 조합 능력이 성과를 가르는 실제 직무 환경에서는 그 격차가 더 벌어질 개연성이 크다. 즉 현재 측정된 평준화는 도구가 단순하기 때문에 나타난 과도기적 장면일 수 있다. 도구의 천장이 높아질수록, 그 천장에 더 가까이 닿는 사람과 그렇지 못한 사람의 거리는 다시 멀어진다.

그래서 “AI가 격차를 없앴다”는 명제는 절반만 맞다. 격차는 사라진 게 아니라 위치를 바꿨다. ‘누가 과제를 직접 풀 줄 아느냐’라는 1차 격차에서, ‘누가 도구를 더 깊이 부려 더 많은 잉여를 뽑아내느냐’라는 2차 격차로. 그리고 2차 격차는 1차 격차와 같은 사람들 사이에서, 같은 방향으로 벌어진다.

생산성 동등은 협상력 동등이 아니다 — 잉여는 누가 가져가는가

이제 노동시장의 언어로 번역할 차례다. 저학력 노동자가 AI를 써서 고학력 노동자만큼의 결과물을 낸다고 가정하자. 낙관적 해석은 “그의 시장가치가 올라갔다”이다. 그런데 그 결과물의 출처를 분해하면 이야기가 달라진다. 결과물 = 그의 인적자본 + AI의 기여. 그리고 도구를 빼면 격차가 되살아난다는 건, 그 결과물의 상당 부분이 그가 소유하지 않은 자산에서 나왔다는 뜻이다.

고용주의 관점에서 이 구조는 전혀 다르게 읽힌다. 같은 결과물을 더 낮은 학력·낮은 임금의 노동자가 낼 수 있다면, 그 직무에 붙어 있던 학력 프리미엄은 무너진다. 노동자가 더 강해진 게 아니라, 그 직무의 대체 가능성이 높아진 것이다. 가치를 만든 것이 사람이 아니라 도구라면, 그 도구를 소유한 쪽 — 거의 언제나 사용자(고용주) — 이 잉여의 분배를 결정한다. 생산성이 올라간 만큼 임금이 올라가리라는 보장은 어디에도 없다. 오히려 바닥의 협상력이 약해지면서 임금이 눌릴 수 있다.

함의 — 도구 소유의 비대칭 노동자가 소유하지 않은 도구로 끌어올린 생산성은, 그 도구를 회수당하는 순간 사라지는 협상 카드다. 생산성 동등이 곧장 임금 동등·교섭력 동등으로 이어진다는 가정은, 도구의 소유권이 누구에게 있는지를 빠뜨린 계산이다.

솔직히 이 지점이 원논문이 끝까지 가지 않은 곳이다. 논문은 인적자본 격차가 잔존한다는 데서 멈췄지만, 노동시장에서 임금과 교섭력이 귀속되는 자리가 바로 그 잔존한 인적자본이라는 사실까지는 말하지 않는다. 평준화된 ‘유효 생산성’에는 프리미엄이 붙지 않고, 평준화되지 않은 ‘기저 능력’에 프리미엄이 붙는다. AI가 전자를 모두에게 나눠줄수록, 후자의 희소가치는 오히려 더 도드라진다.

고학력 사회 한국에서 더 날카로워지는 질문

이 구조가 한국에 닿으면 한층 예리해진다. 한국의 25~34세 고등교육 이수율은 70.6%로 OECD 1위, 평균(40.4%)의 1.7배다. 그러나 같은 연령대의 고용률은 OECD 평균을 밑돈다. 학력은 세계 최고 수준으로 쌓였는데 그것이 일자리로 환전되는 비율은 낮은, 이미 학력 인플레이션이 진행된 사회라는 뜻이다.

이런 사회에서 AI가 ‘과제 수행상의 유효 생산성’을 평준화하면, 학력이라는 신호의 직무상 변별력은 더 빠르게 닳는다. 대학 4년이 증명하던 ‘이 과제를 풀 줄 안다’는 명제를, 이제 AI 조수 하나가 상당 부분 대신 증명해 주기 때문이다. 한국 기업의 임금체계가 상당 부분 기대온 직능급·숙련급(사람의 능력·숙련에 임금을 매기는 방식)의 논리는 여기서 흔들린다. 측정되는 직무 성과가 도구에서 나온 것이라면, 그 임금은 사람의 숙련에 대한 보상인가 도구 사용권에 대한 보상인가.

그리고 그 도구의 사용권과 소유권은 거의 전적으로 회사에 있다. 회사가 라이선스를 끊으면 노동자의 ‘유효 생산성’은 0.139에서 0.548 쪽으로 되돌아간다. 개인적으로는 이것이 향후 몇 년 한국 노사관계에서 조용히, 그러나 근본적으로 부상할 쟁점이라고 본다 — AI가 만든 생산성 잉여를 누구의 몫으로 볼 것인가, 그리고 그 도구를 회수할 권한이 사용자에게 있다는 사실이 교섭 테이블에서 어떤 무게를 갖는가.

그래서 무엇을 점검해야 하나

이 연구의 진짜 메시지는 “AI가 평등을 가져온다”가 아니다. “AI는 능력을 빌려주지만 소유권은 넘기지 않으며, 노동시장의 보상은 빌린 능력이 아니라 소유한 능력에 붙는다”는 것이다. 그렇다면 실무의 대응은 ‘평준화를 반기는 것’이 아니라 ‘임대를 자산으로 전환하는 것’, 그리고 ‘도구가 만든 잉여의 분배 규칙을 미리 정하는 것’이어야 한다.

💡 실무 시사점 — HR·노사가 이번 분기에 점검할 3가지:

① ‘AI 사용+노력 결합’을 평가·육성 설계에 박아라. 후속 모듈이 증명했듯, AI에 기대 결과만 뽑은 사람에겐 학습이 남지 않았고 노력과 결합한 사람에게만 향상이 몸에 남았다. AI 활용 성과를 그대로 고과에 반영하면 ‘임대된 생산성’을 ‘본인의 역량’으로 오인하게 된다. AI 보조 결과물과 AI 없는 기초역량을 분리 측정하고, 도구 활용 교육을 ‘결과 뽑기’가 아니라 ‘추출력 자체를 키우는’ 방향으로 설계할 것.

② 직능급·숙련급 임금체계의 근거를 재점검하라. 측정되는 직무 성과 중 어디까지가 사람의 숙련이고 어디부터가 도구 기여인지 구분하지 않으면, 임금이 무엇에 대한 보상인지 설명할 수 없게 된다. 도구 의존도가 높은 직무일수록 ‘숙련 프리미엄’의 근거가 약해진다는 점을 임금 설계에 반영할 것.

③ AI가 만든 생산성 잉여의 분배·도구 회수 조건을 사전에 합의하라. 생산성이 올랐는데 그 원천이 회사 소유 도구라면, 잉여 분배와 도구 사용권 회수 조건은 잠재적 분쟁 지점이다. 단체교섭·취업규칙·성과배분 설계에서 ‘AI 도구로 끌어올린 성과를 누구의 기여로 볼 것인가’를 미리 정의해 두는 편이 사후 갈등보다 싸다.

#생성형AI #노동생산성 #임금체계 #직능급 #AI노사관계 #인적자본

평준화는 매력적인 단어다. 하지만 빌린 평준화는 빌린 동안만 평등하다. 콘센트가 누구 손에 있는지를 묻지 않은 평등론은, 협상 테이블에서 가장 먼저 무너진다. 이번 실험이 정말로 보여준 건 격차의 소멸이 아니라 격차의 이사(移徙)다 — 더 보이지 않는 곳으로, 그러나 같은 방향으로.

참고 링크

NBER, “Does Generative AI Narrow Education-Based Productivity Gaps? Evidence from a Randomized Experiment” (2026)
대한민국 정책브리핑, “한국, 25∼34세 고등교육 이수율 OECD 국가 중 1위” (2025)

작성: 서재홍 | NODE

실무 문서 가이드