TRACK

실무 문서 가이드

0 / 0 섹션 완료

AI를 깔아도 사람이 줄어든다 — 주도권을 빼앗는 도입과 키우는 도입의 차이

2026년 봄, 한 글로벌 IT 기업의 코드 리뷰 회의에서 시니어 개발자가 한숨을 쉬었다. “주니어들이 코드를 못 짜는 게 아니라, 왜 그렇게 짰는지를 못 설명한다.” 회의록을 본 HR 팀장의 첫 반응은 이랬다고 한다. “그럼 교육을 더 시키면 되지 않나요?” 시니어의 답이 의미심장했다. “교육의 문제가 아닙니다. AI가 답을 너무 빨리 줘서, 사람이 답에 도달하는 길을 잊어가고 있어요.”

최근 arXiv에 올라온 한 논문은 이 현상에 이름을 붙였다. 인지 위축(cognitive atrophy). LLM에 깊이 의존한 소프트웨어 개발팀에서 비판적 사고력이 약화되고, ‘인식론적 부채(epistemic debt)’가 누적되어 시스템 취약성이 누적된다는 보고다. 한편 같은 시기 매킨지가 발표한 보고서는 정반대 방향을 가리켰다. AI 도입의 진정한 잠재력은 ‘슈퍼에이전시(Superagency)’, 즉 사람에게 더 큰 주도권을 부여할 때 비로소 발현된다는 것이다.

같은 도구가 누구에게는 능력을 깎고, 누구에게는 확장한다. 차이는 무엇인가. 답은 도구의 성능이 아니라, 그 도구를 둘러싼 일의 구조에 있다. 그리고 그 구조를 설계하는 사람은 IT 부서가 아니라 HR이다.

한 줄 요약: AI 도구를 단순 배포하면 직원의 인지 위축을 초래한다. HR이 해야 할 일은 직원이 AI 위에서 판단·재구성하는 ‘주도권(Superagency)’을 갖도록 업무·교육·평가를 재설계하는 것이다.

왜 같은 AI가 누구는 키우고, 누구는 깎는가

먼저 숫자로 본 현실. AI 도입 속도와 인간 역량 변화는 결코 같은 방향으로 움직이지 않는다.

71%

생성형 AI를 정기 사용하는 글로벌 직장인 비율

McKinsey, 2025

1/3

AI 사용자 중 “비판적 사고가 줄었다”고 답한 비율

arXiv 인지 위축 연구, 2026

3

‘주도권 설계’된 팀의 AI 활용 ROI 격차 (단순 배포 대비)

McKinsey Superagency, 2025

흥미로운 건 인지 위축이 개인의 게으름이 아니라는 점이다. 논문은 이를 시스템 현상으로 본다. 사람이 AI에 작업을 위임할 때, 처음엔 ‘답을 빨리 받는’ 효율로 보인다. 하지만 시간이 지나면 답을 검증할 근거를 스스로 만들지 못하게 된다. 판단의 근거가 외부화되는 것, 이것이 인지 위축의 본질이다.

반대로 슈퍼에이전시는 같은 위임 행위를 다르게 설계한다. 직원은 AI에게 작업을 넘기되, 왜 그것을 넘겼고, 어떤 기준으로 검증했고, 최종 책임을 어떻게 지는지를 명시한다. 이 구조에서 AI는 사람의 인지 능력을 대체하지 않고, 오히려 더 높은 차원의 판단으로 끌어올린다.

인지 위축을 만드는 4가지 도입 패턴

현장에서 관찰되는 ‘나쁜 도입’에는 공통된 모양이 있다. 솔직히 이 부분은 좀 뼈아프다 — 많은 한국 기업이 정확히 이렇게 도입한다.

① “도입률”을 KPI로 잡는 순간

“전사 AI 사용률 80%”가 목표가 되면, 직원은 사용 자체가 평가 대상이 된다. 결과적으로 깊이 생각해야 할 자리에서도 일단 AI에 던지고 본다. 사고가 멈추는 첫 지점이다.

② 검증 책임을 모호하게 둘 때

AI가 만든 산출물을 누가 검증하는가. 명시되지 않으면, 모두가 ‘다른 사람이 봤겠지’ 모드로 들어간다. 인식론적 부채가 누적되는 전형적 경로다.

③ “프롬프트 잘 짜기” 교육에만 집중

프롬프트는 도구일 뿐이다. 정작 가르쳐야 할 것은 “AI 답변을 어떻게 의심할 것인가”인데, 이 부분이 빠진다. HR인사이트가 인용한 한국경영자총협회 포럼에서도 같은 지적이 나왔다 — 글로벌 교육 프로그램의 핵심은 도구 사용법이 아니라 ‘신뢰 기반 소통’ 역량이라는 것.

④ 평가 체계를 그대로 둘 때

AI는 변화하는데 평가 항목은 5년 전 그대로다. 그러면 직원은 새 도구를 옛 평가에 맞춰 쓴다. 결과: AI는 ‘답을 빨리 만드는 기계’로만 소비된다. 판단력 키우는 도구가 아니라.

사례 — 글로벌 IT 기업 A사전사 AI 도입 1년 차에 코드 생산성은 22% 올랐지만, 시니어 코드 리뷰 거절률이 동시에 41% 증가했다. 분석 결과 주니어가 AI 코드를 ‘왜 그렇게 짰는지’ 설명하지 못한 케이스가 절반 이상이었다. A사는 2026년 1분기부터 평가 항목에 ‘판단 근거 서술’ 항목을 신설했다. 도입률이 아니라 판단의 자기화를 측정하기 시작한 것이다.

주도권을 부여하는 4가지 HR 레버

이제 반대 방향. 같은 AI를 슈퍼에이전시 도구로 만들려면 무엇을 바꿔야 하는가. 매킨지가 정리한 큰 그림과, 한국 기업에서 실제 작동하는 디테일을 함께 본다.

레버 1 — 업무 재설계: “AI에게 무엇을 넘기지 않을지”부터 정한다

직무기술서를 다시 쓸 때, ‘핵심 판단 영역’을 명시적으로 표시한다. 이 영역은 AI에 위임하지 않는다. 예를 들어 채용 면접에서 후보자 평가는 AI가 보조하지만, 최종 판단 근거의 서술은 사람이 직접 한다. 이 경계가 곧 직원의 주도권 영역이다.

레버 2 — 교육: 프롬프트가 아니라 ‘검증 사고’를 가르친다

“AI 답변을 어떻게 의심할 것인가”를 핵심 커리큘럼으로 둔다. 매킨지가 강조한 것도 같다 — 슈퍼에이전시 조직의 교육은 도구 활용 30%, 판단·소통·리더십 같은 인간 고유 역량 70%로 짜인다.

레버 3 — 평가: 산출물이 아니라 ‘판단의 흔적’을 평가한다

AI가 만든 결과물의 품질만 보면, 결과물은 좋아져도 사람은 위축된다. 평가 항목에 “왜 이 답을 채택했고, 어떤 대안을 검토했는가”라는 서술을 넣는다. 이 한 줄이 인지 위축을 막는다.

레버 4 — 의사결정 권한: AI 도구 선택권을 현장에 돌려준다

본사가 일률적으로 도구를 정하면, 현장은 수동적 사용자가 된다. 팀별로 도구를 선택하고, 그 효과를 직접 측정·보고하게 하는 구조가 주도권의 토양이 된다.

실무에서 바로 쓰는 AI 도구 활용법 — ‘주도권 강화’ 방식

도구는 같다. 사용 방식이 다를 뿐이다. 같은 Claude, 같은 ChatGPT, 같은 Notion AI를 두고도 인지 위축형과 주도권 강화형이 갈린다.

Claude / ChatGPT 활용 — “답”이 아니라 “선택지”를 요구한다

# 인지 위축형 프롬프트 (지양)
"이 후보자 평가서 작성해줘"

# 주도권 강화형 프롬프트 (지향)
"이 후보자에 대해 채용·보류·탈락 3가지 시나리오를 각각의 근거와
함께 제시해줘. 단, 최종 판단은 내가 한다.
각 시나리오에서 가장 약한 근거가 무엇인지도 함께 표시해."

차이는 명확하다. 첫 번째는 사람이 검토자가 되고, 두 번째는 사람이 결정자가 된다.

Notion AI / Workday — ‘근거 서술란’을 의무화한다

인사평가 템플릿에 ‘AI 보조 사용 시 판단 근거’ 필드를 추가한다. AI가 점수를 제안해도, 그 점수를 채택한 이유를 사람이 직접 쓴다. 이 한 칸이 평가의 자기화 장치가 된다.

Microsoft Copilot / 사내 RAG — ‘의심 카드’를 자동 띄운다

AI 답변 옆에 “이 답변의 근거 데이터가 6개월 이상 됐을 수 있습니다”, “이 결론은 한국 노동법 맥락에서 검증 필요” 같은 의심 카드를 자동 노출한다. 사람의 비판적 사고를 작동시키는 마찰을 의도적으로 설계하는 것이다.

측정: 위축이냐 확장이냐를 판별하는 3가지 신호

마지막으로 점검 지표. 분기마다 이 세 가지를 체크하면 조직이 어디로 가고 있는지 보인다.

① 검토 시간의 변화 — AI 도입 후 산출물 검토에 쓰는 시간이 늘었다면 좋은 신호다. 줄었다면 위축 가능성. 검토 시간은 비판적 사고가 작동한다는 흔적이다.

② ‘근거 서술’의 깊이 — 직원들이 AI 답변을 채택할 때 쓰는 근거가 한 줄짜리인가, 세 줄 이상인가. 근거의 길이는 사고의 깊이와 비례한다.

③ ‘AI 사용 거절률’ — 직원이 “이 작업은 AI에 안 맡기겠다”고 선언한 비율. 이게 0%라면 의심해야 한다. 모든 작업에 AI를 쓰는 조직은 사실 모든 판단을 외주 준 조직이다.

개인적으로는 ③번이 가장 강력한 지표라고 본다. 도구를 거절할 줄 아는 직원이 진짜로 도구를 쓸 줄 아는 직원이다.

그래서, 지금 무엇을 바꿀 것인가

한국 기업의 AI 도입은 이제 도입률 경쟁 단계를 지났다. 다음 질문은 “얼마나 많이 쓰는가”가 아니라 “어떻게 쓰는가”이고, 더 정확히는 “쓸수록 사람이 자라는가, 줄어드는가”이다.

이 질문의 답을 가진 부서가 IT가 아니라 HR이라는 사실은, 사실 좋은 소식이다. 도구의 사양은 벤더가 결정하지만, 도구를 둘러싼 일의 구조는 HR이 설계한다. 그리고 그 구조가 직원을 위축시킬지 확장시킬지를 결정한다.

답은 아직 다 나오지 않았다. 다만 방향은 보인다 — AI를 깔지 말고, AI 위에 사람을 세울 구조를 깔아야 한다.

💡 실무 시사점: AI 도입 KPI를 ‘도입률’에서 ‘판단 자기화율’로 전환하라. 평가 항목에 ‘판단 근거 서술’을 추가하고, 교육 커리큘럼은 프롬프트 30% / 검증 사고 70%로 재편하라. 도구 선택권을 본사가 아닌 팀 단위로 분권화하면, 직원은 사용자가 아니라 조정자가 된다. 측정 지표는 ‘AI 사용 거절률’을 추가하라 — 도구를 거절할 줄 아는 직원이 진짜로 쓸 줄 아는 직원이다.

#AI #HR전략 #슈퍼에이전시 #인지위축 #조직설계 #인사평가 #AI역량

참고 링크

작성: 서재홍 | NODE

ON THIS PAGE