AI가 실행을 가져간 시대, 성과관리는 왜 여전히 실행자를 줄 세우는가

고용률은 역대 최고인데, 성과관리는 왜 역대 최악인가

숫자만 보면 노동 시장은 잘 돌아가는 것 같다. OECD 38개 회원국의 평균 고용률은 70.3%로 사상 최고치를 찍었고, 한국의 15~64세 고용률도 69.2%로 전년보다 0.3%p 올랐다. 그런데 같은 시기, 인도 최대 IT 기업 TCS는 관리자들에게 직원의 하위 5%를 최저 등급에 넣으라고 지시했고, 반대편에서는 KPMG가 27만 6천 명 전 직원에게 AI를 배포하며 “완전히 다른 방식의 일”을 선언했다. 이 세 장면을 나란히 놓으면 하나의 불편한 결론이 드러난다. AI가 직원의 역할을 ‘실행자’에서 ‘판단자’로 바꾸고 있는데, 대부분의 기업은 여전히 실행자를 전제로 설계된 성과관리 체계—통제, 감시, 강제 등급 분류—를 고수하고 있다. 이 불일치가 지금 조직에서 가장 비싼 병목이다.

사상 최고 고용률 이면의 균열

OECD 고용률 70.3%라는 숫자는 분명 좋은 뉴스다. 경제활동참가율도 74.1%로 역대 최고를 기록했고, 일본과 네덜란드는 고용률이 80%를 넘겼다. 그런데 이 평균의 이면에 다른 그림이 있다.

70.3%

OECD 평균 고용률 사상 최고치 (2025 Q3)

OECD Labour Market Situation (2026.04)

69.2%

한국 15~64세 고용률 +0.3%p 전년비

통계청 고용동향 (2026.02)

7.7%

한국 청년(15~29세) 실업률 5년 만에 최고

통계청 고용동향 (2026.02)

한국의 전체 취업자는 2,841만 3천 명으로 전년 대비 23만 4천 명 늘었다. 하지만 같은 달 청년(15~29세) 취업자는 오히려 14만 6천 명 줄었고, 청년 실업률은 7.7%로 2021년 이후 같은 달 기준 최고치를 찍었다. 고용보험 가입자 통계도 같은 이야기를 한다. 3월 가입자 1,570만 4천 명으로 전년 대비 26만 9천 명(+1.7%) 늘었지만, 증가는 보건복지·숙박음식 등 서비스업에 집중됐고 제조업(-5천 명)과 건설업(-9천 명)은 계속 줄었다.

솔직히 이건 좀 불편한 풍경이다. 고용률은 오르는데 청년층은 줄고, 서비스업은 느는데 제조업은 빠지는 구조. 일자리 ‘수’의 문제가 아니라 일자리 ‘질’의 문제가 동시에 진행되고 있다는 뜻이다. 그리고 이 배경에서 기업의 성과관리 방식이 어떤 방향으로 가고 있는지를 보면, 균열은 더 깊다.

27만 명에게 AI를 나눠준 기업의 전제

2026년 5월, KPMG는 글로벌 컨설팅 업계에서 전례 없는 결정을 내렸다. 138개국 27만 6천 명 전 직원에게 AI 어시스턴트를 배포한 것이다. 이건 일부 파워유저나 혁신팀이 아니라 말 그대로 모든 사람에게 해당하는 이야기다.

사례 — KPMG 세무 규정 분석에 AI 에이전트를 도입한 결과, 기존에 수 주가 걸리던 작업이 수 분으로 줄었다. KPMG 미국 세무 부문 부회장 Rema Serafi는 “이건 완전히 다른 방식의 일”이라고 표현했다. 이 도구는 별도 팀이 아닌 전 직원 대상으로 배포됐다.

여기서 주목할 지점은 기술 자체가 아니다. KPMG가 깔고 있는 전제다. 27만 명에게 AI를 배포한다는 건, 모든 직원이 AI와 협업하며 판단·해석·의사결정에 집중하는 역할로 이동한다는 뜻이다. 세무 규정 분석에서 ‘데이터를 찾고 정리하는 실행’은 AI가 가져갔고, 인간에게 남은 건 그 결과를 맥락 안에서 해석하고 고객에게 맞는 판단을 내리는 것이다.

한국노동연구원도 같은 변화를 포착했다. 2026년 4월 노동리뷰는 AI 시대에 인간의 일이 ‘수행자’에서 ‘판단자’로 재정의되고 있다고 분석했다. 반복 실행은 자동화되고, 사람에게는 예외 상황 판단, 맥락 해석, 윤리적 결정 같은 역할이 남는다는 것이다.

문제는 여기서 시작된다. 직원의 역할이 판단자로 바뀌고 있다면, 그 사람의 성과를 어떻게 측정해야 하는가?

하위 5%를 잘라내면 나아진다는 오래된 믿음

KPMG가 27만 명에게 AI를 주던 같은 시기, 인도 TCS에서는 정반대 방향의 움직임이 있었다. TCS는 관리자들에게 내부 메모를 보내 직원의 5%를 Band D(최저 성과 등급)에 배치하라고 지시했다. HR이 각 사업부 리더에게 보낸 문구는 이랬다. “합의된 5% 분포를 충족할 수 있도록 Band D 대상자 명단을 비판적으로 검토하여 공유하라.”

12,200명

TCS 최근 대규모 감원 규모

People Matters (2026.05)

강제 최저 등급 배치 할당 비율

TCS 내부 메모 (2026)

23,000명+

FY26 TCS 총 인력 감소

People Matters (2026.05)

TCS의 전체 인력은 한 해 동안 6만 7백 명에서 5만 8,400명으로 2만 3천 명 이상 줄었다. 1만 2,200명이 직접 감원됐고, 약 1만 7,500명(전체의 약 3%)이 저성과자로 분류됐다. 감원과 강제 등급 분류가 동시에 진행된 셈이다.

이것은 잭 웰치가 GE에서 시작한 ‘활력 곡선(vitality curve)’의 2026년 버전이다. 상위 20%에 보상을 집중하고, 하위 10%는 조직에서 내보내는 방식. 20세기 제조업 시대에 설계된 이 모델의 핵심 전제는 명확하다. 직원은 ‘실행자’이고, 실행의 양과 질을 측정하면 성과를 구분할 수 있다는 것이다.

그런데 AI가 실행을 대체하기 시작하면, 이 전제가 흔들린다. 27만 명이 같은 AI 도구를 쓰는 KPMG에서 ‘실행 속도’로 상위 20%와 하위 5%를 가르는 게 의미가 있을까? 세무 규정 분석이 수 주에서 수 분으로 줄었을 때, 그 ‘수 분’의 차이로 사람을 줄 세우는 것이 성과관리인가?

리더가 동기부여에 대해 잘못 알고 있는 것

강제 등급 분류가 여전히 살아있는 이유는 기술적 관성만이 아니다. 더 깊은 곳에 이론적 관성이 있다. MIT 슬론 경영대학원에서 발표된 연구는 이 관성의 뿌리를 정확히 짚는다.

연구진(Marylène Gagné, Rebecca Hewett)의 핵심 진단은 이렇다. “리더는 직원이 자율적이고 주도적이길 바라면서, 정작 그 반대를 전제로 관리한다.” 대부분의 성과관리 시스템은 경제학의 ‘대리인 이론(agency theory)’에 기반한다. 이 이론의 가정은 단순하다. 직원(대리인)과 조직(주인)의 이해관계는 근본적으로 충돌하며, 직원은 최소한의 노력으로 최대 보상을 추구하는 자기이익 극대화 존재라는 것이다.

개념 비교 대리인 이론: 직원은 통제·감시·인센티브가 없으면 태만해진다 → 등급 분류, KPI 감시, 성과급 차등이 논리적 귀결. 자기결정 이론: 직원은 자율성·역량 인정·관계라는 3가지 심리적 욕구가 충족되면 스스로 동기부여된다 → 명확한 목표 제시 + 방법의 자율 + 안정적 보상이 논리적 귀결.

연구에 따르면, 자기결정 이론을 적용한 조직은 전 세계 약 400개에 달하며, 이들에서 윤리적 행동, 혁신, 장기 몰입이 동시에 향상된 것으로 나타났다. 반면 대리인 이론에 기반한 관리는 상호 불신을 구조화한다. 조직이 직원을 불신하니 감시하고, 감시받는 직원은 조직을 불신하게 되는 악순환이다.

TCS의 “5% Band D 할당”은 대리인 이론의 가장 극단적인 적용 사례다. 개인적으로는 이게 핵심이다. TCS가 하위 5%를 잘라내는 건 성과가 낮은 개인을 식별하는 게 아니라, 시스템이 ‘불신’을 제도화하는 방식을 보여주는 것이다. 합의된 비율을 채우라는 지시 자체가, 실제 성과 분포와 무관하게 누군가는 반드시 바닥에 놓여야 한다는 뜻이니까.

AI 시대에 통제를 내려놓으면 벌어지는 일

KPMG의 AI 배포가 흥미로운 건, 기술 도입 그 자체보다 이 도입이 관리 방식의 전제를 바꿨다는 점이다. 27만 명에게 동일한 AI를 주면, 모든 직원의 ‘실행 역량’의 바닥이 올라간다. 세무 분석이든 사이버보안 취약점 탐지든, AI가 기초 작업을 처리하면 개인 간 실행 속도 차이는 의미를 잃는다.

이 상황에서 성과 차이는 어디서 발생하는가? 판단의 질에서다. 같은 AI 출력물을 받고도 어떤 사람은 고객 맥락에 맞는 날카로운 해석을 내놓고, 어떤 사람은 AI 결과를 그대로 전달한다. 그리고 이 ‘판단의 질’은 대리인 이론이 가정하는 통제·감시·등급 분류로 향상시킬 수 없다. 오히려 MIT 슬론 연구가 제시하는 자율성, 역량 인정, 관계라는 세 축이 판단의 질을 결정한다.

KPMG의 글로벌 회장 Bill Thomas가 이번 AI 배포에서 강조한 키워드가 “신뢰(trust)”와 “거버넌스(governance)”였다는 점도 우연이 아니다. 27만 명에게 AI를 나눠주려면, 그들이 AI를 자율적으로 활용하되 조직의 원칙 안에서 판단하리라는 신뢰가 전제되어야 한다. 대리인 이론의 프레임이라면 이런 배포는 불가능하다. 직원이 AI를 오용할 것을 우려해 접근 권한을 제한하고, 사용 로그를 감시하고, AI 활용도를 KPI에 넣는 방향으로 갔을 것이다.

여기서 두 기업의 방향은 완전히 갈라진다.

276,000명

KPMG — AI 전사 배포
전제: 직원은 판단자

Anthropic (2026.05)

17,500명

TCS — 저성과자 분류
전제: 직원은 실행자

People Matters (2026.05)

판단자를 실행자 잣대로 평가하는 비용

한국 노동 시장의 숫자를 다시 들여다보면, 이 불일치의 비용이 보인다. 전체 고용은 늘고 있지만 청년 취업자는 줄고, 서비스업은 확장되는데 제조업은 수축한다. 고용보험 가입자 증가의 대부분이 보건복지(+12만 명)에 집중된 건, 돌봄·의료처럼 인간 판단이 핵심인 영역에서 일자리가 생기고 있다는 뜻이다. 반면 제조·건설처럼 ‘실행’이 중심인 영역은 자동화 압력을 받고 있다.

이런 구조 전환기에 기업이 여전히 실행자 기반의 성과관리를 고수하면 어떤 일이 벌어지는가?

첫째, AI가 바닥을 올려준 영역에서 무의미한 서열이 만들어진다. KPMG 같은 환경에서 세무 분석 속도로 사람을 줄 세우면, 실제 성과 차이가 아니라 AI 활용 습관의 미세한 차이를 측정하게 된다. TCS 식으로 5%를 강제로 최하위에 놓으면, 그 5%가 정말 성과가 낮은 건지 아니면 단순히 할당량을 채우기 위해 희생된 건지 알 수 없다.

둘째, ‘판단의 질’을 측정할 도구가 없는 상태에서 측정 가능한 것만 측정하게 된다. 처리 건수, 응답 시간, KPI 달성률 같은 실행 지표는 쉽게 수치화된다. 하지만 고객 맥락에 맞는 해석, 윤리적 판단, 팀 내 지식 공유 같은 판단 역량은 숫자로 잡기 어렵다. 결과적으로 조직은 측정할 수 있는 것을 성과로 정의하는 함정에 빠진다.

셋째, 가장 비싼 비용이 발생한다. 판단 역량이 높은 사람이 떠난다. 자기결정 이론이 말하는 자율성·역량 인정·관계 욕구가 강한 사람일수록 통제 기반 평가 시스템에서 마찰을 느낀다. 한국 청년 실업률 7.7%라는 숫자 이면에는, 단순히 일자리가 없어서가 아니라 자신의 판단 역량을 인정받을 수 있는 일자리를 찾지 못해서 이탈하는 청년들의 흐름도 포함돼 있을 것이다.

성과관리가 측정해야 할 것이 바뀌었다

OECD 고용률 70.3%는 노동 시장의 양적 건강을 보여주지만, TCS의 강제 등급 분류와 한국의 청년 실업률은 질적 균열을 드러낸다. 이 두 지표 사이의 간극이 바로 성과관리 패러다임 전환이 필요한 지점이다.

AI가 실행을 가져간 뒤에 남는 인간의 역할—판단, 해석, 맥락화—을 측정하는 성과관리 시스템을 가진 조직과, 여전히 실행 속도와 처리량으로 사람을 줄 세우는 조직 사이의 격차는 앞으로 빠르게 벌어질 것이다. KPMG가 27만 명에게 AI를 주면서 깔고 간 전제—직원은 통제 대상이 아니라 신뢰할 수 있는 판단자다—가 수사가 아니라 실제 시스템으로 구현되느냐가 관건이다.

아쉽다면, 대부분의 한국 기업이 아직 이 전환의 초입에도 서 있지 않다는 점이다. AI 도구 도입은 빠르지만, 그 도구를 쓰는 사람을 어떻게 평가할 것인가에 대한 고민은 훨씬 느리다. 성과관리 시스템이 ‘실행자’에서 ‘판단자’로의 전환을 반영하지 못하는 한, AI 투자의 상당 부분은 조직 내부의 마찰로 소진될 것이다.

한 줄 요약: AI가 실행을 대체하면서 직원의 역할이 ‘판단자’로 바뀌고 있지만, 대부분의 성과관리 시스템은 여전히 ‘실행자’를 전제로 설계돼 있다. 이 불일치가 조직의 가장 비싼 병목이다.

실무 시사점 — HR이 이번 분기에 점검할 3가지:

1. 성과 지표에서 ‘실행 속도’의 비중을 점검하라. AI 도구 도입 이후에도 처리 건수, 응답 시간 같은 실행 지표가 평가의 중심이라면, 성과관리가 AI가 아니라 사람을 측정하고 있는지 의심해야 한다. 판단의 질—맥락 해석, 예외 대응, 팀 기여—을 평가 항목에 명시적으로 포함시켜라.

2. 강제 등급 분류(bell curve) 비율을 AI 도입 전후로 비교하라. AI가 실행 역량의 바닥을 올려주면, 자연스러운 성과 분포는 이전과 달라져야 한다. 동일한 비율을 강제하고 있다면, 시스템이 실제 성과가 아니라 할당량을 측정하고 있을 가능성이 높다.

3. 직원의 AI 활용을 ‘감시 대상’이 아닌 ‘자율성 영역’으로 설계하라. 사용 로그를 KPI에 넣는 순간, 직원은 AI를 도구가 아니라 감시 장치로 인식한다. KPMG의 접근—전사 배포 + 거버넌스 프레임—이 참고할 만한 모델이다.

#성과관리 #AI도입 #자기결정이론 #강제등급분류 #HR전략

참고 링크

OECD, “Labour Market Situation — Updated: April 2026” (2026)
통계청, “2026년 2월 고용동향” (2026)
KDI, “2026년 3월 고용행정 통계로 본 노동시장 동향” (2026)
Anthropic, “KPMG integrates Claude across its core business and workforce of more than 276,000” (2026)
People Matters, “TCS asks managers to place 5% employees in lowest performance band after major layoffs” (2026)
MIT Sloan Management Review, “What Leaders Get Wrong About Employee Motivation” (2025)

작성: 서재홍 | NODE

실무 문서 가이드

AI가 실행을 가져간 시대, 성과관리는 왜 여전히 실행자를 줄 세우는가

고용률은 역대 최고인데, 성과관리는 왜 역대 최악인가

사상 최고 고용률 이면의 균열

27만 명에게 AI를 나눠준 기업의 전제

하위 5%를 잘라내면 나아진다는 오래된 믿음

리더가 동기부여에 대해 잘못 알고 있는 것

AI 시대에 통제를 내려놓으면 벌어지는 일

판단자를 실행자 잣대로 평가하는 비용

성과관리가 측정해야 할 것이 바뀌었다

참고 링크