[인사-23005] 직무급 연구 : 직무평가와 군집분석의 활용 ①
Ⅰ. 직무급 도입과 직무평가등급 설정의 어려움
필자의 아버지는 "돈을 벌지 못할 것처럼 보이는 직무가 오히려 돈을 많이 버는 경우가 상당히 있으니 직무를 평가하는데에 있어 겉모습만 보지말라"고 종종 경고하셨다. 그러고는 항상 이를 뒷받침하는 논거로 당신의 어린 시절 소위 '똥퍼(과거 재래식 화장실의 대변을 치우는 업무를 하는 사람)'가 벌어들이는 수익을 이야기해주셨다. 그 시절 역시 다른 사람의 대소변을 치우는 업무는 기피 업무라 경쟁자가 없고, 재래식 화장실이 대부분이여서 대소변을 비우는 사람은 반드시 필요하였기에 이들의 몸값이 높아진 것이다.
직업엔 귀천이 없으나 자본주의 시스템 안에서 작동하는 시장 임금(보상)은 노동의 가치와 희소성에 의해 결정된다. 우리 중 이러한 사고방식을 수용하는데에 큰 부담을 느끼는 사람을 없을 것이다. 생각컨대 수행하는 업무의 정신적·물리적인 환경, 소요되는 에너지의 크기, 창출하는 부가가치의 정도 등 직무를 둘러싼 여러 요소에 기반하여 직무(혹은 직업) 상호간의 "같지 아니함"을 인식하고 차등을 두는 것은 어찌보면 당연해 보이기까지 한다.
그러나 상기와 같은 합리적인 상식(?)은 조직 내 직무평가 시 변형 및 왜곡되기 쉽상인데, 그 이유는 이러한 직무평가가 직무가치에 연동되어 차등적으로 보상 수준을 결정하는 "직무급" 설계와도 밀접하게 연관이 있기 때문이다. 흔히 직무급 도입을 거부하는 이들은 직무평가 자체를 부정한다. 그들은 인사든, 총무든, 마케팅이든 서로 상이한 직무이지만 조직에서 하나라도 빠지면 안 되는 중요한 직무들인데 이들에게 서열을 매기는 것은 인간의 장기 중 심장이 중요한지, 위가 중요한지, 폐가 중요한지를 결정하는 것과 진배없다는 것이다. 즉 조직 내 모든 직무는 만들어진 이유가 있고, 그렇기에 서열을 매길 수 없을 정도로 모두 중요하다는 것이다.
※ 심지어 필자는 직무평가 결과를 받아들이지 못하겠다는 노동조합의 반발로 인하여 동일한 기업에서 직무평가만 3번 이상 수행한 적도 있었으나 매번 다른 사람들이 직무평가를 진행하더라도 결과는 비슷하였다.
이러한 주장은 내·외부 고용시장의 균형가격 논리를 모두 무시한 채, 새로운 제도 변화에 대한 구성원의 두려움과 거북함에 편승하여 직무평가의 방향과 취지를 곡해한다. 연령이 높은 직원들은 기득의 이익을 방어하기 위하여, 젊은 직원들은 조직에 대한 불신과 노동조합의 주장에 떠밀려 조직 내 모두가 한 목소리로 직무평가 결과를 거부한다. 상황이 이러하다 보니 직무급의 지급 기준이 되는 ⓐ직무평가등급의 개수는 ⓑ직무평가등급별 직무급의 차이와 ⓒ직무평가등급별 직무 배정과 함께 중대한 문제로 부각된다.
Ⅱ. 적정 직무평가등급의 개수 및 특성 탐색 : 군집분석 활용
오계택·유규창·이혜정·임상훈이 작성한 『업종별 직무평가 도구개발(2018)』에 따르면 임금 등급(직무급의 경우 직무평가등급을 말함.)을 설정하는 절차에 대해서 소개하고 있는데, 그 절차를 살펴보면 크게 ①직무평가등급의 개수는 몇 개로 설정할 것인지?, ②각 직무평가등급별 어떤 직무를 배정할 것인지?로 구분된다.
상기 연구자료는 첫 번째 단계에서 계층적 군집분석을 활용하여 적정 군집의 수를 추정하는데, 여기서 추정된 군집의 수는 이후 직무평가등급의 개수가 된다. 두 번째 단계는 앞서 얻은 적정 군집의 수를 K-Means 군집분석에 활용하여 각 군집별 직무평가요소에 기반한 특성을 정의한다. 마지막으로 군집별 정의에 부합하는 직무를 배정함으로써 직무평가등급과 그 안에 직무를 확정한다.
갑자기 알 수 없는 용어들과 함께 "군집"이라는 단어가 눈에 띈다. 이미 눈치 채셨겠지만 직무평가등급의 개수와 등급별 특성(정의)을 얻기 위해서는 군집분석(Clustering Analysis)이라는 데이터 마이닝 기법을 활용하여야 한다. 혹자는 왜 저리 복잡해보이는 기법을 활용하여야 하는지 의구심을 가질 수 있지만, 내부 구성원들에게 매우 민감한 사안인 만큼 인사부문의 관계자들은 상당한 공격에 휩싸일 수 있다. HR 담당자들은 그러한 리스크는 최대한 피하고 싶기에 컴퓨터에게 판단을 유보하거나 그 근거를 요구할 수밖에 없다.(아니면 그냥 HR 컨설팅을 맡기거나...)
군집분석을 쉽게 설명하면 그냥 유사한 성질을 가지고 있는 직무들끼리 컴퓨터가 알아서 사전에 정의된 규칙에 기반해 묶어주는 것이라고 보면 된다. 그렇다면 컴퓨터는 어떻게 직무들끼리 "유사하다"는 것을 이해할 수 있을까? 그것은 직무의 성질을 직무평가요소로 계량화하여 측정하기 때문이다.
우리는 직무를 평가할 때 직감으로 할수도 있지만 여러 요소로 세분화시켜 평가를 진행할 수도 있다. 가령, 특정 직무를 ⓐ전문지식의 필요 정도, ⓑ수행하여야 하는 업무의 양, ⓒ직무수행 결과가 미치는 영향력의 범위 등과 같은 직무평가요소를 기준으로 5점 척도를 활용해 평가하였다면 그 직무의 성질은 직무평가요소를 토대로 측정된다. 이렇게 각 직무별로 성질이 측정되면 컴퓨터는 직무들을 서로 비교해보면서 "음! A직무는 전문지식의 필요 정도와 수행하는 업무량이 상당히 많은 게 마치 B직무를 보는 거 같군!"라며 유사성을 계산하기 시작한다. 그 결과 우리는 직무들이 서로 유사한 그룹끼리 묶인 결과를 컴퓨터로부터 받게된다.
그러나 컴퓨터는 만능이 아니다. 우리가 직무별 유사한 정도를 판단하는데 몇 가지 규칙을 제공하지 않으면 위와 같은 일이 벌어지지 않는다. 군집분석에서 필요한 사전 규칙은 ①유사함을 측정하는 거리의 단위와 ②측정 기준이다. 우선, ①번 항목의 경우 다양한 거리 개념이 존재하는데, 거리는 결국 공간적인 형태를 기반으로 측정되는 개념이므로 직무평가요소(변수)의 개수가 많은 직무평가의 경우에는 민코프스키 거리를 사용하는 것이 바람직하다.
[유사성 측정에 사용되는 거리]
1. 유클리드(Euclidean) 거리 : 두 점 간의 차이를 제곱하여 모두 더한 값의 양의 제곱근 → 피타고라스의 정리 참고
2. 맨해튼(Manhattan) 거리 : 두 점 간의 차이를 절대값을 취해 모두 더한 값 → 유클리드 거리와 거의 유사
3. 민코프스키(Minkowski) 거리 : N차원 공간에서의 거리 → N값이 1이면 맨해튼 / N값이 2이면 유클리드와 동일
4. 마할라노비스(Mahalanobis) 거리 : 변수 간의 상관성을 고려한 거리 → 변수의 이상값을 진단할 수 있음.
※ 마할라노비스 거리는 아래 글을 참고하면 더 이해가 잘 될 것임!
참고글) https://dbr.donga.com/article/view/1202/article_no/8899/ac/a_view
두번째 측정도구로는 군집 간 간격을 계산하는 방식으로서 ⓐ최단 연결법, ⓑ최장 연결법, ⓒ평균 연결법, ⓓ중심 연결법, ⓔWard연결법으로 구분된다. 각각 기준점을 무엇으로 설정하는지에 따른 분류로서 명칭에 나와있듯이 최단 거리, 최장 거리, 평균 거리 등을 활용하여 유사한 직무들을 묶는다. 우리는 K-Means 군집분석과 유사한 결과값을 도출하기 위하여 Ward 연결법을 사용하는 것을 권한다.
※ 기우이지만 혹여 각각의 연결법의 절대적 우위가 있다고 오해하면 안 된다. 사실 대부분의 분석 기법의 선택은 분석자의 "취향"을 타는 경우가 많다. 필자가 Ward 연결법을 선호하는 것 역시 취향이다.
다만, 『업종별 직무평가 도구개발(2018)』이 제시한 방법론에는 다소 한계가 존재한다. 우선, 계층적 군집분석을 통해 적정한 군집 수를 추정하는 단계에서 사람의 임의적인 판단이 개입할 수 밖에 없다. 즉, 계층적 군집분석 결과인 덴드로그램(Dendrogram)을 활용하여 몇 단계에서 끊는 것이 적정한지를 분석자가 판단하는 본질적인 한계가 존재한다는 것이다. 또한, 계층적 군집분석에 의해 군집별로 배정된 직무들과 K-Means 군집분석을 통해 군집별로 배정된 직무들이 서로 상이할 수 있다는 점이다. 이것을 조정하기 위하여 상기 자료는 다시 한번 분석자 혹은 의사결정권자의 임의적인 판단을 요구하고 있다.
제도 기획 단계에서 임의성이 많이 개입할 수록 구성원들의 추궁과 챌린징의 빈도는 높아질 것이므로 임의성을 최소화하거나 적절한 근거를 마련하는 것이 중요하다. 따라서 본 글에서 제시하는 직무평가등급과 그 특성을 정의하는 방법은 상기 연구자료의 직무평가 방법론을 필자의 경험을 토대로 변형한 것임을 미리 밝혀두고 싶다.
Ⅲ. 직무평가와 NB Clust 패키지의 활용
직무를 평가한 데이터에서 몇 개 등급으로 직무를 묶어주는 것이 바람직한지를 판단해주는 지표들이 있다. 이러한 지표는 여러 학자들의 논문을 통해서 밝혀진 것들인데, R의 NB Clust 패키지는 그러한 논문들이 제시한 적정 군집의 개수를 추정하는 공식을 통하여 가장 적절한 군집의 수, 즉 직무평가등급의 개수를 판단하여 제공해준다. 해당 패키지가 구체적으로 어떤 지표(사실상 공식에 가깝다.)들로 구성되어 있는지 알고싶다면 아래 파일을 참고하기 바란다.
우리는 NB Clust를 통해 적절한 직무평가등급의 수를 추천받았다면 이후에는 각 등급별로 어떤 직무들을 배정하여야 하는지 판단하여야 한다. 이때 상기 그림과 같이 4가지 접근방식을 고려해볼 수 있으나 사실 각각의 방법 모두 상당히 많은 비판을 받을 수 있다. ⓐ비율 구분 방식은 어떤 비율을 선택하느냐에 따라 0.000001점 차이로 어떤 직무의 직무평가등급이 달라질 수 있으며, ⓑ동일점수 적용 방식은 각 점수 구간대에 배정된 직무의 수가 지나치게 달라 직무급 적용이 어렵고 구성원들을 설득할 수 있는 논리가 마땅치 않다. 그 밖에 ⓒ점수격차 적용방식은 필자가 적용해본 가장 최악의 방식으로서 점수 격차가 많이 나는 지점을 직무평가등급을 구분하는 기준점으로 설정하는 컨셉이나 이 역시 등급별로 배정된 직무의 수가 ⓑ와 같이 왜곡될 수 있어 그다지 좋은 접근법은 아니다.
여러 기준과 기법을 적용해본 결과 필자가 경험한 가장 타당한 방법은 군집분석을 통해 도출한 직무들의 유사성을 토대로 이들을 구분하는 절대점수를 설정한 뒤, 이것을 기반으로 직무평가등급별 적정 직무를 배정함으로서 직무평가등급체계를 구축하는 것이였다. 따라서 다음 인사 이야기에서 그러한 일련의 절차를 어떻게 수행할 수 있는지 실무자 입장에서 좀 더 구체적으로 기술해보도록 하겠다. R언어를 다루줄 알아야 하므로 기초적인 R언어에 대해서 사전에 공부하고 오면 도움이 될 것이다..!