본문 바로가기
노무 이야기

[노무-23015] 인사평가 시 발생 가능 오류와 차별 유무 입증 ②_R코드

by 노동법의수호자 2023. 4. 9.
반응형

Ⅰ. 인사평가상 차별의 증명

◎ 대법원은 인사평가를 통한 집단적 차별 사건에서 인사평가가 사용자 재량권에 포섭됨을 밝힘과 동시에 그것이 부당하게 남용되는 경우 사법처리의 대상이 되어 무효가 될 수 있다고 판시함.

근로자에 대한 인사고과는 원칙적으로 인사권자인 사용자의 권한에 속하므로 업무상 필요한 범위 안에서는 상당한 재량을 가진다 할 것이나,  사용자는 근로자의 근무실적이나 업무능력 등을 중심으로 객관적이고 공정한 평정의 기준에 따라 이루어지도록 노력하여야 하고 그것이 해고에 관한 법적 규제를 회피하고 퇴직을 종용하는 수단으로 악용되는 등의 불순한 동기로 남용되어서는 아니 된다고 할 것이다. 이와 같이 사용자의 인사고과가 헌법, 근로기준법 등에 위반되거나 객관적이고 공정한 평정의 기준을 현저하게 위반하여 정당한 인사권의 범위를 벗어난 때에는 인사고과의 평가 결과는 사법심사의 대상이 되어 그 효력을 부인할 수 있다.

(대법원 2015. 6. 24. 2013다22195 등)

 

◎ 이때, 문제가 된 인사평가 결과가 특정 집단의 퇴출 목적으로 이루어진 것이라는 차별을 증명하기 위해서는 ①특정 집단과 나머지 일반 근로자를 전체적으로 비교하여 두 집단 사이의 인사고과가 통계적으로 유의미한 격차가 있었는지, ②그러한 격차가 사용자의 불순한 의도에서 기인한 것인지를 입증하여야 함.

 

◎ 사실, 두 번째 증명 요건인 "사용자의 불순한 의도"는 사실관계에서 나타난 정보를 종합적으로 판단하는 단계로서 사회통념에 기반한 상식선에서 회사의 의도를 설명하면 되므로 인사노무 담당자는 첫 번째 요건에 비해 상대적으로 쉽게 입증할 수 있을 것임.

 

◎ 그러나 첫 번째 요건은 인사고과를 집단적으로 비교하여 무려 "통계적"으로 유의미한 격차가 있었는지를 살펴보는 것이므로 어떤 식으로 접근해야 할지 막막할 수 있음. 

 

KT 집단적 차별 사례에서 대법원은 A등급을 5점, B등급을 4점 , C등급을 3점, D등급을 2점, F등급을 1점으로 치환하여 집단 간 평균, 표준편차, 중간값을 비교하는 등의 방법으로 판단하였음. 그러나 평균값은 특정 이상값에 의해 쉽게 영향받을 수 있으며, 관측값(피평가자 수)의 개수, 기타 교란 변수(특정 집단 내 피평가자가 동일·유사한 직무 수행자와 같이 설명가능한 다른 이유 때문에 평균값이 다른 경우) 등에 의해 왜곡될 수 있음.

 

따라서 이하에서는 판례에서 말한 "집단 간 통계적 유의미한 격차"를 보다 정교한 방식으로 입증하는 통계분석 기법을 소개하고자 함.


반응형

Ⅱ. 통계적으로 유의미한 격차 입증 방법 : 분산분석

1. 분산분석의 정의

◎ 분산분석(ANOVA; Analysis of Variance)은 두개 이상으로 구성된 그룹의 평균을 비교하는 목적으로 사용되는 통계분석 방법임. 분산분석이 평균을 비교함에도 불구하고 분산이라는 용어를 사용하는 이유는 비교대상 그룹간 분산과 그룹내 분산을 비교하여 분석이 이루어지기 때문임.

 

◎ 분산분석에서 사용되는 종속변수는 인사평가 결과값이 되고, 독립변수는 노동조합 가입 여부 등과 같이 평가결과에 영향을 미칠 것으로 예상되는 특정 집단 소속 여부라고 보면 됨. 따라서 분산분석에서의 종속변수는 메트릭 척도가 되고 독립변수는 명목척도를 가지게 됨.

(척도에 대한 자세한 설명은 아래 링크 참고)

 

[인사-23008] 조직문화, 인사평가 등 HR Survey의 척도와 합리적인 리커트 척도 제안

Ⅰ. 측정과 척도의 관계 어느날 아는 사람으로부터 전화가 왔다. "야..! OO아 갑자기 상무가 OO에 대해서 설문조사를 해보라고 하는데, 어떻게 해야하냐...?" 답답한 것인지 아니면 막막한 것인지

laborlawseok.tistory.com

 

◎ 만약 독립변수가 두 개일 경우엔 2요인 분산분석(two-factor ANOVA) 혹은 이원배치 분산분석(two-way ANOVA)이라고도 하나, 우리는 특정 집단의 소속 유무에 따른 인사평가 결과의 차이를 살펴보고자 하는 것이므로 단일요인 분산분석(one-factor ANOVA)에 대해서만 살펴보고자 함.

 

◎ 한편, 분석분석 활용 시 통계적인 가정(독립성, 정규성, 등분산성)이 충족되어야 하나 회사에서 집단적인 차별을 비교하는 경우 관측값이 풍부하고, 최종 평가는 한 사람당 하나씩 받는다는 점에서 크게 신경쓸 요소는 아니라고 판단됨.

 

2. 분산분석 실시 원리

◎ 상기 예시 표는 민주노총 소속 조합원 5명, 한국노총 소속 조합원 5명, 비조합원 5명으로 총 15명으로 구성된 A 회사에서 인사평가한 결과를 열거한 것임.

 

◎ 민주노총 조합원 중 첫 번째 근로자는 인사평가 점수 77점으로 가장 낮은 점수를 받았는데, 이러한 점수는 어떠한 원인에 의해서 나타난 것인지 검증하는 작업이 분산분석임. 분산분석에서는 이러한 차이를 두 가지 요소로 구분하여 설명함.

 

◎ 첫 번째 요소는 해당 근로자의 소속에 따른 차이로서 우리가 검증하고자 하는 대상임. 만일 각 근로자들의 점수 차이가 그 근로자가 속한 집단에 기인한 것이라면 일차적으로 집단 간 유의미한 격차가 있다고 말할 수 있을 것임. 

민주노총 소속 조합원 5명의 평균점수는 81.2점이므로 전체평균인 84점보다 2.8점 낮게 나타났다.
따라서 민주노총에 소속되면 평균적으로 2.8점 낮은 점수를 받을 것이라고 예상할 수 있게 된다.

 

◎ 두 번째 요소는 그냥 각 근로자들이 가지고 있는 개인적인 특성에서 기인하는 경우를 말함. 만일 낮은 점수가 단순히 민주노총 조합원 1의 개인적인 능력이 부족해서 나타난 것이라면 집단 간 유의미한 격차가 있다고 말할 수 없을 것임.

민주노총에 소속되면 평균적으로 81.2점은 받아야 한다.
그러나 민주노총 소속 조합원 1은 개인적인 특성에 기인해 그룹 내 평균보다 4.2점 모자르다.

 

◎ 종합해보면 소속그룹 간의 차이가 유의미하게 소속그룹 내의 차이를 압도한다면 개인적인 특성에 의한 영향력보다 각각의 근로자들이 어디에 소속되어 있는지에 따라 평가결과가 달라진다고 볼 수 있으므로 이때 우리는 특정 집단과 그 외 집단 사이의 통계적으로 유의미한 격차가 있음을 확인할 수 있게 됨.

[분산분석 원리 종합]

민주노총 조합원 1(77점) = 전체평균(84점) + 소속집단에 따른 차이(-2.8점) + 개인적인 특성(-4.2점)

 

3. 구체적인 분석 Logic : 분산분석표 작성

◎ 결국 소속집단에 따른 차이와 개인적인 특성을 계산하여 그 정도가 어떠한지를 비교하면 되므로 ⓐ그룹간 제곱합*(소속집단에 따른 차이)의 평균, ⓑ그룹내 제곱합(개인적인 특성)의 평균을 구하여야 함.

※ 제곱합을 이용하는 이유는 인사평가 점수를 평균값으로 빼면 양수값, 음수값이 나타나 이를 합산하였을 때 서로 상쇄되어 0으로 수렴하므로 제곱을 시켜 더해주는 방식으로 집단의 차이를 계산코자 함.

 

◎ 그룹간 제곱합(SSB, Sum of Square Between group)은 세 그룹(민주노총, 한국노총, 비조합원)의 평균과 전체평균의 차이를 제곱하여 모두 더하고, 이를 각 그룹 내의 근로자의 수만큼 곱한 값이 됨.

 

◎ 그룹내 제곱합(SSW; Sum of Square Within group)은 그룹내의 개별 관측값이 그룹평균으로부터 떨어진 차이를 제곱하여 더한 값임.

 

◎ 그룹간, 그룹내 제곱합을 모두 구하였다면 그 다음으로 이들의 평균값을 산출하여야 함. 평균값을 계산하기 위해서는 자유도를 알아야 함. 자유도와 평균값은 아래와 같이 계산할 수 있음.
(자유도 개념을 굳이 알지 못하더라도 통계분석 가능.)

[그룹간 제곱합에 대한 자유도]
우리는 전체 평균값을 알고있으므로 3개 그룹(민주노총, 한국노총, 비조합원) 중 2개의 평균값만 알고 있으면 나머지 평균값은 자동적으로 결정됨. 따라서 그룹간 제곱합에 대한 자유도는 2임.

▷ 그룹간 제곱평균(MSB) = SSB(137.2) ÷ 그룹간 제곱합에 대한 자유도(2) = 68.6점

[그룹내 제곱합에 대한 자유도]
각 그룹내 근로자 수가 5명 씩이고 우리는 그룹평균을 알고 있으므로 4명의 평가점수만 알면 나머지 하나는 자동적으로 정해짐. 그러나 여기서 그룹의 개수가 3개이므로 그룹내 제곱합에 대한 자유도는 12(4 × 3)가 됨.

▷ 그룹내 제곱평균(MSW) = SSW(190.8) ÷ 그룹내 제곱합에 대한 자유도(12) = 15.9점

 

◎ 위에서 구한 그룹간 제곱평균(MSB)를 그룹내 제곱평균(MSW)로 나누면 F-통계량 값이 산출되는데, 만약 F-통계량 값이 4이면 개인적인 특성의 4배에 가까운 그룹에 의한 차이가 존재한다고 해석할 수 있음. 따라서 F-통계량 값이 크면 클 수록 민주노총, 한국노총, 비조합원이라는 집단 소속 여부가 인사평가 결과에 중대한 영향을 미치고 있음을 나타냄.

 

◎ 지금까지 진행한 과정을 일목요연하게 표현한 표가 "분산분석표(ANOVA table)"이라고 부르며, 실제 실무에서 우리가 해석할 수 있어야 하는 정보임. "위와 같이 복잡한 작업을 다하고 이렇게 작업해야 한다고?"라고 생각하는 독자가 있을 거 같아 미리 말씀드리자면 걱정마시라! 컴퓨터가 알아서 다 해준다 :)

 

4. F-통계량에 대한 가설검정

◎ 여기까지 읽은 독자들은 아마 찝찝한 기분이 들 것임. 그 이유는 앞서 F-통계량은 크면 클 수록 집단간 격차가 있을 것이라고만 했지, 얼마나 커야지 통계적으로 유의미하게 격차가 있는지 여부에 대해선 설명하지 않았음.

 

◎ 이를 확인하는 작업이 "F-통계량에 대한 가설검정" 단계임. 가설검정은 말 그대로 가설을 설정하고 이것이 통계적으로 합리적인 범위 내에서 기각할 수 있는지를 검정하는 것임.

 

◎ 우리는 분산분석 수행 시 자동으로 아래와 같은 가설을 설정하게 됨. 만일, 귀무가설이 기각되는 경우 우리는 해당 인사평가 점수들이 통계적으로 유의미한 격차가 있다고 말할 수 있음.

귀무가설(H0) : 민주노총, 한국노총, 비조합원 간의 인사평가 점수 평균값의 차이는 존재하지 않는다.
대립가설(H1) : 민주노총, 한국노총, 비조합원 간의 인사평가 점수 평균값의 차이는 존재한다.

 

◎ 가설 검정의 기본적인 내용을 전부 설명하기에는 글이 지나치게 길어질 것 같아 핵심만 말하자면 F-통계량 값에 대한 P-value가 0.05이하이면 민주노총, 한국노총, 비조합원 사이에는 통계적으로 유의미한 격차가 존재한다고 해석하면 됨. 물론, 이 역시 컴퓨터가 알아서 다 해주므로 우리는 위 분산분석표와 P-value를 도출할 수 있는지 코드만 기억하면 될 것임.


반응형

Ⅲ. 분산분석 수행에 필요한 R코드

◎ 일단, 150명이 소속되어 있는 회사를 가정하여 민주노총 조합원 50명, 한국노총 조합원 50명, 비조합원 50명에 대한 인사평가 샘플 데이터를 작성함. 이때 민주노총 조합원의 경우 평균값 50점, 표준편차 15점, 한국노총 조합원의 경우 평균값 65점 표준편차 20점, 비조합원의 경우 평균값 70점 표준편차 25점으로 설정함.

union_data = data.frame(
  group = c(rep("민주노총", 50), rep("한국노총", 50), rep("비조합원", 50)),
  score = c(rnorm(50, 50, 15), rnorm(50, 65, 20), rnorm(50, 70, 25)))

 

◎ 이후 종속변수에 인사평가 점수값(Score)을 할당하고, 독립변수에는 집단값(Group)을 할당하여 분산분석을 실시하는 코드는 다음과 같음. 

# Run the ANOVA test
result <- aov(score ~ group, data = union_data)

# Print the ANOVA table
summary(result)

 

◎ ANOVA 결과를 실행시켜보면 다음과 같음. F-통계량 값은 13.82이고 이에 대한 P-value는 0.05 이하로서 귀무가설을 기각할 수 있다고 보고됨. 즉 민주노총, 한국노총, 비조합원들의 인사평가 결과에는 통계적으로 유의미한 격차가 존재함.(랜덤 데이터를 활용하였기에 결과값을 상이할 수 있음.)

 

 

 

[참고문헌]

1. 이군희(2014), 연구방법론의 이해, 북넷

 

 

728x90
반응형

댓글