본문 바로가기
인사 이야기

[인사-23004] 조직몰입 요인 탐색 : 블라인드와 KoBERT AI 활용

by 노동법의수호자 2023. 1. 25.
반응형

Ⅰ. 조직의 '진짜' 목소리 : 임금님 귀는 당나귀 귀!! 

"우리 임금님 귀는 당나귀 귀!!"

 

어느 날 대나무 숲에서 들려오는 누군가의 외침은 그 나라 임금님의 심장을 뒤흔들고 심기를 불편하게 만든다. 도대체 어떤 녀석이 높디 높은 임금님의 귀가 당나귀 귀라고 외치는 것일까? 아니 굳이 말할 거면 대놓고 면전에 대고 말하지 뒤에서 말하는 것은 무슨 심보일까? 임금은 자신들의 백성을 바라보며 씁쓸하다는 듯이 자신의 수염을 어루만질 뿐이다.

 

한편, "임금님 귀는 당나귀 귀"라 외친 이는 해당 사실을 외치기까지 상당히 고민하고 또 고민하다 답답한 마음에 대나무 숲 한 우물가로 가 '임금님 귀는 당나귀 귀'라는 사실을 외친다. 아무도 듣지 않을 것이라 혹은 누가 듣더라도 내가 외쳤을 것이라고 의심하진 못할 것이라 생각하고 더 큰 소리로 그 사실을 외친다. 이 소식에 이웃 나라까지 웃음 바다가 된 것은 쉿! 공공연한 비밀이다.

 

위 설화는 그리스의 마케도니아 왕국 때부터 전해져오는 이야기로 그리스 신화 중 하나이다. 우리는 대부분 유치원, 초등학교 시절에 이러한 설화와 함께 선생님으로부터 "소문은 무서운 것" 혹은 "사람은 정직해야 한다는 것"과 같은 진부한 교훈을 전달받곤 했다. 그러나 인사노무 담당자는 이 이야기에서 또 다른 교훈을 캐치하여야 한다. 그것은 바로 조직의 '진짜' 목소리는 공식적인 커뮤니케이션 채널인 ⓐ설문조사, ⓑFGI(Focus Group Interview), ⓒ워크샵 등 각종 VOC로부터는 듣지 못한다는 사실이다. 왜냐하면 임금님(임원 혹은 대표, 회장 등)이 존재하는 계층구조 내에서 구성원은 익명성이라는 그늘 속에 자신을 숨길 수 없기 때문이다.

 

그렇기에 우리는 공식적인 커뮤니케이션을 공략하기 보다는 익명성이 철저하게 보장된 곳에 구성원들로부터 이야기를 듣는 노력을 하여야 한다.

 

Ⅱ. 그럼 어디서 '진짜 목소리'를 들을까? : 블라인드 및 잡 플래닛 기업 리뷰

익명성이 철저히 보장된 곳에서 구성원들로부터 이야기를 드는 노력은 어떻게 수행해야 할까?

 

간단하다. "잡 플래닛(Job Planet)", "블라인드(Blind)" 등과 같은 기업 평판 조회 사이트에서 현직자 또는 퇴직자가 남긴 기업 리뷰를 살펴보면 된다. 매튜 코리토어(Matthew Corritore), 아미르 골드버그(Amir Goldberg) 그리고 스리바스타바(Sameer B. Srivastava)는 조직문화를 측정 및 평가하기 위한 새로운 방법으로 이메일, 슬랙 메시지, 기업 평판 사이트인 글래스도어로부터 텍스트 데이터를 수집·분석해 기업 합병으로 인한 문화적 충돌의 부정적인 영향을 예측하는데 그 유용성을 증명하였다.

 

뿐만 아니라 테레사 슈미델(Theresa Schmiedel) 등은 포춘이 선정한 500대 기업의 글래스도어 기업리뷰를 수집하고, 토픽모델링이라는 텍스트마이닝 기법을 활용하여 구성원들이 지각하는 조직문화 등을 진단하기도 하였다. 그 밖에 톰 레이킨(Tom Lakin)은 그의 글 『당신이 글래스도어를 무시하면 안 되는 이유(why you shouldn't ignore glassdoor)』에서 회사(혹은 인사담당자)에게 글래스도어의 피드백을 경청할 것을 권고한 바 있다.

 

국내에서도 잡 플래닛 등으로부터 정보를 수집해 연구한 사례가 존재한다. 어떤 연구는 잡 플래닛에서 산업별로 기업 리뷰 데이터를 수집하고 이를 LDA 토픽모델링 및 동시출현 단어분석(의미망 분석)을 활용하여 직무만족요인을 도출하였고, 또 다른 연구에서는 기업 리뷰에서 꼰대라는 용어가 자주 사용되는 조직일수록 사내문화 만족도가 유의미하게 감소한다는 사실을 확인한 바 있다. 이렇듯 기업 평판 조회 사이트에서 제공하는 기업 리뷰는 조직문화를 진단·측정하고 예측하는데에 중요한 연구 데이터가 될 수 있다.

 

이번 글의 주제인 조직몰입 요인 탐색을 위하여 산업별로 10개의 기업을 선정하고 이들 기업의 리뷰 데이터를 일전에 소개했던 웹 크롤링 기법을 활용하여 총 10,073개를 수집하였다. 웹 크롤링은 아래 링크를 통해서 공부하면 좋을 거 같다.

 

[인사-22011] 조직문화 진단과 블라인드(Blind) 웹 크롤링 2편

Ⅰ. 분석환경 구축하기 웹 크롤링을 하기 위해서는 몇 가지 준비사항이 있다. 먼저 데이터를 수집할 때 사용하는 Interpreter인 ①파이썬(Python)을 다운로드 받아야 하고 이후 이를 활용하기 쉽게 만

laborlawseok.tistory.com

 

Ⅲ.  텍스트 마이닝과 KoBERT 알고리즘

텍스트마이닝은 문서 요약(Text summarization), 특성 혹은 주제 추출(Keyword extraction), 유사도 비교(Similarity detection), 감성분석(Sentiment analysis) 등 여러 영역에서 다양한 방식으로 활용될 수 있다. 여기서는 어떤 요인이 조직몰입이나 만족에 영향을 미치는지를 살펴보기 위하여 감성분석 기반 텍스트마이닝을 실시한다.

 

감성분석의 방법으로는 특정 단어와 감성 분류 점수 간의 쌍을 담은 사전(Lexicon) 기반으로 접근하는 방법과 컴퓨터가 직접 자료를 통해 배우는 기계학습 모형을 이용하여 접근하는 방법으로 구분된다. 의 접근법은 상당한 양의 감성용어 사전이 분석 전에 갖춰져야 한다. 영어의 경우 AFINN, Bing, NRC, VADER 등 다양한 종류의 감정들을 내포한 사전이 마련되어 있으나 한국어의 경우 군산대에서 만든 감성사전(KNU) 외에는 특별히 유의미한 사전은 존재하지 않는다. 다만 군산대에서 만든 감성사전 역시 실제 적용 가능성에 대해서는 회의적이다.

 

따라서 본 탐색은 기계학습을 통한 감성분석을 실시할 것이다. 기계학습을 통한 감성분석에는 로지스틱 회귀분석, 의사결정나무 분석, 나이브 베이즈 등과 같은 다양한 모델이 적용될 수 있지만 KoBERT 알고리즘을 활용하여 문제를 해결해보고자 한다.

 

KoBERTSKT에서 개발한 한국어 BERT(Bidirectional Encoder Representations from Transformers)모형으로서 구글이 공개한 AI 언어 모델인 Multilingual BERT에서 파생된 모형이다. BERT은 기존 임베딩 방식인 Word2Vec, GloVe 등보다 월등한 성능을 가지고 있는 것으로 알려졌으며, 스탠퍼드 대학교가 위키피디아 등의 Data Set을 통해 만든 Test Set“SQuAD"에서도 높은 점수를 기록하였다. 그러나 한국어는 교착어라는 특성으로 인해 과도하게 많은 형태소를 가지는 등 일반적인 언어와는 차이가 있으므로 한국어 데이터에 맞는 BERT 모델이 필요해졌다. 이러한 한계점으로부터 등장하게 된 모델이 바로 한국어 BERT 모형인 KoBERT이다.

 

KoBERT의 경우 글의 문맥을 이해하는데에 다른 모형에 비하여 성능이 좋으므로 블라인드 텍스트와 같이 반어적 성격의 글들이 주로 존재하는 데이터에서 강점을 보이며, 긴 글보다는 짧은 글을 분류하고 분석할 때에 더 나은 성능을 보여준다는 점에서 블라인드 데이터를 분석하는데에 적합하다.

 

Ⅳ.  "진짜 목소리"를 통해 추출한 조직몰입 요인

KoBERT와 동시출현 단어빈도 분석 등 다양한 텍스트 마이닝 기법을 활용하여 상기 표와 같은 결론을 얻을 수 있었다.조직몰입에 상당한 영향을 미칠 수 있는 요인으로 ⓐ조직의 전반적인 업무 분위기(수직적 VS 수평적), ⓑ경영진의 리더십에 대한 신뢰 정도(불신 VS 신뢰), ⓒ연봉 및 복지수준(낮음 VS 높음), ⓓ일과 삶의 균형 정도(낮음 VS 높음), ⓔ회사의 미래 전망(부정적 VS 긍정적), ⓕ개인의 성장 가능성(물경력 VS 커리어 발전), ⓖ주변 동료관계(부정적 VS 긍정적), ⓗ업무 시스템의 체계화 정도(중구난방 VS 체계적 시스템)로 정리할 수 있다. 

 

상기 표는 각 감정별로 어떤 요인들이 주로 나타났는지 보여주는 표로서 간략히 설명하자면 분노라는 감정에는 주로 낮은 연봉 및 복지 수준이 주효한 영향을 미쳤고, 그 외에 수직적인 분위기, 경영진에 대한 불신, 불투명한 회사의 전망, 체계적이지 않은 업무 시스템이 그 다음으로 영향을 미쳤다는 것을 의미한다. 다른 감정별로 이런 식으로 해석하면 된다.

 

연봉 및 복지 수준이 압도적으로 높을 수록 부정적인 감정은 전반적으로 낮아졌으며,  개인의 성장 가능성이 확대될 수록 긍정적인 감정이 높아졌다. 그러나 회사의 미래가 불투명한 경우 경영진 리더십에 대한 불신 경향이 강해지고 불안의 감정이 상당한 폭으로 커지는 양상을 띄었다.

사실 앞에서 분석 결과를 다양하게 설명할 수 있으나 글이 지나치게 길어지니 결론만 말하자면 회사는 위 8가지 조직몰입을 전부 충족시키기 어려운 경우 연봉 및 복지 수준만큼은 타 회사 대비 압도적으로 지급함으로서 적정 수준의 조직몰입도를 유지할 수 있을 것으로 기대된다. 

 

[참고 문헌]

1. Matthew Corritore, Amir Goldberg, Sameer B. Srivastava(2010). 새로운 기업문화 분석기법, 하버드 비즈니스 리뷰. 1-2월호

2. Schmiedel, T., Müller, O., & vom Brocke, J. (2019). Topic modeling as a strategy of inquiry in organizational research: A tutorial with an application example on organizational culture. Organizational Research Methods, 22(4), 941–968.

3. 김동욱, 강주영, 임재익(2016), 토픽모델링 기법을 활용한 산업별 직무만족요인 비교 조사 : 잡플래닛리뷰를 중심으로, 한국IT서비스학술지, 15(3): 157-171

4. 김성준, 이중학, 채충일(2021), 꼰대, 한국기업 조직문화 차원의 탐구, 조직과 인사관리연구, 45(2): 1-35

5. 조희련, 임현열, 차준우, 이유미(2021), KoBERT, 나이브베이즈, 로지스틱 회귀의 한국어 쓰기 답안지 점수 구간 예측 성능 비교, 춘계학술발표대회 논문집 28(1): 501-504

6. 이로제, 박은환, 이재구(2020), BERT 파생 모델의 한국어에 대한 성능 비교, 2020년도 한국통신학회 동계종합학술발표회 논문집 901-902P

7. 박규훤, 정영섭(2021), KoBERT를 사용한 한국어 일상 주제 분류, 한국컴퓨터종합학술대회 논문집 1,735-1737P

8. 이상아, 장한솔, 백연미, 박수지, 신효필(2020), 소규모 데이터 기반 한국어 버트 모델, 한국정보과학회 논문지 47(7): 682-692
728x90
반응형

댓글