[인사-22010] 조직문화 진단과 블라인드(Blind) 웹 크롤링 1편
Ⅰ. 조직문화 개선에 대한 뜨거운 관심
최근 기업들에서 사내 문화 개선에 열을 올리고 있는 추세이다. CJ대한통운은 MBTI 실시 후 코칭 북을 지급하는가 하면 의료기기 판매 및 렌탈 업체인 세라젬은 기업문화 전담 팀을 만들어 조직문화에 대응하고 있으며, SPC의 경우 지주사 내 직속 부서인 노사문화혁신실을 만들어 전 계열사에 대한 조직문화를 개선하기 위해 적극적으로 노력하고 있다.
국내 회사들이 조직문화에 관심을 갖게 된 것은 소위 '네카라쿠배당토'라는 신흥 IT 기업들의 출현과 그들의 폭발적인 성장과 결을 같이 한다. 네카라쿠배당토는 네이버, 카카오, 라인, 쿠팡, 배달의 민족, 당근마켓, 토스의 앞 글자를 따서 만든 신조어로서 사회초년생들이 가장 관심있고 가고 싶어 하는 기업들의 라인업이다.
2021년 8월, 잡코리아에서 대학생 1,106명을 대상으로 가장 취업하고 싶은 기업을 조사한 결과 1위는 카카오, 2위는 삼성전자, 3위는 네이버로 최상위 3위 기업 안에 IT대기업이 두 자리나 차지하였다는 것이 상당히 유의미하다고 볼 수 있다. 그 뿐만 아니라 엔씨소프트나 넷마블과 같은 게임회사들도 CJ제일제당이나 한국전력공사와 같은 대기업들을 밀어내고 10위 안에 자리하였다는 것은 눈여겨 볼만 하다.
상황이 이러하다 보니 기존 대기업들은 MZ세대들을 겨냥한 조직문화 개선 노력을 보이고 있다. 구체적으로 편안한 일자리 완성을 위한 직장 내 괴롭힘 및 성희롱 예방 캠페인, 경쟁력 있는 보상제도 개편, 새로운 소통창구 마련, 워라벨 향상 등 다양한 시도가 계속되고 있다. 그러나 이러한 노력들이 사실상 외부 언론에 '보여주기' 식으로 끝나거나 전혀 엉뚱한 방향으로 흘러가는 경우도 있다. 즉, 개선해야 하는 통점은 왼쪽 다리인데 오른쪽 다리를 수술(혹은 수술하는 척)하고 조직문화가 개선되었다고 보고하는 것이다.
Ⅱ. 조직문화 개선 실패 원인 : 진단에 소극적
1. 성과기간과 개선효과의 입증 어려움
전통적인 한국의 대기업들은 1년 단위로 하는 KPI와 성과평가 지표를 보유하고 있다. 그렇다 보니 사업기간 내 부서가 할당받은 성과를 달성하기 위하여 노력하게 되는데, 조직문화는 가시적인 성과와 측정이 어려워 성과보고가 쉽지 않다. 더욱이 조직문화는 딜과 케네디의 정의에 따라서 '조직에서 일하는 방식'을 의미하므로 장기적으로 자리잡혀 있는 일하는 방식을 1년 내에 개선하여 효과성을 입증하는 것 역시 어렵다.
그렇기에 조직문화 전담팀은 조직문화 개선을 위한 캠페인을 시행할 때 표피적이거나 가시적인 성과에 집중하게 된다. 본질적인 부분은 생각하지 않고 언론에 대표이사가 나와 소위 MZ세대라고 불리는 젊은 직원들과 여러 활동을 하고 브이를 그리며 사진을 찍는 모습을 성과로 생각하거나, 캠패인의 수와 주니어 보드 등 소통활동의 수와 같은 양적 측면을 주로 고려하게 된다는 것이다. 결국 무엇이, 그리고 얼마나 문제인지를 진단하기 보다 곧바로 다른 기업들이 행하는 캠페인을 벤치마킹하여 시행한 후에 단기간에 나타날 수 있는 표피적인 성과에 주목하는 것이 실패의 원인 중에 하나라고 생각된다.
2. 조직정치와 동상이몽
앞서 살펴본 바와 같이 조직문화는 가시적인 성과 입증이 어렵고 상당히 모호한 개념이므로 통제하기 쉽지 않다. 조직 내에서 모호하고 애매한 영역이 있다는 말은 그 안에서 조직정치가 꽃 피우기 쉬운 토양이 마련되었다는 것과 동일한 의미이다. "조직문화 개선"이라는 미명 아래, 이를 전담하는 팀원 중 일부는 일을 크게 벌리기 싫거나 편하고 쉽게 일하기 위하여 조직의 목표와 업무의 범위를 제한적으로 유도하고, 조직문화 개선이 필요한 다른 부서들 역시 본인들의 취약점 내지 단점이 다른 부서나 외부에 드러나는 것을 꺼려해 업무 협조를 소극적으로 하는 경우가 있다.
상황이 이렇다 보니 당연히 정확한 개선점 진단이 이루어지지 않거나 부족하게 이루어질 가능성이 높으며, 이러한 문제에 관심이 많은 경영진이 강력하게 문제 해결을 추진하지 않는 이상 이러한 현상이 개선될 여지는 매우 희박하다고 생각한다.
3. 공식적 커뮤니케이션 채널의 한계
구글이 연마다 사내 설문조사로서 '구글가이스트' 운영하면서 리더십 등 다양한 영역에서 통점을 진단하고 개선할 수 있었다는 기업사례를 벤치마킹하여 국내의 사기업 및 공공기관 역시 매해 동일한 항목의 설문조사를 실시하면서 매년 어떻게 항목들의 수치가 변화하는지 경영진에게 보고한다. 다만 이 역시 조직의 본질적인 한계를 극복하기에는 부족하다.
필자는 실제로 한 화학 산업 내 모 대기업의 리더십 역량 진단 설문조사 도구 개발 및 활용 방안 컨설팅을 진행한 바 있다. 실제 데이터를 분석한 결과를 회사에 보고하니 돌아온 대답은 당황스러웠다. 특정 몇몇 리더들의 리더십 점수가 다른 리더들에 비해 상당히 저조하여 해당 리더가 상처받을까봐 스케일을 조정하거나 희석시키면 좋을 거 같다는 의견이였다.
애초에 리더십이 부족한 리더들에게 신선한 충격을 주어 그들의 역량을 높이고자 하는 목적에서 시행되었던 역량 조사 설문은 그 의미와 시행 목적과 다르게 운영되었다. 조직 내 공식적인 커뮤니케이션 채널은 정보를 수집하는 과정 및 보고하는 과정에서 그 의미가 퇴색될 수도 있다.
Ⅲ. 조직문화 진단 방법의 변화 : 정형 데이터 →비정형 데이터
조직의 문제는 조직 내에서 발생하는 정보를 수집하여 분석 및 진단하는 것이 가장 바람직할 것이지만 앞서 말한 여러 이유로 인하여 정보가 왜곡되거나 시도 조차 좌절될 수도 있다. 따라서 우리 조직에 대한 정보를 조직 내부가 아닌 외부에서 가져오는 방법도 고려해야 한다. 이때, 가장 좋은 외부 웹 데이터로는 "블라인드(Blind)" 내 기업 리뷰라고 생각한다.
블라인드 내 기업리뷰는 실제 현직자만이 글을 작성할 수 있다는 점에서 정보의 현실성이 인정되며 그 기업의 단점뿐만 아니라 장점도 수집할 수 있기 때문에 균형잡힌 데이터로서 그 기업에게 주는 시사점이 크다. 실제 국내외 연구에서도 블라인드와 유사한 "잡 플래닛(JobPlanet)", "글래스도어"와 같은 웹 사이트의 기업리뷰를 수집하고, Text Rank 알고리즘을 활용한 '특성추출' 혹은 LDA 토픽 모델링 등 텍스트 마이닝 기법을 활용하여 기업리뷰로부터 유의미 시사점을 도출해내고 있다.
1. Lakin, T., “Why You Shouldn’t Ignore Glassdoor”, HR, 2015
2. 김동욱, 강주영, 임재익, “토픽모델링 기법을 활용한 산업별 직무만족요인 비교 조사 : 잡플래닛 리뷰를 중심으로”, 한국IT서비스학술지 제15권 제3호, 2016년 9월, 157P-171P
3. 김성준, 이중학, 채충일, “꼰대, 한국기업 조직문화 차원의 탐구”, 조직과 인사관리연구 제45집 2권, 2021년 5월, 1P-35P
4.Theresa Schmiedel, Jan vom Brocke, Oliver Muller, “Topic Modeling as a strategy of inquiry in Organizational Research : A Tutorial with an Application Example on Organizational Culture
물론, 상기 연구들과 같이 텍스트 마이닝 기법을 적용하여 유의미한 시사점을 끌어내기 위해서 선행되어야 하는 것이 바로 해당 웹 페이지로부터 텍스트 데이터를 수집하는 것이다. 그러나 기업의 규모가 클수록 수집해야 하는 정보의 양이 막대하다. 만약 당신이 삼성전자의 인사담당자로서 소속 기업의 텍스트 데이터를 수집하려고 한다면 그 엄청난 양 앞에 시도조차 하지 않을 수 있다.
이러한 한계를 극복하기 위해서 오늘 여러분들께 소개하고자 하는 것은 "웹 크롤링"이다. 아래에서는 간단하게 웹 크롤링의 개념에 대해서 소개하고 "조직문화 진단과 블라인드(Blind) 웹 크롤링 2편"에서 자세하게 구동하는 방법에 대해서 소개하고자 한다.
Ⅳ. 웹 크롤링과 블라인드
1. 크롤링의 개념
크롤링(crawling) 혹은 스크레이핑(scraping)이라 불리우는 웹 데이터 수집 기술은 웹 페이지를 그대로 스냅샷하여 거기서 데이터를 추출해 내는 행위를 일컫는다. 사실 이 개념을 본격적으로 설명하기 위해서는 클라이언트와 서버, 웹 브라우저, URL, Parsing 등의 기본 개념도 알면 좋으나 필수적이진 않으므로 생략하도록 하겠다.
2. 유사한 개념 : Open API
크롤링과 유사한 역할이나 결과를 도출하는 또 다른 개념도 있다. 바로 Open API를 이용하는 데이터 수집 방법(사실 데이터를 입력하는 기능도 있다.)이다. Google Spread Sheet, Facebook, Twitter 등 다양한 웹 서비스자들이 지정해놓은 데이터를 합법적인 Service Key를 받아 이용하는 것이다. 다만, 수집할 수 있는 데이터를 서비스자가 정해놓았다는 점에서 웹 상의 다양한 자료를 선택적으로 수집할 수 있는 크롤링과는 약간의 차이가 있다.
3. 주요 Interpreter : 파이썬
웹 크롤링을 하기 위해서는 Interpreter이 필요하다. Interpreter에는 R과 파이썬 등이 존재하지만 Parsing 작업이 상당히 편리한 라이브러리를 보유하고 있는 파이썬이 크롤링 작업 시에 자주 활용된다. 따라서 웹 크롤링과 Git-hub를 이용한 딥러닝을 수행하기 위해서는 이러한 파이썬 코드에 익숙해지는 것을 권한다.
이후 시리즈 2편에서는 파이썬을 구동하기 위하여 필요한 파이참 활용법과 크롤링을 하기 위한 파이썬 코드를 본격적으로 설명하도록 하겠다.