I. 서 론
모발이란 피부의 부속기관으로 인체를 보호하는 기능으로 체온조절 및 자외선이나 물리적인 마찰과 같은 외부의 자극으로부터 인체를 보호하는 생물학적 기능을 담당하고 있다. 인간은 오랜 역사 동안 모발을 단순히 신체를 보호하는 역할로 단정 짓지 않고 각자의 장점은 부각시키고 단점을 보완하는 동시에 개성을 표현하는 미용학적 의미의 사회적 상호작용 목적으로 사용하였다. 이는 시대의 변천에 따라 미에 대한 인식이 변하여 생리적인 기능보다 장식적인 상징성 기능으로서의 가치가 나날이 높아지게 되었음을 함의하고 있다(Kim, 2011). 오늘날 사회의 젊은층은 자신만의 고유한 이미지의 중요성을 강조하고 있어 차별화된 이미지 창출을 표현하는데 다양한 방법을 시도하고 있다. 그 중 헤어스타일은 시각적인 면에서 얼굴 윤곽에 직접적인 착시효과를 주게 되어 첫인상을 결정하는데 핵심이라 해도 과언이 아닐 만큼 중요한 역할을 하고 있다(Park, 2013). 이로써 모발은 단순히 심리적 만족을 넘어서 이미지 메이킹의 중요한 요소로 개인의 정체성을 표현하고 자신감 성립 등 사회적인 태도에 밀접한 관련이 있어 대표적으로 사용하는 매개체로 인식되고 있다. 현대인들은 모발의 색상과 형태를 자유롭고 다양한 방법으로 표현하고 있는데 이는 이미지 메이킹에 긍정적인 수단이 될 수 있는 반면에 부정적인 결과 또한 초래 할 수 있다(Kim, 2008).
모발은 손상이 되더라도 통증을 느끼게 하는 신경이 존재하지 않음으로 방치하기 쉬우며 모발의 건강상태를 고려하지 않고 스타일에만 치중되다보니 무분별한 시술과 화학 약품의 남용으로 인해 필연적으로 모발손상이 나타나고 있다(Kim, 2002). 잦은 화학적인 시술은 모발이 손상되는 것뿐만 아니라 두피의 세균번식과 더불어 염증 및 홍반을 수반하는 문제성 두피질환의 원인이 되어 모발과 두피는 직접적인 관련이 있음을 시사하고 있다. 이로써 모발 손상이란 단순히 모발 형태의 변형에서 멈추는 것이 아니라 모발 및 두피의 기능장애로 이어질 수 있으며 이러한 원인이 지속되어 심각하면 탈모라는 질병까지 유발하게 되기 때문에 더 이상 모발 중심이 아닌 동시에 두피까지 관리하는 헤어 케어 관념으로 빠르게 진보하고 있다. 이러한 두피·모발에 대한 소비자들의 관심은 미용분야의 발전의 밑거름이 되었고, 실용학문 특성상 사회적인 시대 변화가 학문의 연구와 관계되어 있음을 알 수 있다. 모발과 두피가 관련되어 있는 미용은 전문적인 지식 및 기술을 습득할 수 있는 대학이나 대학원과 같은 교육기관의 정착 기간이 비교적 짧은 양상을 가진다. 이로 인해 연구논문의 역사 및 배경이 다른 학문에 비해 상대적으로 미흡 할 수 있지만, 그 동안 학위논문과 학회지에 누적되어 수록된 연구논문에 대한 동향을 파악하는 시도는 매우 의미 있는 일이라 할 수 있다(Kim et al., 2016).
학문이란 시대에 변화에 따라 다양한 지식을 바탕으로 융합되면서 형성된다. 미용 또한 전문성을 바탕으로 인간의 감성을 자극하는 분야로서 다양한 분야와 접목되어 일상생활과 밀접한 관련이 있기 때문에 시대 움직임에 따라 체계화된 연구로 미용인의 학문에 대한 지식은 중요하게 요구된다. 이전까지 게재된 선행논문을 살펴보면 분석대상을 한정지어 시기와 주제에 대한 대략적인 통계 및 동향정도는 파악할 수 있었으나 대부분 주관적인 견해가 간여하게 되면서 오차가 발생되어 심층적인 파악이 어려워 한계가 따른다. 기존 선행논문에서 나타나는 문제점을 보완하고 누적된 방대한 양의 데이터를 정확하고 신속하게 분석 할 수 있는 네트워크 분석을 활용하고 있다(Hwang, 2021). 네트워크 분석의 장점을 활용하여 다양한 분야에서 연구 동향 분석을 위해 빅데이터를 활발하게 사용하고 있지만 정작 미용 분야에서의 빅데이터 활용은 아직 미미한 실정이다. 따라서 본 연구에는 국문초록 텍스트 데이터를 기초로 단어와 단어 간의 중심 주제와 세부 범위를 파악하여 연구 동향을 알아보고자 한다. 이러한 연구동향 분석은 연구의 흐름을 이해하고 동향에서 발견된 개선해야 할 과제와 같은 문제점을 인지하는 등 학문적 형태와 패턴의 변화를 파악하기 위해 사용된다. 이를 통해 미용분야의 연구경향의 흐름을 읽고 이에 따르는 논점을 추론하는 등 현재의 연구 경향과 미래의 발전 방향의 기준점을 예측하고자 한다. 또한 분석 연구를 통해 현재까지의 성과를 평가하고 미용 분야의 긍정적인 창출을 모색하여 옳은 방향을 제시하고 도출된 결과를 공유함으로써 연구의 질적 향상과 지속적인 발전을 도모하는데 기여한다.
II. 이론적 배경
1. 빅데이터
스마트 시대라 불리는 요즘 데이터로 움직이는 세대라 해도 무방할 만큼 빅데이터는 오늘날 다양한 분야에서 활용되는 핵심 기술이다(Park, 2022). 빅데이터란 기존의 데이터 정도를 넘어서 규모 및 종류와 활용 범위가 확장되어진 관점에서 기존의 분석체계로는 처리가 불가능한 수준의 방대한 분량의 데이터 집합을 의미한다(Moon, 2019). 빅데이터의 개념에 대해 학자마다 다르게 정의하고 있는데, Mckinsey(2011)에 따르면 데이터 규모에 초점을 맞추어 기존 방식의 데이터 베이스 프로그램이 수집·저장·관리·분석 할 수 있는 범위를 초과하는 방대한 데이터로 정의 하였고, IDC(2011)는 업무수행에 초점을 맞추어 초고속 수집·발굴·분석을 통해 대규모 데이터로부터 낮은 비용으로 가치를 추출할 수 있도록 개발된 새로운 기술 및 아키텍처로 정의하였다. 반면 Gartner(2011)는 데이터 활용에 초점을 맞추어 다양한 종류의 데이터가 감당 할 수 없을 정도로 빠르게 생성되는 현상으로 의사결정 및 시사점을 발견하기 위한 대용량, 초고속 및 다양성의 특성을 가진 정보자산으로 정의하였다(Kim, 2015). 이를 종합하면 빅데이터는 새로운 처리·분석 방법을 활용하여 낮은 비용으로 가치를 창출할 수 있는 대규모 데이터라 정의할 수 있다(Hwang, 2021).
빅데이터는 3V 속성을 갖고 있으며 3V는 데이터의 규모(volume), 데이터의 속도(Velocity), 데이터의 종류(Variety)를 나타낸다. 최근 들어 빅데이터의 새로운 V속성으로 정확성(Veracity)과 가치(Value)가 제시되고 있는데 이는 방대한 데이터를 분석할 수 있는 반면 일정한 패턴을 나타낼 수 없는 정확성에 대한 문제가 드러났기 때문이다. 이로 인해 빅데이터를 활용하는 기관 및 기업에서 정확성 및 가치를 살펴보아야 한다는 필요성의 발단으로 빅데이터의 새로운 속성인 정확성과 가치가 제시되어 5V로 정의하는 추세이다. 빅데이터의 가장 기본적인 특징이라 할 수 있는 규모는 단순 저장되는 물리적 데이터의 양을 나타낸다. 데이터의 속도는 데이터의 접근성과 활용 가능성에 대한 작용에 영향을 미치며 데이터가 생성·저장·시각화되는 과정이 얼마나 신속하게 이루어져야 하는지에 대한 중요성을 나타내는 정확한 실시간 처리를 의미한다. 데이터의 종류는 숫자화된 정형 데이터 뿐만 아니라 비정형 데이터와 반정형 데이터도 포함하여 다양한 형태의 데이터를 포함하는 것을 뜻한다. 빅데이터는 데이터의 정형화 정도에 따라 그 종류가 구분된다(Lee, 2018). 자료를 저장하는 종목이 고정되어 있는 관계형 데이터 베이스와 같은 정형(Structured) 데이터와 고정된 필드가 일부 있는 XML, HTML과 같은 반정형(Semi-Structured) 데이터, 고정된 필드에 저장되어 있지 않은 텍스트, 이미지, 동영상, 음성과 같은 비정형(Unstructured) 데이터로 나누어 진다(Na, 2022; Hwang, 2019). 데이터의 가치는 결론적으로 분석한 데이터의 결과가 얼마의 가치를 나타내는지를 의미하는 것으로 빠르게 변화하여 확산되는 데이터의 일정한 패턴을 파악하는 것이 어려워 가치의 중요성이 강조된다. 정확성은 데이터에 일임할 수 있는 신뢰 정도를 의미하며 일반적으로 데이터의 신뢰에 따라 가치가 부여된다. 날씨나 경제 등 예측이 필요한 분야에서는 최상의 데이터 품질을 유지하여 정확성을 확보하는 것이 빅데이터의 중대한 요구사항이다(Baek, 2017). 이와 같은 빅데이터는 인위적인 개입으로 변동되거나 생성되는 것이 아니라 일상 생활의 모든 부분에서 자연스럽게 만들어진 자체로 적용하여 데이터를 활용한다는 점에서 기존의 데이터와는 구별된다(Choi, 2021).
2. 텍스트 마이닝
현대는 통신기술의 발전으로 빅데이터 시대를 맞이하여 무수한 데이터들이 생산되어 축적되고 있다. 기존에는 생성된 데이터들을 효율적으로 관리하기 위해 정형화된 데이터베이스 형태로 저장했으나 최근에는 온라인 공간에서 정형화된 데이터보다 SNS, 웹기사, 신문, 이메일, 블로그 등과 같이 일관된 형식을 가지지 않는 비정형 텍스트 데이터 사용이 확산되고 있는 추세이다(Na, 2022). 정보전달 도구로 현대인이 가장 많이 사용하는 텍스트는 비정형(unstructed) 데이터로 구분되는데 이러한 가공되지 않은 비정형 데이터가 기능과 목적에 맞는 형식을 갖추기 위해서는 정형 데이터로 변환되어야 한다. 이를 위해 다양한 형태의 정제 작업이 이루어진 데이터는 가치 있는 정보를 추출하는 문자로 사용된다. 최근 빅데이터에 대한 관심이 각광받는 시점에서 데이터를 분석하는 기법 또한 보완되고 있는데 이같이 가공된 문자로부터 필요한 정보를 추출하는 하나의 과정을 텍스트 마이닝이라고 한다(Kim et al., 2023).
텍스트 마이닝이란 빅데이터 분석 기법 중 하나로 상대적 많은 분량으로 구성된 비정형, 정형화 데이터 문서 집합에서 자연어처리(NLP) 기술과 문서처리기술을 통해 기존에 알려지지 않은 유용한 패턴, 지식과 같은 새로운 정보를 추출하는 프로세스를 의미한다. 이는 분석 방법이 다양하게 개발되고 보급되면서 대량으로 축적된 데이터에서 의미 있는 표본들을 추출해 관계성을 파악하고 군집화를 통해 텍스트가 가진 범주를 찾아 숨겨진 의미를 발견하여 의사결정 및 예측 할 수 있는 유용한 정보를 추출하는데 활용되는 분석 기법이다(Jin, 2021; Choi, 2021). 텍스트 마이닝 기법은 유사한 특성을 갖는 데이터들에 대해 정보추출, 트렌드 탐색, 군집화 작업과 분류 등을 실행 할 수 있어 다양한 분야에서 이용되고 있다(Ha & Lee, 2021).
텍스트마이닝에는 비정형 데이터를 분석하기 위해 단어 빈도 분석, 군집 분석, 연간분석, 감성 분석 등 다양한 기법이 있다(Kim & Kim, 2023). 이전에는 연구자의 역량에 따라 텍스트 데이터에 대한 접근과 분석에 한계가 있었지만 기존의 제한된 방법에서 보완되어 보급된 텍스트 마이닝은 대량의 텍스트 데이터를 활용할 수 있다(Kang et al., 2021). 또한 연구 주제의 분류와 해석하는 과정에서 연구자의 주관적 판단이 개입될 수 있는 현실성을 보완할 수 있고, 한 편의 논문이 여러 분야로 포괄적인 도입이 가능한 경우 한 개의 분야로 단순화함으로써 발생될 수 있는 정보 왜곡이나 누락을 보완 할 수 있다(Kim et al., 2023). 텍스트 마이닝 기법의 장점은 텍스트 안에서 내포하고 있는 잠재적인 동시에 실질적으로 중점이 되고 있는 논점에서 표출되고 있는 내용이 무엇인지 발견 할 수 있다는 점이다(Ha & Lee, 2021). 이외에도 적은 시간으로 비정형화 데이터의 중심이 되는 키워드를 추출하여 주된 주 제를 비교적으로 객관성있게 파악할 수 있다. 이러한 텍스트마이닝 분석 기법에는 토픽모델링, 형태소분석, 감성분석 등이 있으며 주로 동향연구나 주제 분석에 사용되어 중점이 되는 연구주제를 이해하고 연관성 및 발전성을 추정할 수 있다(Kang et al., 2021).
텍스트마이닝을 활용한 분석 방법은 분석하려는 문서의 형식과 해석하려는 결과물의 형식에 따라서 여러가지 방법이 있다. 본 연구에서는 국문초록의 텍스트를 중심으로 ‘토픽모델링(LDA분석)’과 ‘단어 빈도분석’을 진행 하였다. 이 두가지 분석의 공통점은 구조화되지 않은 형태의 문서에서 주된 핵심 단어를 도출하여 해당 문서에 중점이 되는 주제를 얻을 수 있다. 텍스트마이닝을 활용하여 거대한 텍스트로부터 이전까지 발견되지 않은 숨겨진 정보나 추세를 찾아내는 것을 목적으로 특정 연구의 경향을 찾아내는데 최적의 방법으로 활용이 가능하다(Byeon & Seo, 2020).
III. 내용 및 방법
1. 분석방법 및 절차
1) 자료수집
본 연구는 현재 발표된 두피·모발과 관련하여 연구 동향을 고찰하기 위해 대학원 과정에서 미용 관련 전공이 대성되기 시작한 2001년 1월부터 2022년 12월까지 21년간 발표된 논문을 국한 하였으며, 2022년 10월 2023년 8월까지의 일정기간 검색기간으로 선정하여 진행하였다. 서비스(RISS: Research Information Service System) 사이트를 통해 온라인 검색방법을 사용하여 두피·모발과 관련하여 국내에서 발표된 학위논문 및 학회지에 수록된 논문을 대상으로 선정하였다. 자료검색의 키워드는 ‘두피’, ‘모발’로 하였으며 검색과정에서 5871편의 논문을 검색하였다. 그 중에 지정한 연구 주제와 관련된 내용을 자세히 검토하여 ‘두피’, ‘모발’과 관련성이 없는 전무한 분야의 논문 707편을 삭제하였으며 중복되어 검색된 논문 360편도 삭제하여 분석 대상에서 제외하였다. 또한 초록이 기재되어 있지 않아 키워드를 추출할 수 없는 논문 2423편도 제외하여 최종적으로 학위논문 1737편, 학술지 644편의 논문을 선정하여 총 2381편의 논문을 수집하였다. 학위논문은 석사학위논문 1394편, 박사학위논문 343편이였으며 학술지 선정 대상 논문이 발표된 학술지는 한국디자인문화학회지가 132편으로 가장 많았고 아시안뷰티화장품학술지(58편), 대한피부미용학회지(38편), 한국미용예술경영연구학회지(32편) 순으로 나타났다. 분석 시기는 세부적으로 연구물 발표가 활발하지 않은 시기를 전반기로 1기, 2기로 구분하여 2001년 1월부터 2007년 12월까지를 1기, 2008년 1월부터 2012년 12월까지를 2기로 나타내었고 성장세가 시작되는 시기를 3기, 4기로 구분하여 2013년 1월부터 2017년 12월을 3기, 2018년 1월부터 2022년 12월까지를 4기로 구분지어 발표연도를 나타내었다(Gu & Kim, 2021). 이에 따라 게재 형태는 학위논문과 학회지 논문으로 분류하였고, 연구 방법은 문헌전반적인 연구동향을 고찰함으로써 현재 시점까지 연구 성과를 검토하고 향후 발전방향을 모색하기 위해 실행되었다. 세부적 범위로는 2001년부터 2012년을 전반기로 구분하고, 2013년부터 2022년까지는 후반기로 구분하여 연구동향의 차이를 비교하고자 한다.
2) 키워드 정제
데이터 분석을 위해 수집된 2.381편의 논문에서 키워드를 추출하였으며 그 결과 중복된 단어를 제외하고 총 244.003개의 키워드가 추출되었다. 추출된 키워드에서 빈도 높은단어 160.014개를 도출하여 정확성을 위해 형태소 분석 작업 과정을 실행하였다. 명사를 제외한 조사, 부사, 형용사 등 불필요한 단어를 정제(purification) 처리하는 전처리(preprocessing) 과정을 통해 두 음절 이상의 단어만 추출하였다. 결과적으로 147.302개의 키워드를 추출하였으며 출현빈도 70번 이상의 단어 675개를 선정하였다. 추출된 키워드에서 영문으로 표기된 주제어는 한글로 변경하였고 수집된 키워드를 중심으로 텍스트 마이닝(text mining)을 실행하였다. 전체적으로 대부분의 데이터에서 ‘빈도’, ‘결과’, 이상’, ‘확인’ 등 함의하는 의미가 동일한 키워드는 네트워크의 구조적 분석 범위에서 벗어나는 것으로 판단하여 삭제하였고, 추출 단어가 유사하여 ‘한국의’, ‘한국’과 같은 유의어는 ‘한국’로 통일 하였고 ‘헤어’를 ‘모발’로 ‘추출물’을 ‘추출’로 수정하여 분석에 용이한 데이터를 구축하였다. 그리고 ‘헤어 디자인’, ‘기초 자료’, ‘설문 조사’ 등은 띄어쓰기를 수정하여 불분명한 개념을 구분지어 정확성을 높였다. 데이터 분석을 통해 추출한 단어는 연구주제와 연관된 핵심 단어의 배열로 구성되어 있으며 연구문제를 해결하기 위한 중요한 의미를 함축하고 있어 연구동향을 파악하는데 중요한 수단으로 활용될 수 있다. 수집한 데이터 정제 기준은 Table 1과 같다(O, 2022).
3) 분석방법
최근 빅데이터에 대한 관심이 높아지면서 자료 정보관리 분야에서 다양하게 활용되어지는 방법을 이용하고자 통계분석 프로그램을 활용하여 분석하였다. 본 연구는 연구동향을 고찰하기 위해서 계량서지학적 분석법을 적용하여 분석하였으며 텍스트마이닝(text mining)을 도출하는데 용이한 공개 프로그램 R Studio를 활용하였다. R Studio는 통계 계산 및 그래픽을 위한 프로그래밍 언어인 R의 소프트웨어 환경이다. R Studio는 다른 소프트웨어 패키지와는 다르게 소스코드를 공개하여 사용자들이 자유롭게 활용할 수 있도록 제공하였다. R Studio을 통해 진행한 텍스트마이닝 분석은 네트워크 내에서 단어 구조를 공간적으로 나타냄에 따라 단어와 연관된 다른 단어들과의 중점이 되는 개념과 관계를 시각적으로 파악할 수 있다는 장점이 있다.
이에 본 연구에서는 ‘모발’, ‘두피’와 관련된 연구동향을 파악하고 이에 따른 시사점을 나타내기 위해 다양한 통계 분석 기법을 통해 서지분석을 실행하였다. 빈도를 나타내는 키워드를 중심으로 어떤 단어와 결합하여 체계를 형성하는지 그 의미와 개념을 분석함을 통해 연구물의 동향을 파악하기 위해 빈도분석을 실시하였다. 언어 구조적 분석이 가능한 점을 활용하여 지금까지의 연구동향의 추세 뿐만 아니라 장래 연구동향의 방향을 관측하고 데이터 자료를 제공하고자 한다(Bae et al., 2022). 키워드의 시각화는 R Studio프로그램(R VERSION 4.2.1, GNU General Public Licence, New Zealand)을 통해 추출된 키워드에 대한 빈도분석을 실행 한 후 시각화로 나타내었으며 명확한 시각화를 위해 최대 ‘70’이라는 빈도값을 선정한 후 프로그램을 실행하여 결과를 도출하였다. 먼저 워드클라우드 및 시기별 키워드 순위를 파악하기 위해 주체를 이루는 토픽에 대해 구성된 집합을 시각화하여 파이계수 네트워크 및 상관관계 네트워크 대한 의미를 해석하는 등 연구동향 분석하였다(Na, 2022; Lee et al., 2019). 또한 연구주제, 게재형태, 발표 연도, 연구 방법을 조사하여 연도별 학위 논문과 학술지 논문 편수의 동향을 파악하고 연도별 연구 주제의 차이를 분석하였다. 연구동향에 대한 분석은 Excel을 사용하여 빈도분석을 실행하였다.
IV. 결과 및 고찰
1. 연도별 논문 발표현황
Fig. 1은 ‘두피’, ‘모발’과 관련된 연구의 연도별 현황을 분석한 결과로 발표된 논문수를 나타냈다. 2001년에서 2007년까지 해당되는 1기에는 평균 30편 이하의 낮은 수준의 연구가 지속되는 것으로 보아 대체적으로 활발한 연구가 이루어지지 않은 것을 볼 수 있다. 2기에 해당되는 2008년에서 2012년도에는 평균 100편 이상의 연구가 발표된 것을 볼 수 있다. 이는 2000년 초에는 시기적으로 많은 연구가 진행되지 않았던 반면에 2010년을 기점으로 상대적으로 다양한 논문의 연구가 활발하게 진행되기 시작했기 때문이다. 이후 논문 편수의 증가율은 1기 8.90%, 2기 22.0%, 3기 31.7%, 4기 37.3%로 꾸준히 증가하는 추세가 나타남을 볼 수 있다. 이처럼 후반기에 해당하는 3기 4기와 비교하여 전반기인 1기 2기에는 상대적으로 게재된 논문의 편수가 차이가 나는 것을 볼 수 있다. 이와 같은 논문 편수의 점진적인 증가율이 나타나는 근거는 시대의 변화로 산업구조가 급격하게 전환되면서 직업의 분야도 세분화되어짐과 동시에 전문성까지 요구하게 되었다. 이러한 사회적은 파동으로 미용분야 역시 미용의 학문적 성장을 통해 미용 산업을 주도적으로 선도할 수 있는 사회적 인재 양성을 실현하기 위해 미용교육 과정이 대학원 과정에 개설되기 시작한 이후부터 꾸준한 연구로 논문게재가 이루어짐을 알 수 있다.
2. 키워드 워드클라우드
본 연구에서 분석 기법으로 사용한 워드 클라우드(Word Cloud)는 텍스트를 시각화하는 전형적인 기법으로 출현 빈도에 따라 비례하는 크기로 나타나 빈번하게 언급된 핵심 키워드를 시각적으로 나타내어 직관적 파악이 가능한 기법이다. 이는 비중이 높은 단어를 효과적으로 빠르게 인식할 수 있는 장점을 가진다.
‘모발’, ‘두피’를 키워드로 하여 수집한 논문 2381편에서 사용된 키워드를 보다 시각적으로 표현하기 위해서 R studio 프로그램의 워드 클라우드를 활용하여 분석하였다. 명사만을 추출하기 위해 조사, 부사, 형용사 등 불필요한 단어를 제거하고 나머지 445,864개의 단어를 대상으로 출현 빈도값 70회 이상 출현된 1101개 단어를 출현 빈도수 중심으로 정리한 결과는 <Fig. 2>와 같다.
3. 시기별 키워드 순위
시기별 키워드 분석에서는 해당하는 시기마다 상위권에 출현한 키워드는 광범위한 내용에서 연구 방향을 대변하는 키워드라 의미할 수 있다. 따라서 시기별로 연구방밥에 대한 추이를 파악하기 위해 출현 빈도에 따른 상위 10개의 단어를 추출하였다. Table 2에 대한 결과를 살펴보면 1기부터 4기의 키워드 상위 1-10위까지는 단어들의 순위와 언급된 단어들이 전체적으로 유사하여 시기마다 비교적 구별된 단어를 파악할 수 없다고 판단되어 20위까지 범위를 넓혀 보다 시기별 연구 주제의 주요 키워드를 확인해보고자 한다.
1기부터 4기까지의 키워드 순위 1-10위에 해당하는 키워드를 살펴보면 ‘연구’, ‘분석’ , ‘모발’, ‘미용’과 같은 단어들로 ‘모발’ 및 ‘두피’와 관련된 연구가 대체적으로 진행되고 있음을 볼 수 있다. 세부적으로 11-20위를 살펴보면 1기의 키워드는 ‘여성’, ‘헤어스타일’, ‘형태’ 등 시기적으로 진입장벽이 높지 않아 쉽게 접근할 수 있는 연구 분야의 논문의 시작으로 이루어진 것을 볼 수 있다. 2기의 키워드는 ‘요인’, ‘조사’, ‘만족’과 같은 키워드로 기초 지식을 바탕으로 이루어졌던 이전 연구에서 전문성이 더하여져 심도 있는 연구가 진행되기 시작한 것으로 볼 수 있다. 3기는 ‘개발’, ‘산업’, ‘서비스’, ‘기술’ 등과 같은 키워드로 미용 산업 구조가 급속하게 변하면서 미용 산업이 학문적 체계와 융합하여 차지하는 비중이 증가하여 중요한 조건으로 자리매김하고 있음을 볼 수 있다. 4기는 ‘교육’, ‘직업’, ‘수준’, ‘전문’ 등과 같은 키워드로 미용 산업에서 필요조건으로 요구되는 미용 교육에 대한 연구가 활발히 진행되어짐을 알 수 있다. 이는 미용에 대한 인식의 개선으로 미용 산업의 발전을 위해 기술적인 측면에만 치우치기보다 밀접한 관계를 이루는 학문적인 측면과 함께 협동하여 미용 산업 발전에 앞장서는 전문인 양성이 불가피함을 인식했기 때문이라 볼 수 있다.
4. 토픽별 단어 분포 막대그래프
토픽별 단어분포는 지정된 토픽과 단어가 같이 사용되는 경우가 어느 정도 되는지 직관적으로 파악할 수 있도록 나타낸 지표이다. 이를 통해 특정 단어와 빈번하게 사용되는 단어와 반면에 자주 등장하지 않는 단어들을 대조적으로 비교해 볼 수 있다. 토픽 막대그래프의 장점은 연관성의 비중이 높은 단어들로만 직결되어 그룹이 정화가게 드러나 핵심 단어를 쉽게 인식할 수 있다. 이와 같이 ‘두피’,‘모발’에 관련된 연구 동향에 대한 LDA를 실행한 결과 추출된 토픽을 6개의 그룹으로 구성하였으며 각각의 토픽마다 출현 빈도가 높은 상위 10개의 키워드를 <Fig. 3>으로 나타내었다.
토픽1에 해당하는 ‘헤어디자인’에는 모발과 관련하여 이미지 및 형태와 같은 디자인과 관련된 단어들로 구성되었으며 ‘형태’라는 키워드가 가장 많이 사용되었으며 ‘이미지’, ‘헤어’, ‘헤어스타일’, ‘표현’, ‘현대’ 순으로 나타났다. 토픽2.의 ‘실태/만족도’에는 다양한 분야에서 만족도 조사와 관련된 단어들이 연계되어 그룹을 형성하였고 ‘관계’라는 키워드가 가장 많이 사용되었으며 ‘서비스’, ‘요인’, ‘영향’, ‘실시’, ‘고객’ 순으로 나타났다. 토픽3의 ‘미용교육’에는 미용 산업과 관련된 단어들도 그룹을 형성하였으며 ‘미용’이라는 키워드가 가장 많이 사용되었으며 ‘교육’, ‘전문’, ‘개발’, ‘연구’, ‘요구’ 순으로 나타났다. 토픽4.의 ‘실태조사’에는 교육과 운영 및 부작용과 관련하여 조사한 내용의 내포하는 단어들로 그룹을 형성하였으며 ‘조사’라는 키워드가 가장 많이 사용되었으며 ‘차이’, ‘관리’, ‘특성’, ‘대상’, ‘여성’ 순으로 나타났다. 토픽5의 ‘실험/측정’에는 모발 및 두피를 대상으로 진행한 실험과 관련된 단어들로 그룹을 형성하였으며 ‘연구’라는 키워드가 가장 많이 사용되었으며 ‘분석’, ‘방법’, ‘활용’, ‘목적’, ‘제시’ 순으로 나타났다. 토픽6의 ‘모발성장’에는 모발 성장 효능 실험의 관련된 단어들로 그룹을 형성하였으며 ‘모발’이라는 키워드가 가장 많이 사용되었으며 ‘효과’, ‘증가’, ‘비교’, ‘연구’, ‘확인’ 순으로 나타났다.
1) 토픽별 논문 수
토픽6의 ‘모발성장’에 해당하는 상위 키워드를 살펴보면 모발, 효과, 증가, 비교, 연구 등으로 모발과 관련된 질환으로 인해 발생되는 고충을 해결하고자 세분화된 분야에서 다양한 논점에 대한 실험 연구가 진행되고 있음을 볼 수 있다. 토픽2의 ‘실태/만족도’에 해당하는 상위 키워드는 관계, 서비스, 요인, 영향, 실시 등으로 현장에서 소비자들에게 제공하는 서비스 및 시술이나 교육 조건에 대한 만족도 평가가 요구되어지는 현황으로 나타난 결과라 볼 수 있다. 토픽1의 ‘헤어디자인’에 해당하는 상위 키워드는 형태, 이미지, 헤어, 헤어스타일, 표현 등으로 미용 산업에서 수준 높은 기술을 갖춘 전문가들이 소비자들의 다양한 욕구를 충족시키기 위해 학문의 질적인 발전을 이루어낸 결과라 볼 수 있다. 토픽4의 ‘실태조사’에 해당하는 상위 키워드는 조사, 차이, 관리, 특성, 대상 등으로 현재 진행되고 있는 기술 및 교육 환경에서 언급되어지는 문제점이나 부작용 및 인식 수준의 실태를 조사하여 향후 발전 방향과 방안을 모색 하고자하는 노력으로 나타난 결과라고 할 수 있다. 토픽3의 ‘미용교육’에 해당하는 상위 키워드는 미용, 교육, 전문, 개발, 연구 등으로 미용 산업은 단순히 기술적 측면만으로 발전과 성장에 한계가 따른다는 것을 인식하고 학술적인 측면의 도입으로 미용교육의 체계가 갖춰짐에 따라 나타난 결과라고 볼 수 있다. 토픽5의 ‘실험/측정’에 해당하는 상위 키워드는 연구, 분석, 방법, 활용, 목적 등으로 미용 산업 및 미용교육의 본질과 같이 ‘모발’,‘두피’의 손상을 최소화하고 건강과 개선의 목적을 실현하기 위해 실험 연구하는 과정에서 나타난 결과라 볼 수 있다.
5) 시기별 토픽 비율
6개의 그룹의 토픽 주제를 가지고 시기별 토픽 비율을 그래프로 나타내었다. 1기에 해당하는 2001년에서 2007년에는 총 212편의 논문에서 토픽6이 70편(33.1%)으로 가장 많은 비율을 차지하였으며 토픽 1이 60편(28.3%)으로 대부분의 비율을 구성하였다. 그 다음으로 토픽4가 46편(21.6%), 토픽2가 17편(8.01%), 토픽3이 15편(7.05%), 토픽 5가 4편(1.88%) 순으로 나타났다. 이러한 결과는 이 시기에 모발성장과 헤어디자인과 관련된 논문이 가장 많이 연구되었음을 나타낸다. 2기에 해당하는 2008년에서 2012년에는 총 524편의 논문에서 토픽6이 162편(30.9%)으로 가장 많은 비율을 차지하였으며 토픽1이 123편(23.4%)으로 대부분의 비율을 차지하였다. 그 다음으로 토픽4가 89편(16.9%), 토픽2가 72편(13.7%), 토픽3이 66편(12.5%), 토픽5가 12편(2.3%) 순으로 나타나 1기와 비교하여 게재된 논문의 편수는 비교적 많은 차이가 났지만 토픽 순위의 변화는 나타나지 않음을 볼 수 있다. 3이에 해당하는 2013년에서 2017년에는 총 755편의 논문에서 토픽6이 174편(23.1%)으로 가장 많은 비율을 차지하였으며 토픽1이 164편(21.7%), 토픽2가 161편(21.3%)으로 대부분의 비율을 차지하고 있음을 볼 수 있다. 그 다음으로 토픽 4는 123편(16.3%), 토픽3은 109편(14.4%), 토픽5는 24편(3.2%) 순으로 나타났다. 이 결과 토픽 6과 토픽1은 꾸준한 연구가 진행되어 높은 비율의 비중을 차지하고 있음을 볼 수 있었으며 이전과 눈에 띄게 달라진 부분은 토픽2의 비율이 확연히 높아진 것을 볼 수 있다. 이는 ‘만족도’조사에 대한 필요성을 인식하면서부터 많은 연구가 진행되었음을 알 수 있다. 4기에 해당하는 2018년에서 2022년에는 총 890편의 논문에서 토픽2가 285편(32.1%)으로 가장 많은 비율을 차지하였으며 토픽6이 182편으로 대부부의 비율을 차지하였다. 그 다음으로 토픽3이 133편(14.9%), 토픽4는 124편(13.9%), 토픽1이 115편(13.1%), 토픽5이 51편(5.7%) 순으로 나타났다. 이 결과 꾸준히 증가해오던 토픽2가 4기에서 증폭적인 결과로 가장 높은 비율을 차지하게 되었음을 볼 수 있으며 상위에 머무르던 토픽1의 비율이 확연히 낮아지게 된 것으로 보아 ‘헤어디자인’에 대한 연구가 실질적으로 경미해진 것을 확인 할 수 있었다.
V. 결 론
본 연구는 키워드 ‘두피’, ‘모발’과 관련된 논문의 연구동향에 대한 데이터 분석을 통해 의미 있는 정보를 도출하여 추출된 키워드 유형을 파악하고 다양한 분야에서 진행되고 있는 연구 동향의 추이를 직관적으로 파악하고자 시도되었다. 이를 위해 연구 방법, 발표 연도, 연구 주제, 게재 형태를 조사하여 연도별 학술지 논문과 학위논문 편수의 동향을 분석하여 연도별에 따른 연구 주제의 차이를 비교분석 하였다. 이에 지정한 키워드에 대한 중심이 되는 주제와 키워드를 이해하고 상관관계를 파악하여 ‘두피’,‘모발’ 분야의 발전과 연구의 질적 향상을 위해 기초자료를 제공하고 향후 연구주제에 대한 방향성을 제안하는데 의의가 있다.
2001년부터 1월부터 2022년 12월까지 발표된 국내 학위논문 및 학술지 논문 2.381편을 대상으로 분석한 결과 다음과 같은 결론이 도출되었다.
먼저 연도별 논문 발표 현황에 대한 데이터 분석 결과는 1기에 해당하는 2001년-2007년에는 전체 논문 편수의 8.9%로 시기적으로 많은 연구가 진행되지 않아 논문의 편수가 현저히 낮은 것을 확인 할 수 있었다. 2기 후반부부터 22.0%로 점차 증가하면서 다양한 분양에서 활발한 연구가 진행되는 것을 볼 수 있으며 이후로도 3기 31.7%, 4기 37.3%로 꾸준한 증가율이 나타나는 것을 확인할 수 있었다. 이러한 논문 편수의 증가율은 산업의 발전으로 미용에 대한 인식이 높아짐에 따라 미용 산업 분야에서도 학문적 지식을 통해 사회적 인재 양성이 요구되어 미용교육이 불가피해진 현황으로 나타난 경향이라 볼 수 있다.
둘째, 워드 클라우드에서 도출된 결과는 어느 특정 주제에 편중되지 않고 다양한 키워드가 추출된 결과에서 ‘두피’, ‘모발’과 관련하여 다양한 분야에서 활발한 연구가 진행되어진 것을 확인 할 수 있으며 특히 ‘두피’, ‘모발’과 관련된 소재에 대한 효능을 입증하고자 시도된 논문의 분량이 많았다. 이는 미용 산업 구조의 성장으로 미용 관련 분야의 진보가 이루어짐으로 인해 나타난 결과로 볼 수 있다.
셋째, 시기별 키워드 순위의 분석 결과에서 1기부터 4기까지 추출된 키워드 1-10위 까지를 살펴보면 지정한 키워드 ‘두피’와 ‘모발’과 직결되어 ‘분석’, ‘연구’, ‘미용’, ‘모발’ 등 유사한 단어들로 형성되어 있는 것을 볼 수 있다. 시기별 주제를 명확하게 구분하기 위해 11-20위 까지 범위를 넓혀 키워드를 분석한 결과 1기에는 모발의 형태 및 이미지와 관련된 연구로 ‘여성’, ‘헤어스타일’, ‘형태’ 등의 키워드가 포함되어 있었고, 2기에는 ‘요인’, ‘조사’, ‘만족’과 같은 키워드로 미용분야도 점차 하나의 학문으로 세분화되어 연구가 이루어지는 것을 확인 할 수 있었다. 3기는 미용 산업과 관련하여 ‘개발’, ‘산업’, ‘서비스’, ‘기술’과 같은 키워드가 포함되어 있었으며 이는 현 사회에서 논점이 되는 산업이 미용분야에도 적용되어 본격적으로 미용 산업이 발전함에 따라 나타는 경향이라 볼 수 있다. 4기는 ‘교육’, ‘직업’, ‘수준’, ‘전문’ 등과 같은 키워드가 포함되어 있었으며 이는 대중매체의 발달로 소비자들이 다양한 정보를 습득함에 따라 지식 수준이 높아진 만큼 미용 산업을 보다 질적으로 활성화 시킬 수 있는 전문인 양성에 초점이 맞춰진 경향 때문이라 볼 수 있다.
넷째, 토픽별 단어분포 그래프에서 나타난 결과는 ‘헤어디자인’, ‘실태/만족도’, ‘미용교육’, ‘실태조사’, ‘실험/측정’, ‘모발성장’과 같이 6개의 그룹이 직결되어 연관된 키워드로 형성되어 있었다. 종합적으로 살펴보면 토픽1의 ‘헤어디자인’은 형태와 가장 밀접하게 사용되었으며 이는 디자인과 형태라는 키워드가 동의어로 가장 많이 사용되어 나타난 것으로 볼 수 있다. 토픽2의 ‘실태/만족도’는 관계와 서비스가 가장 많이 사용되었는데 이는 미용에서 소비에 요구되는 인력 및 기술이 바탕이 되어 서비스라는 특정 요소가 필요하기 때문이라 볼 수 있다. 토픽3의 ‘미용교육’은 미용 다음으로 교육이 가장 많이 사용되었는데 이는 현 사회에서 전문 기술 및 지식에 대한 형성이 급격하게 진행되고 있는 만큼 미용 분야도 이에 발 맞춰 교육이라는 시스템이 도입되어 높은 수준으로 성장을 이룬 것으로 볼 수 있다. 토픽4.의 ‘실태조사’는 조사 다음으로 차이가 가장 많이 사용되었다. 토픽5의 ‘실험/측정’에서는 연구 다음으로 분석이 가장 많이 사용되었는데 이는 두피 및 모발과 관련하여 효능을 검증하고자 다양한 분야에서 분석 연구가 진행되고 있음을 알 수 있다. 토픽6의 ‘모발성장’에서는 모발 다음으로 효과가 가장 많이 사용되었는데 이는 탈모라는 질환을 개선하고자 하는 움직임이 계속되면서 효능을 검증하는 실험 연구가 활발히 진행되는 과정에서 나타난 경향이라 볼 수 있다.
다섯째, 토픽별 논문 수에 대한 결과를 살펴보면 토픽6. ‘모발성장’에 해당하는 연구논문이 588(24.7%)편으로 가장 많았으며 미용 분야에서 모발 성장과 관련된 논문이 가장 활발하게 진행되었음을 알 수 있다. 그 다음으로 토픽2. ‘실태/만족도’에 해당하는 연구논문이 535(22.5%)편으로 나타났으며 이는 미용에 대한 전문가와 소비자들의 인식이 높아짐에 따라 이용실태 및 만족도에 대한 자료가 요구되는 실정으로 다양한 연구가 진행된 것으로 볼 수 있다. 토픽1. ‘헤어디자인’에 해당하는 연구논문이 462(19.4%)편으로 나타났으며 이는 ‘모발’, ‘두피’와 관련된 연구논문이 주제인 만큼 모발과 관련하여 디자인 구성요소 및 이미지에 대한 연구가 진행되어 나타난 결과로 볼 수 있다. 나머지 결과는 토픽4. 382(16.0%편, 토픽3. 323(13.6%)편, 토픽5. 91(3.8%)편 순으로 나타났다.
여섯째, 시기별 토픽 비율에 대한 전체적인 결과를 살펴보면 꾸준한 상위권에 해당하는 토픽6의 ‘모발성장’은 1기부터 4기까지 높은 비율의 논문 편수로 모발성장과 관련하여 질환 및 효능있는 소재에 대한 끊임없는 연구가 진행되어진 것을 알 수 있다. 토픽1의 ‘헤어디자인’은 1기부터 꾸준히 상위권에 해당하는 비율로 많은 연구가 진행되었지만 4기에 해당하는 2018년에서 2022에는 하위권으로 차지하는 비율이 낮아지는 것을 확인 할 수 있었고 토픽2의 ‘만족도’와 토픽3의 ‘미용 교육’이 높은 비율로 증가하면서 활발한 연구가 진행되는 것을 알 수 있었다. 토픽5의 ‘실험,측정’은 1기부터 4기까지 논문 편수는 증가 하였지만 다른 토픽과 비교하여 가장 낮은 비율로 전환점을 보이지 않았다. 이는 실험논문에 대한 분량이 상대적으로 적어 나타나는 실정이라 볼 수 있다.
본 연구는 21년간 ‘두피’, ‘모발’과 관련된 논문에서 텍스트마이닝 분석을 통해 추출된 키워드를 통해 연구의 추이를 관찰하고 학문적인 형태와 패턴의 경향을 탐색하는데 의의가 있다. 기존의 연구자가 지정한 연구 범위에서 수량적 현황만 파악하는 연구동향과는 차별된 이유는 키워드 ‘모발’, ‘두피’에 한계를 정해두지 않고 보다 포괄적인 범주로 명확한 연구 동향을 파악할 수 있었다. 연구의 한계점으로는 국내 등재되어 있는 논문 자료만을 취급하였기 때문에 아직 발표되지 않은 연구논문이 누락되었을 가능성이 있으며 연구동향의 경향과 논점을 추론하여 미래의 발전 방향을 예측하기에는 국내 등재되어 있는 논문만을 활용하는 것에 한계가 있다. 이에 따라 추후 진행 할 연구에서는 보다 범위를 넓혀 국내 논문뿐만 아니라 국외 논문까지 포함하여 다각적인 방면에서 종합적인 결과를 살펴보아야 할 것으로 보인다.