J Korean Soc Cosmetol > Volume 28(6); 2022 > Article
빅데이터를 활용한 K-뷰티산업 트렌드 예측

Abstract

Recently, global brands have cited K-beauty as the main keyword that inspires product innovation, and K-beauty is also mentioned as a trendy keyword in famous beauty stores, such as preparing a K-beauty section. This study conducted unstructured big data analysis to confirm trends of K-beauty. To this end, keywords related to K-beauty were collected through online communication such as Naver, Daum, and Google using the social network analysis program called Textom. The collection period was set from Jan 2020 to AUG 2022, and a total of 24.683 keywords were collected, and a total of 60 keywords were used for the study by refining unnecessary keywords. The results are as follows. First, performing frequency, TF-IDF analysis, important keywords such as cosmetic products, beauty expo, premium market, and beauty industry were presented. Next, semantic network analysis showed that degree centrality was cosmetic products, beauty expo, and premium market, closeness centrality was award, yakson house, and beauty promotion. betweeness centrality was Korean culture experience, overseas buyer, and trends. Finally, CONCOR analysis resulted in a cluster of six groups: Cosmetics manufacturer, beauty products, beauty exporter, the Korean wave & distribution, beauty growth, beauty business. These analysis results confirm trends related to K-beauty, key components and sales channels for K-beauty industry. In addition, it is judged that it will propose meaningful implications for establishing effective data presentation and marketing strategies for research related to demand for K-beauty.

I. 서 론

국내 뷰티산업이 제도적인 기반을 다지며 발전하게 된 계기는 2009년에 한국보건사회연구원에서 보고한「뷰티산업 선진화를 위한 중장기 계획수립 연구」를 발간하면서 시작되었다. 이 보고서의 주된 내용에는 국내뷰티산업의 현황 및 문제점을 살펴보고, 뷰티서비스산업의 브랜드 구축방안, 시장 활성화 정책 사례 분석, 해외시장 동향과 정책제안 등을 담고 있다(Won et al., 2009). 그 후로 2013 충북 오송 화장품·뷰티 세계박람회의 성공을 토대로 K-Beauty를 선도할 화장품·뷰티산업 육성방안을 구체화하여 충청북도 화장품·뷰티산업을 글로벌 메카로 발전시키고, 지역내 일자리 창출과 경제 활성화에 기여하고자 “충북 화장품·뷰티산업 육성 종합계획 수립”에 대한 보고서에서 K-Beauty라는 용어를 사용하기 시작하였다(Kim et al., 2014). 2019년에 정부는 ‘K-뷰티 미래 화장품 산업 육성방안’을 제시하고 세계 3대 화장품 수출국 도약을 목표로 국내 화장품·뷰티 산업을 대한민국 신성장 수출 주력사업으로 육성하겠다는 의지를 보였으며, 2020년에 발표한 ’K-뷰티 혁신 종합전략‘에는 2024년까지 세계 100대 기업을 7개로, 일자리 9만 개 창출을 목표로 제시하였다(Choi, 2022). 이와 더불어 서울시는 2022년부터 5년간 2,040억을 투자하여 서울을 글로벌 뷰티산업 허브로 만든다는 기본계획을 발표했으며, 10월 한달동안「2022 서울뷰티위크」축제를 통해 클리오를 비롯해 한국콜마, 로레알 코리아, 현대백화점, 화해 등 국내 대표 뷰티기업들과 함께 시민들이 즐길 수 있는 다양한 프로그램을 선보였다. 한편 인천관광공사와 마이스 전문기업 엑스포럼이 공동으로 주최하는 국내·외 뷰티 트렌드 산업 전문 전시회「2022 코리아 뷰티·코스메틱 쇼」를 개최하여, 비즈니스, 마케팅, 트렌드, 플랫폼 등 국내 뷰티산업 분야별 최신 동향을 살펴보고, K-뷰티 산업을 대표하는 리더들의 미래 비전을 제시하는 각종 전략, 트렌드, 산업 정보, 판로개척, 유통채널 입점 설명 및 가이드 등 다양한 정보를 제공하였다. 화장품소재 및 원료의약품 전문기업 대봉그룹은 뷰티 관련 데이터를 분석해 뷰티제품 상품기획자에게 신제품과 인기상품의 제품 정보를 분석해서 제공하고 있다. 이렇듯 뷰티와 화장품업체, 지방자치단체, 정부의 주도하에 K-뷰티는 혁신적 제품 개발과 한류의 확산을 토대로 글로벌 트렌드를 선도하며 전 세계 시장확보에 노력을 기울이고 있다.
한편 뷰티산업과 IT의 융합, 스마트폰 보급과 SNS의 활성화, 뷰티서비스 산업의 디지털 전화, 뷰티 관련 기업들의 고객 데이터 수집이 증가하고 있어서 많은 기업이 보유한 빅 데이터의 규모에 따라서 기업의 성패가 좌우될 수 있다고 본다. 이러한 현상은 일반 산업에 있어서도 비정형데이터 즉 SNS 데이터나 인터넷 검색데이터가 실제 경제활동보다 선행하여 일어나고, 이들 데이터를 활용하여 경제활동을 예측하는 연구가 활발하게 일어나고 있다(Somakhamixay et al., 2021; Yi & Choi, 2019).
최근 다양한 정형 또는 비정형데이터를 활용한 화장품 트렌드를 예측하는 연구들이 늘어나고 있는데, Kim(2022)은 빅데이터를 활용한 온라인 화장품 정보탐색이 브랜드 신뢰 및 지속적 구매 의도에 미치는 영향에 대하여, Lim & Shin(2021)은 빅데이터 분석을 통한 화장품 트렌드 변화 추이에 관한 연구를, Park(2020)은 뉴 노멀 시대의 빅 데이터 분석을 통한 화장품 트렌드에 대한 연구를 보고하였다. 한편 뷰티산업 트렌드를 예측하는데 있어서 빅데이터를 활용하는 연구들도 보고되고 있지만 아직은 미비한 실정이다.
따라서 본 연구의 목적은 빅데이터를 활용하여 온라인 커뮤니케이션에서 K-뷰티에 대한 핵심 키워드 빈도 및 TF-IDF 분석과 도출된 K-뷰티와 관련된 키워드 간 의미연결망 및 중심성 분석, CONCOR 분석을 통해 K-뷰티산업에 대한 소비자의 트렌드를 예측하여 뷰티산업의 나아갈 방향을 제시하고자 함이다.

II. 이론적 배경

1. 빅데이터(Big Data)의 개념

빅데이터에 대한 정의는 대규모, 빠른 생성 속도, 다양한 형태라는 특징을 가진, 기존의 정보 관리 기술로는 저장·관리·분석하기 어려울 정도의 큰 규모의 정형 또는 비정형데이터를 의미한다(Cho, 2016). 빅데이터 뜻을 직역하면 큰 자료, 대용량 자료라고 할 수 있지만 단순히 양적으로 많은 데이터만을 이야기하지 않는 이유는 페이스북, 인스타그램, 트위터와 같은 SNS의 확산으로 인하여 비정형데이터가 증가했기 때문이다(Choi, 2022). 빅데이터 시대에는 단순히 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 실시간 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 빅데이터를 효과적으로 분석하는 것이 매우 중요하기 때문에 빅데이터 분석은 데이터 저장소에 저장된 빅데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다(Nam et al., 2021). 따라서 소셜미디어를 이용하는 수많은 사람들이 자발적으로 쏟아내는 정형(Structured), 비정형(Unstructured) 데이터는 엄청난 잠재 가능성을 지닌 금맥과도 같은 하나의 자원이 되었다고 볼 수 있다(Kim, 2022). 빅데이터의 종류는 정형화 정도에 따라서 정형(Structured) 데이터, 반정형(Semi-Structured) 데이터, 비정형(Unstructured) 데이터로 구분된다. 정형데이터는 관계형 DB, 스프레드시트와 같은 고정된 필드에 저장된 데이터를 말하며, 반정형(Semi-Structured)는 XML, HTML 텍스트처럼 고정된 필드에 저장되어 있지 않지만, 메타 데이터나 스키마 등을 포함하는 데이터이다. 비정형(Unstructured) 데이터는 텍스트 분석이 가능한 텍스트 문서 및 이미지·동영상·음성 데이터와 같이 고정된 필드에 저장되어 있지 않은 데이터를 말한다(Kim, 2012).

2. 빅데이터 활용분야

최근 코로나 19 팬데믹으로 인하여 다양한 민간, 단체, 기업 등에서 적극적으로 데이터를 활용하는 사례들이 급속도로 증가하는 모습을 볼 때, 국내·외적으로 빠르게 증가하고 있는 인공지능(A.I.)의 수요와 더불어 비즈니스 환경의 빠른 변화에 대한 신속한 대응을 위해 상황(Context)에 맞춘 실시간 데이터 흐름을 수집, 분석하여 인사이트를 도출해 내는 것이 과거에 비해 훨씬 중요해졌고 이를 빠른시간 내에 시각화하여 제공하는 것이 가능해졌다고 볼 수 있다(Kim, 2022). 다양한 형태의 데이터를 수집하고 분석하여 누구에게나 맞춤형의 정보를 제공할 수 있기 때문에 특히 마케팅에서 활용성이 크며, 제품을 제조 유통 판매하고자 할 때 빅데이터를 통해서 시장의 동향과 소비자들의 관심도를 사전에 파악하고 분석할 수 있으며, 만족도에 대한 환류를 통해서 새로운 제품을 개발하는데 참고할 수 있다(Yoon, 2021). 이러한 빅데이터의 활용은 화장품, 뷰티산업 외에도 사회, 문화, 요식업, 여행업과 같은 서비스 분야에서도 고객들의 검색 키워드를 분석하여 인기 아이템을 예측할 수 있으며 고객들이 필요로 하는 정보를 보다 정확하고 다양하게 제공할 수 있다(Choi, 2022; Somakhamixay et al., 2021; Yi & Choi, 2019). 최근 구글, 네이버, 페이스북, 인스타그램 등 다양한 SNS를 통해서 수집되는 정보를 빅데이터로 분석하여 고객의 구매형태나 소비성향 등을 파악함으로 기업의 마케팅에 많이 활용되고 있다. 또한 Somakhamixay Oui 등은 식품소비 관련된 정형 데이터와 비정형데이터를 연계한 융합데이터 셋에 대하여 딥러닝 기반의 소비예측 모델을 생성하고 이를 검증한 결과 정형 데이터와 비정형데이터를 결합할 때 모델 정확도가 향상되었음을 보여주었다(Somakhamixay Oui et al., 2021). Lee는 비정형데이터인 사진자료를 이용하여 침수의 발생여부를 판단하는 모델을 개발하여 모델을 CCTV관제센터 시스템에 탑재한다면 신속하게 침수피해에 대한 대처가 이루어 질 수 있을것이라 판단하였다(Lee et al., 2021). Kim은 뉴스 비정형데이터의 수집과 토픽 분석(LDA)을 통한 성범죄 치안 이슈의 효율적 탐색이라는 주제하에 비정형 텍스트 데이터 분석기법을 활용하여 신종 성범죄 유형에 대한 치안 정책 수요를 효과적으로 파악할 수 있다고 보고하였다(Kim, 2020).

3. 텍스트마이닝(Text Mining) 분석

빅데이터를 분석하는 여러 기술 가운데 텍스트 마이닝 분석법은 최근 발전된 정보처리 기술과 인프라를 활용하여 뉴스, 인터넷 등의 텍스트 문서로부터 정보를 획득, 키워드의 패턴을 분석하고 이를 토대로 예측을 수행하는 방법론으로서 최근 그 활용 영역을 확장해 나가고 있다(Roh & Bae, 2018). 의학분야에서는 텍스트 마이닝 분석을 통해 질병의 원인과 치료를 위해 사용하였고(Chen et al., 2016), 금융 분야에서는 뉴스에 대한 텍스트 마이닝을 통해 뉴스가 주가 상승에 미치는 영향을 분석하였으며(Ahn & Cho, 2010), 기상청 기상연감 자료 분석을 통하여 이슈가 되었던 기상관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무현황의 트랜드를 파악하는데 텍스트마이닝 분석법이 사용되어왔다(Sun et al., 2017).

III. 내용 및 방법

1. 연구 절차

본 연구는 텍스트 마이닝(Text Mining), 의미연결망(Semantic Network), CONCOR(CONvergence of iteration CORrealtion) 분 석을 활용한 K-뷰티의 성장을 확인할 수 있는 트렌드를 예측하고 커뮤니케이션에서 도출된 주요 키워드 및 트렌드 동향을 파악함으로써 K-뷰티산업에 내포되어 있는 이들 키워드가 갖는 연결중심성을 확인하고자 다음<Table 1>과 같은 절차에 따라 자료수집, 데이터 전처리, 텍스트 마이닝과 사회연결망 분석, CONCOR 분석 단계로 연구를 진행하였다.

2. 용어 정의

1) TF-IDF(Term Frequency-Inverse Document Frequency)

자연어를 벡터로 변환하는 기법을 임베딩(emdedding)이라고 하는데 자연어를 기계가 이해할 수 있고 연산과 처리가 가능한 벡터로 바꾸면 벡터 사이의 유사도를 계산하여 단어나 문장 간 관련도를 계산할 수 있고 벡터끼리의 사칙연산이 가능하며 의미나 문법 정보를 함축 시킬 수 있는데 점차 임베딩 기법이 단어수준에서 문장수준으로 변화하고 있다. 임베딩을 만드는 가정에는 크게 3가지가 있는데 어떤 단어가 많이 쓰였는가?, 단어가 어떤 순서로 등장하는가?, 어떤 단어가 같이 나타나는가? 에 대한 통계적 패턴을 서로 다른 각도에서 분석하게 되는데 TF-IDF(Term Frequency-Inverse Document Frequency)는 어떤 단어가 많이 쓰였는가를 분석하는 대표 통계량으로 중요도가 높을 것 같은 특징어에 높은 가중치를, 반대는 작은 가중치를 부여한다. TF는 단어의 등장횟수, DF는 단어가 등장한 문서의 수, IDF는 DF의 역수이자 반비례수이므로 T F-I DF는 단어의 등장횟수×log(총 문서의 수 N/단어가 등장한 문서의 수)로 설명된다. 단어가 자주 등장하면 그만큼 중요하겠지만 그 단어가 등장한 문서 자체가 많다면 중요도가 낮다고 볼수 있다. 수많은 문서에 등장하지만 커다란 의미는 없는 단어를 전처리한 불 용어가 이에 해당된다(Kim, 2020).

2) 의미연결망(semantic network analysis) 분석

사회연결망 분석(social network analysis)에 기초하여 노드간의 관계에 중점을 두는 분석 방법으로 키워드의 빈도와 연결 관계를 기반으로 네트워크를 공간상에 시각화하여 텍스트의 의미와 특성을 도출하는데 사용하는 분석방법이다(Kang et al., 2018; Oh et al., 2017). 사회 시스템 구조를 파악할 때 행위자 사이의 관계를 중시하는 사회연결망 분석을 커뮤니케이션 메시지에 적용시킨 방법으로 단어들의 빈도와 한 문장 안에서 동시에 사용되는 단어들의 관계를 통해 메시지의 의미화 패턴을 분석할 수 있다(Kim, 2017).

3) CONCOR(CONvergence of iteration CORrealtion) 분석

행위자간 관계패턴의 도출을 위해 상관관계 값을 이용하는 대표적인 구조적 등위성 측정 방법이다. 구조적 등위성이란 한 네트워크에서 다른 행위자들과 직접적인 관계는 없으나, 동일한 관계패턴을 가지는 경우를 말한다(Baek & Moon, 2021). 본 연구에서는 비슷한 특성을 가진 키워드를 유사한 중심으로 군집(클러스터)을 도출하기 위해 Ucinet6의 NetDraw 프로그램을 이용하여 CONCOR 분석을 실시하였다.

3. 연구범위

본 연구의 시간적 범위와 공간적 범위는 다음과 같다. 먼저, 시간적 범위는 최근 2년간의 뷰티산업의 트렌드를 분석하고 예측하기 위하여 2020년 1월 1일부터 2022년 8월 31일까지 2년 8개월로 설정하였고, 공간적 범위는 구글, 다음 및 네이버와 같은 온라인 커뮤니케이션의 뉴스, 소비자들이 선호하는 블로그 및 카페로 제한하였다. 한편, 비정형데이터 수집은 소셜 매트릭스 분석 프로그램인 네트워크 분석 프로그램인 텍스톰(Textom)을 사용하였다. 텍스톰은 네덜란드 암스테르담 대학에서 개발한 풀텍스트 소프트웨어를 한국어로 분석가능한 KrKwic를 활용하여 사용자들이 효과적으로 이용할 수 있도록 개발한 텍스트 처리 솔루션프로그램이다. 텍스톰(Textom)은 데이터 수집(Collecting), 저장(storage), 정제(cleaning), 매트릭스(matrix), 시각화(visualization)가 가능한 유료 빅테이터 웹 프로그램으로 현재까지 많은 연구가 이 프로그램을 활용하여 보고되어서 신뢰성이 입증되었다(Baek & Moon, 2021).

4. 분석방법

본 연구의 결과 도출을 위한 분석방법은 다음과 같다. 먼저, 텍스톰을 활용하여 수집채널에 대한 K-뷰티와 관련한 키워드 수집 및 이를 토대로 전처리를 수행하였다. 텍스톰은 주요 키워드의 빈도수 및 T F-I DF 값을 기반으로 효과적인 매트릭스 정보를 제안하기 때문에 텍스트를 활용한 빅데이터 분석 시 매우 효율적이다. 둘째, K-뷰티 키워드와 정제를 수행하였다. 구체적으로, 부사, 조사 및 어근과 같은 K-뷰티와 관련한 키워드의 중요성이 현저히 떨어지는 키워드는 과감히 삭제하였다(Paranyuskin, 2011). 또한 키워드가 중복되는 경우, 영향력을 제한시키기 위해 빈도 2회 이상을 키워드를 발췌하는 과정을 수행하였다. 셋째, UCINET 6.0 프로그램을 사용하여 연결, 근접, 매개 중심성 분석을 수행하였다. 넷째, Ucinet 6의 NetDraw를 활용한 시각화 구현 및 주요 키워드 노드 간 연결망을 확인하였다(Nooy, Mrvar & Batagel, 2005). 마지막으로, CONCOR 분석을 통해 군집화를 수행하였다.

IV. 결과 및 고찰

1. 빈도 및 TF-IDF 분석

K-뷰티산업 동향에 대한 트렌드 조사 확인 결과 총 24,683개의 키워드 중 본 연구에 활용할 60개의 핵심 키워드를 다음 <Table 2>에 나타냈다. 빈도분석 및 TF-IDF 값에 대한 결과를 살펴보면 먼저 빈도분석을 수행한 결과 총 60개의 키워드 가운데 상위랭킹 10위안에 ‘화장품’, ‘뷰티엑스포’, ‘프리미엄시장’, ‘뷰티산업’, ‘한류열풍’, ‘이커머스’, ‘브랜드’, ‘한국문화체험’, ‘메이크 업’, ‘해외바이어’ 순으로 제시되고 있다. 다음으로 TFIDF 분석을 수행한 결과 ‘뷰티엑스포’, ‘화장품’, ‘뷰티산업’, ‘한류열풍’ 순으로 제안되고 있는데, 이는 빈도분석을 수행한 결과 값과 비교하여 볼 때 매우 비슷한 양상을 보이고 있음을 알 수 있다. TF-IDF 분석은 중요도를 확장시키는 지수로서, 빈도분석에 대한 가중치가 중요하다는 것을 확인해주고 있다. K-뷰티 산업에서 소비자들이 최근 2년 내에 가장 관심을 많이 기울이고 검색해본 키워드는 뷰티 엑스포와 화장품이라는 사실을 알 수 있으며, 이러한 분석결과를 통해서 국내 화장품을 중심으로 K-뷰티산업과 관련된 제조, 유통, 마케팅 등의 성장을 위해서 엑스포에 대한 관심을 가지고 이를 활성화시킬 필요가 있다. 선행연구를 통해서 빅데이터 분석 및 인공지능 알고리즘을 이용한 예측 방법이 정량적인 데이터만을 가지고 예측되는 기존 모델들과 달리 정성적인 요소 즉, 온라인 상의 다양한 뉴스를 활용한 감성분석 및 텍스트 마이닝를 결합했을 경우 정량적인 것들만을 이용한 결과보다 더 예측력이 향상되었음을 보고하였다(Roh & Bae, 2018; Park, 2022). 또한 빅데이터의 활용은 화장품, 뷰티산업 외에도 의료, 사회, 문화, 요식업, 여행업과 같은 서비스 분야에서도 고객들의 검색 키워드를 분석하여 인기 아이템을 예측할 수 있으며 고객들이 필요로 하는 정보를 보다 정확하고 다양하게 제공할 수 있다(Choi, 2022; Somakhamixay et al., 2021; Yi & Choi, 2019).

2. 의미연결망(Semantic Network) 분석

의미연결망 분석은 단어들의 빈도와 한 문장 안에서 동시에 사용되는 단어들의 관계를 통해 메시지의 의미화 패턴을 분석할 수 있으며, 정보단위가 되는 단어나 구를 각각의 노드를 형성하는 개념으로 놓고 개념 간의 연결 상태를 링크(link)로 나타내는데 여기서 링크로 드러나는 단어들의 공동출현 관계를 통해 의미를 해석 한다(Kim et al., 2016). 그리고 연결망을 구성하는 노드와 링크로 형성된 네트워크 매트릭스에 따라 개체간의 관계 파악에 쓰이는 원 모드(1-mode) 네트워크와 개체와 소속간의 관계를 나타내는 투 모드(2-mode) 네트워크로 구분한다(Hwang, 2019). K-뷰티산업 동향에 대한 네트워크의 연결성을 확인하고자 중심성 분석을 수행하였는데, 이에 대한 결과는 다음 <Table 3> 및 <Fig. 1>과 같이 나타났다. 중심성 분석은 크게 연결중심성(Degree Centrality), 근접중심성(Closeness Centrality) 및 매개중심성(Betweeness Centrality)으로 나눌 수 있으며, 연결중심성은 노드의 활동성을 강조하고(Borgatti, Everett & Johnson, 2013), 근접중심성은 노드의 독립성에 주안을 준다(Freeman, 1979), 마지막으로 매개중심성은 두 개 이상의 키워드들 간 연결관계를 강조한다. 먼저 연결중심성 분석을 수행한 결과, ‘뷰티엑스포’, ‘화장품’, ‘프리미엄시장’, ‘이커머스’, ‘한류열풍’ 순으로 제시되었고, 근접중심성 분석 결과는 ‘어워드’, ‘약손명가’, ‘뷰티홍보’, ‘오송’, ‘대만’ 등의 순으로 제시되었으며, 매개중심성 결과는 ‘한국문화체험’과 ‘해외바이어’, ‘뷰티산업’, ‘트렌드’, ‘베트남’, ‘일본’ 등의 순으로 나타났다. 연결중심성의 경우 키워드가 많은 연결 관계를 가짐에 따라 다른 키워드에 미치는 영향 정도가 커지므로 상대적으로 우위에 있다고 볼 수 있다. 따라서 K-뷰티산업의 중심에 화장품(Cosmetic products)이 있으며, 뷰티 엑스포를 통해서 한류와 함께 글로벌 시장으로 진출하고 있음을 알 수 있다. 국내 많은 엑스포 가운데 오송 엑스포에 대한 외국 바이어들의 관심이 높고, 그동안 중국 의존성이 높았던 화장품 시장이 점차 대만, 일본, 베트남 등 수출 다변화가 일어나고 있음을 알 수 있다. 특히 매개중심성 결과 한국문화체험에 대한 검색이 많다는 것은 해외에서 K-뷰티에 대한 관심 외에도 한국문화에 대한 관심 또한 많다는 것을 예측할 수 있다. Park & Lee(2014)는 패션트렌드 정보사의 어휘를 사회적 연결망을 분석하여 향후 패션트렌드를 예측하였고, Kim & Choi(2016)는 아이폰X와 이와 대응관계에 있는 갤럭시노트8에 대한 고객 특성을 분석하여 제품디자인의 우선순위와 방향성을 제시하였으며, Kim(2020)은 의미 연결망 분석을 통해서 평양냉면의 소비자 인식을 조사하여 마케팅 전략과 시사점을 제시하였다.

3. CONCOR(CONvergence of iteration CORrealtion) 분석

본 연구는 소셜미디어에서 사람들이 ‘K-뷰티’에 대해 어떻게 상호작용하였는지를 파악하기 위해 CONCOR 분석을 활용하였다. 유사점을 가진 노드(단어)들끼리 그룹을 형성하고, 형성된 각 그룹의 특징을 파악하기 위하여 ‘K-뷰티’를 중심으로 빈도분석을 실시한 다음 상위 100개 단어로 정제하고, 1-mode 매트릭스 데이터를 만들어서 CONCOR 분석을 하였다. CONCOR 분석은 비슷한 위치 및 장소에 있는 노드들의 특성 간 관계를 생각하여 연관도가 높은 노드를 그룹화하는 군집분석의 형태이다(Kim, 2015). CONCOR 분석 결과 <Table 4>에서 알 수 있듯이 K-뷰티산업을 위한 화장품 제조사, K-뷰티상품, K-뷰티 수출국가, 한류 및 유통, K-뷰티산업 성장, K-뷰티 사업 등의 총 6개의 그룹으로 구분되었다. 첫 번째 그룹은 화장품 제조사 속성으로 ‘올리브영’, ‘아모레퍼시픽’, ‘LG생활건강’, ‘약손명가’, ‘중소기업’ 등이 연결성이 높은 것을 알 수 있다. 두 번째 그룹은 K-뷰티 상품과 관련한 키워드로 ‘화장품’, ‘메이크업’, ‘뷰티상품’, ‘경쟁력’, ‘스킨’, ‘헤어’, ‘코스메틱’ 등이 연결성이 연결성이 높은 것을 알 수 있다. 세 번째 그룹은 K-뷰티 수출국가와 관련한 것으로 ‘미국’, ‘중동’, ‘멕시코’, ‘인도네시아’, ‘일본’, ‘베트남’, ‘대만’, ‘프랑스’, ‘중국’ 등이 연결성이 연결성이 높은 것을 알 수 있다. 네 번째 그룹은 한류 및 유통과 관련한 것으로 ‘한류’, ‘한국문화체험’, ‘글로벌 뷰티’, ‘문화체험’, ‘뷰티체험’, ‘특별판촉전’, ‘이커머스’, ‘브랜드’, ‘플랫폼’ 등이 연결성이 연결성이 높은 것을 알 수 있다. 다섯 번째 그룹은 K-뷰티산업 성장과 관련한 것으로 ‘프리미엄 시장’, ‘뷰티산업’, ‘사업진출’, ‘뷰티아카데’, ‘성장’, ‘확대’, ‘뷰티프로모션’ 등이 연결성이 높은 것을 알 수 있다. 마지막은 K-뷰티산업 비즈니스와 관련한 것으로 ‘뷰티엑스포’, ‘해외바이어’, ‘지원’, ‘최대계약’, ‘오송엑스포’, ‘협약체결’, ‘수출상담’, ‘바이어’, ‘박람회’, ‘전시회’ 등의 키워드가 높은 연결 관계를 보여주고 있다. 이와 같은 결과를 통해서 각 그룹에서 제시된 키워 간 연결성 출현 확률이 매우 높고 그룹별 K-뷰티산업 동향에 대한 내용을 예측할 수 있다. Baek & Moon(2021)은 CONCOR 분석결과 환자안전문화를 구성하는 지식 및 태도, 커뮤니케이션, 의료서비스, 팀, 작업환경, 구조, 조직 및 경영의 총 7개의 클러스터가 도출되어 간호조직뿐 아니라 의료의 다양한 조직구성원들의 환자안전문화정도를 측정하는 도구를 개발하는데 영향을 미쳤다고 보고하였다.

V. 결 론

본 연구는 비정형데이터를 활용하여 온라인 커뮤니케이션에서 K-뷰티에 대한 핵심 키워드 빈도 및 TF-I DF 분석, 도출된 K-뷰티와 관련된 키워드 간 의미연결망 및 중심성 분석, CONCOR 분석을 통해 K-뷰티산업에 대한 소비자의 트렌드를 예측하여 뷰티산업의 나아갈 방향을 제시하고자 함이다. K-뷰티 검색 결과 총 24,683개의 키워드 중 본 연구에 활용할 60개의 핵심 키워드를 활용하여 실증분석 결과는 다음과 같다.
첫째, TF-IDF 분석결과와 빈도분석을 수행한 결과 값이 매우 비슷한 양상을 보였는데, 이 두 가지 분석결과에 공통적으로 검색된 핵심 키워드는 화장품과 뷰티 엑스포로 나타났다. 그동안 코로나-19 팬데믹으로 인하여 2년 동안 국내에서 뷰티 엑스포가 개최되지 않아 국내 화장품 해외진출이 잠시 주춤하였지만, 올해부터 코엑스, 킨텍스, 오송 등에서 다시 전시를 시작하게 되었다. 정부와 지자체가 앞장서서 국내 화장품을 중심으로 K-뷰티산업과 관련된 제조, 유통, 마케팅 등의 성장을 위해서 엑스포에 대한 관심을 가지고 이를 활성화시킬 필요가 있다. 또한 지속적인 한류열풍과 함께 다양한 형태의 뷰티 엑스포가 개최되고 중소기업들이 해외 뷰티 엑스포에 적극 참여할 수 있도록 재정적인 뒷받침이 마련되기를 바란다.
둘째, 연결중심성 분석을 수행한 결과 역시 뷰티엑스포, 화장품, 프리미엄시장, 이커머스, 한류열풍 순으로 제시되었다. 특히 프리미엄 시장의 경우 점차 가치소비를 중시하는 젊은 소비자들이 화장품 가격보다 성분과 기능을 첫 번째 구매요인으로 생각하고, 피부과 의사들이 인증한 제품이 잘 팔리며, 소비자들의 화장품 품질 및 브랜드에 대한 기대 수준이 높아지면서 프리미엄 화장품 소비도 증가하고 있음을 보여주는 결과라고 생각된다. 또한 외모에 관심을 갖는 남성이 늘어나면서 남성화장품 시장은 해마다 성장을 거듭하고 있으며, 시장이 커지면서 고급 제품을 찾는 사람도 늘고 있어 프리미엄 시장도 확대 추세에 있다. 그리고 화장품 업계 선두주자 기업들은 이커머스 시장 진출에 무게를 싣고 있는데 이는 로드숍 중심의 오프라인 시장이 불황에 빠진 가운데 온라인 수요를 잡기 위하여 디지털 전환에 속도를 내고 있기 때문으로 여겨진다.
셋째, 근접중심성 분석 결과는 어워드, 약손명가, 뷰티홍보, 오송, 대만 등의 순으로 제시되었으는데, 특히 어워드의 경우 환경·사회·지배구조(ESG) 경영이 본격적으로 도입되면서 친환경 패키지를 추구하는 분위기가 확산되고 있음을 시사한다. 여러 화장품 기업들이 세계 3대 디자인상으로 꼽히는 iF 디자인 어워드, 레드닷 디자인 어워드에서 친환경 패키지로 수상하면서 화제를 일으키고 있다. 한편 화장품 기업의 측면에서 자사 뷰티제품을 홍보하고 마케팅 방법으로 어워드 행사를 진행하고 있는데 롯데온은 매년 연말 온·오프라인 구매 데이터를 분석해 뷰티어워드를 진행하고 있다.
넷째, 매개중심성 분석 결과는 한국문화체험과 해외바이어, 뷰티산업, 트렌드, 베트남, 일본 등의 순으로 나타났다. 그동안 뷰티 엑스포를 통해서 K-뷰티를 해외바이어에게 널리 알리기 위한 노력이 이어져 왔기 때문에 한류와 함께 글로벌 시장으로 확대되고 있음을 알 수 있다. 특히 K-뷰티가 일본에서 꾸준한 인기를 누리고 있는 것으로 나타났는데 최근 일본 수입화장품 협회에 따르면 2022년 1-9월 화장품 수입국 중 한국이 575억 7000만엔으로 1위를 유지하고 있다고 밝혔다. 무엇보다도 한국문화체험에 대한 검색이 많다는 것은 해외에서 K-뷰티에 대한 관심 외에도 한국문화에 대한 관심 또한 높아지고 있음을 예측할 수 있다. 따라서 우리 전통문화를 특화시키고 관광자원을 개발 및 활성화시키는 일에도 관심을 기울어야 할 것으로 사료된다.
다섯째, K-뷰티산업을 위한 화장품 제조사, K-뷰티상품, K-뷰티 수출국가, 한류 및 유통, K-뷰티산업 성장, K-뷰티 사업 등의 총 6개의 그룹으로 분석되었다. 화장품 제조사 속성의 경우 대기업이 중심에 있고, K-뷰티 상품에 있어서는 화장품이, K-뷰티 수출국가의 경우에는 미국, 중동, 멕시코, 인도네시아, 일본, 베트남, 대만, 프랑스, 중국 등 여러 나라로 수출이 다변화되고 있음을 알 수 있다. 한류 및 유통의 경우 한류, 한국문화체험, 글로벌 뷰티, 특별판촉전, 이커머스, 브랜드, 플랫폼 등이 연결성이 높은 것을 알 수 있다. K-뷰티산업 성장과 관련한 것으로 프리미엄 시장, 성장, 확대 등이 연결성이 높은 것을 알 수 있다. 마지막은 K-뷰티산업 비즈니스와 관련한 것으로 뷰티엑스포, 해외 바이어, 지원, 최대계약, 오송엑스포, 협약체결, 수출상담, 바이어, 박람회, 전시회 등의 키워드가 높은 연결 관계를 보여주고 있다. 이와 같은 결과를 통해서 각 그룹에서 제시된 키워 간 연결성 출현 확률이 매우 높고 그룹별 K-뷰티산업 동향에 대한 내용을 충분히 예측할 수 있다고 사료된다.
반면에 본 연구는 온라인 커뮤니케이션으로 한정하여 데이터 수집 및 분석을 수행하였는데, 이러한 온라인 커뮤니케이션은 성별 및 연령과 같은 인구통계학적 특성이 반영되지 않아 이를 통해 K-뷰티에 대한 관심도를 파악하는데 한계점을 가지고 있다. 그리고 본 연구의 시간적 범위를 최근 2년간으로 설정하였기 때문에 코로나 발생이라는 특수한 변수로 인하여 K-뷰티 산업에 대한 정확한 예측을 하는데 다소 무리가 있으며, 공간적 범위를 구글, 다음 및 네이버와 같은 온라인 커뮤니케이션의 뉴스와 소비자들이 선호하는 블로그 및 카페로 제한하였기 때문에 추후 연구를 통해서 보다 많은 정형, 비정형데이터 분석이 필요할 것으로 판단된다.

Fig. 1.
Visualization of keyword analysis
JKSC-2022-28-6-1373f1.jpg
Fig. 2.
Visualization of CONCOR analysis
JKSC-2022-28-6-1373f2.jpg
Table 1.
Research procedures
Step 1 Step 2 Step 3 Step 4 Step 5
Data Collection Data Cleaning Text Mining Social Network Analysis CONCOR Analysis
· Online Communication News(Google, Naver, Daum) · Keywords Filtering · TF · Degree Centrality · Semantic Network
· Blog · Keywords Extraction · TF-IDF · Eigenvector Centrality
· Cafe · Network · Betweennes Centrality
Table 2.
Result of frequency and TF-IDF analysis
Rank Keyword Frequency TF-IDF Rank Keyword Frequency TF-IDF
1 Cosmetic products 1,003 1169.68 31 Promotional exhibition 225 636.82
2 Beauty expo 844 1334.43 32 Agreement 225 552.51
3 Premium market 789 1011.66 33 Ilsan KINTEX 218 596.39
4 Beauty industry 753 1111.04 34 Japan 213 606.40
5 the Korean wave 751 1057.02 35 Competitiveness 213 546.02
6 E-commerce 711 982.54 36 Skin 210 516.87
7 Brand 614 987.00 37 Hair 207 541.45
8 Korean culture experience 522 901.07 38 Cosmetics 199 539.97
9 Makeup 485 998.00 39 Conclusion of agreement 199 477.67
10 Overseas buyer 485 847.95 40 Export consultation 195 551.91
11 Support 439 922.18 41 Indonesia 195 553.53
12 Beauty products 435 800.05 42 Mexico 194 485.41
13 Maximum contract 415 720.94 43 Buyer 192 502.17
14 Global beauty 385 734.99 44 Fair 187 487.85
15 Platform 353 711.86 45 Fashion 174 484.05
16 Contents 342 796.10 46 Yakson house 171 580.03
17 OLIVEYOUNG 323 737.65 47 Participation 168 466.04
18 China 309 745.04 48 Exhibition 160 428.37
19 AMOREPACIFIC 282 660.69 49 Beauty academy 155 409.58
20 France 273 624.77 50 Opening 153 410.72
21 LG Healthy & beautiful 272 677.36 51 Offline 152 470.21
22 Osong 272 728.23 52 Expansion 151 406.43
23 Contract achievement 262 576.70 53 Growth 146 403.88
24 Market development 262 599.85 54 The Middle East 140 389.47
25 Event 254 582.51 55 The United States 137 409.82
26 Taiwan 250 729.14 56 Small business 132 388.60
27 Business advancement 244 576.67 57 Award 132 466.19
28 Vietnam 240 604.83 58 Cultural experience 126 368.63
29 On-demand training 236 599.08 59 Beauty experience 124 379.66
30 Trends 234 545.87 60 Beauty promotion 123 442.89
Table 3.
Results of centrality of cosmetics
Words Degree Centrality Closeness Centrality Betweeness Centrality Words Degree Centrality Closeness Centrality Betweeness Centrality
Cosmetic products 8366.00 62.00 2.66 Promotional exhibition 1935.00 68.00 1.38
Beauty expo 8687.00 62.00 2.14 Agreement 2111.00 64.00 3.20
Premium market 7306.00 61.00 2.87 Ilsan KINTEX 1743.00 75.00 0.36
Beauty industry 6513.00 60.00 10.13 Japan 1534.00 62.00 9.58
the Korean wave 6748.00 60.00 4.62 Competitiveness 1381.00 63.00 2.32
E-commerce 6982.00 60.00 4.62 Skin 1271.00 64.00 3.50
Brand 4288.00 63.00 2.30 Hair 1366.00 66.00 1.26
Korean culture experience 4424.00 59.00 11.13 Cosmetics 1790.00 67.00 2.57
Makeup 3444.00 60.00 4.62 Conclusion of agreement 2101.00 68.00 1.78
Overseas buyer 5126.00 59.00 11.13 Export consultation 2461.00 70.00 0.97
Support 3815.00 61.00 2.87 Indonesia 2354.00 75.00 0.36
Beauty products 3988.00 61.00 2.87 Mexico 2036.00 61.00 3.82
Maximum contract 4273.00 60.00 4.62 Buyer 1995.00 66.00 1.55
Global beauty 3246.00 60.00 4.62 Fair 1961.00 63.00 2.02
Platform 2621.00 60.00 4.62 Fashion 1169.00 64.00 1.79
Contents 3889.00 63.00 2.27 Yakson house 738.00 95.00 1.55
OLIVEYOUNG 2765.00 61.00 2.87 Participation 1489.00 62.00 3.39
China 2048.00 67.00 7.71 Exhibition 1645.00 68.00 1.24
AMOREPACIFIC 2333.00 63.00 1.98 Beauty academy 1376.00 62.00 2.43
France 2662.00 60.00 4.62 Opening 1738.00 72.00 0.62
LG Healthy & beautiful 2795.00 66.00 1.82 Offline 1826.00 65.00 1.84
Osong 2605.00 77.00 0.30 Expansion 1686.00 62.00 2.50
Contract achievement 3097.00 62.00 2.13 Growth 1157.00 65.00 7.86
Market development 2368.00 61.00 2.87 The Middle East 1212.00 66.00 1.67
Event 2640.00 61.00 3.81 The United States 1067.00 64.00 1.95
Taiwan 3103.00 76.00 0.37 Small business 1361.00 68.00 1.53
Business advancement 2515.00 62.00 2.14 Award 633.00 109.00 0.00
Vietnam 2222.00 61.00 9.94 Cultural experience 972.00 64.00 1.68
On-demand training 1944.00 63.00 3.25 Beauty experience 845.00 65.00 1.83
Trends 2012.00 60.00 10.13 Beauty promotion 1106.00 84.00 0.23
Table 4.
Results of CONCOR analysis
Group Keywords Number
Cosmetics Manufacturer OLIVEYOUNG, AMOREPACIFIC, LG Health & beautiful, Yakson house, Small business 5
Beauty Products Cosmetic products, Makeup, Beauty products, Competitiveness, Skin, Hair, Cosmetics 7
Beauty Exporter The United States, The Middle East, Mexico, Indonesia, Japan, Vietnam, Taiwan, France, China 9
The Korean Wave & Distribution the Korean Wave, Korean culture experience, Global beauty, Cultural experience Beauty experience, E-commerce, Brand, Platform, Contents, Trends, Promotional exhibition, Market development, Fashion, Offline 14
Beauty Growth Premium market, Beauty industry, Business advancement, Beauty academy, Growth, Expansion, Award, Beauty promotion 8
Beauty Business Beauty expo, Overseas buyer, Support, Maximum contract, Osong, Event, On-demand training, Agreement, Ilsan KINTEX, Conclusion of agreement, Export consultation, Buyer, Fair, Participation, Exhibition, Opening, Contract achievement 17

References

Adrian, M. (2011). Big Data. Teradata Magazine, 1(11). Retrieved from http://www.teradatamagazine.com/v11n01/Features/Big-Data).
Ahn, S., & Cho, S. (2010). Stock prediction using news text mining and time series analysis. In 2010 Conference Proceedings of Korean Institute of Information Scientists and Engineers, 37:364-369.
Baek, S. M., & Moon, I. O. (2021 The Study on the patient safety culture convergence research topics through text mining and CONCOR analysis. Journal of Digital Convergence, 19(12), 359-367. http://dx.doi.org/10.14400/JDC.2021.19.12.359.
Borgatti, S. P., Everett, M. G., & Johnson, J. C. (2013). Analyzing social networks. Thousands Oaks, California: SAGE Publications Inc.
Chen, P., Ponocko, J., Milosevic, N., Nenadic, G., and Milosevic, J. (2016). Towards application of text mining for enhanced power network data analytics-part i; retrieval and ranking of textual data from the internet. Mediterranean Conference on Power Generation, Transmission Distribution and Energy Conversion (medpower 2016), 1-8.
Choi, E. (2022 A paradigm shift in beauty education in response to the digital transformation era-based on analysis of trends in the cosmetics and beauty industry-. J. Kor. Soc. Cosmetol, 28(4), 675-688. https://doi.org/10.52660/JKSC.2022.28.4.675.
crossref pdf
Freeman, L. C. (1979). Centrality in social networks: Conceptual clarification. Social Network, 1:215-239.
crossref
Hwang, Y. S. (2019 A Study on the Recognition of Universal Design through Text Mining. Journal of the Korea Institute of the Spatial Design, 14(1), 57-66. doi: 10.35216/kisd.2019.14.1.57.
crossref
Kim, B. S. (2022). Effect of online cosmetics information search using big data on brand trust and continuous purchase intention. Doctoral dissertation, Kunkuk University, Seoul.
Kim, H. H., & Choi, E. (2016). A study of nutrition knowledge, confidence, and body image of university students. Culinary Science & Hospitality Research, 22(1), 70-77.
Kim, H. S. (2017 An Exploratory Study on the Semantic Network Analysis of Food Tourism through the Big Data. Culinary Science & Hospitality Research, 23(4), 22-32. doi: 10.20878/cshr.2017.23.4.003.
crossref
Kim, H. J. (2020 Efficient Way to Explore the Sex Offense Typologies Through Topic Analysis(LDA) with News Articles. Journal of the Korean Society of Crime, 14(1), 5-16. doi: 10.29095/JKCA.14.1.1.
crossref
Kim, J. S. (2012). Big Data Utilization and Related Technology Review. Korea Contents Association, 10(1), 34-40.
Kim, J. S., Jung, J. W., Yoon, S. M., Oh, Y. I., Yoon, H. M., Lee, S. H., Kwak, N. H., & Lee, M. S. (2014). Establishment of a comprehensive plan to foster the cosmetics and beauty industry in Chungcheongbuk-do. Korea Institute of Health and Social Affairs.
Kim, S. H. (2022). A study on Design Research Methodology using Unstructured Data-Focusing on Social Network Analysis(SNA). Doctoral dissertation, Kyung Hee University, Seoul.
Kim, Y. G. (2020). A Study on Consumer Perceptions of Pyeongyang Cold Noodles based on Big Data Analysis -Focused on Semantic Network Analysis-. Journal of Hotel & Resort, 19(4), 259-278.
Kim, Y. H. (2015). Semantic network of Korean pop songs: Changing meaning structure from 1960’s to 2000’s. Journal of Popular Narrative, 21(1), 145-171.
crossref
Lee, H. N., Kim, H. S., Kim, S. J., Kim, D. H., & Kim, J. S. (2021). Development of a method for urban flooding detection using unstructured data and deep learing. J. Korea Water Resour. Assoc, 54(12), 1233-1242.
Lim, H. S., & Shin, J. W. (2021 A Study on the Trends of Cosmetics through Big Data Analysis -Focusing on text mining and semantic network analysis-. The Korean Society of Illustration Research, 66:85-95. http://doi.org/10.37379/JKSIR.2021.66.8.
crossref
Nam, S. T., Shin, S. Y., & Jin, C. Y. (2021). Text Mining and Visualization of Unstructured Data Using Big Data Analytical Tool R. Journal of the Korean Society for Information and Communication, 25(9), 1199-1205.
Nooy, W. D., Mrvar, A., & Batagelj, V. (2005). Exploratory social network analysis with Pajek. Revised and expanded 2nd Edition. Cambridge University Press.
Paranyushkin, D. (2011). Visualization of text’s polysingularity using network analysis. Prototype Letters, 2(3), 256-278.
Park, H. J. (2020). The New Cosmetics Trend Research in the New Normal Era through Big Data Analysis. Korean Society for Cosmetics and Beauty, 10(3), 465-480.
Park, J. W. (2022). Analysis of university's globalization discourse using news big data : Focusing on topic modeling analysis methods. Master's Thesis, Sungkyunkwan University, Seoul.
Park, K. M. (2022). A Study on Bituminous Coal Price Prediction Based on Big Date Analytics and Artificial Intelligence Algorithm. Master's Thesis, Sungkyunkwan University, Seoul.
Roh, Y. J., & Bae, S. H. (2018 Analysis of the Unstructured Traffic Report from Traffic Broadcasting Network by Adapting the Text Mining Methodology. The Journal of The Korea Institute of Intelligent Transport Systems, 17(3), 87-97. doi: https://doi.org/10.12815/kits.2018.17.3.87.
crossref
Somakhamixay Oui, Lee, K. H., La, H. C., Choi, E. S., & Cho, W. S. (2021 Prediction of Agricultural Purchases Using Structured and Unstructured Data: Focusing on Paprika Prediction of Agricultural Purchases Using Structured and Unstructured Data: Focusing on Paprika. Korean Journal of Big Data, 6(2), 169-179. https://doi.org/10.36498/kbigdt.2021.6.2.169.
Sun, H., Lim, C., & Lee, Y. (2017). Analysis of the Yearbook from the korea Meteorological Administration Using a text-mining agorithm. The Korean Journal of Applied Statistics, 30(4), 603-613.
crossref
Won, J. W., Jung, K. H., & Hwang, D. K. (2009). A Study on the Mid- to Long-Term Planning for the Advancement of the Beauty Industry. Korea Institute of Health and Social Affairs.
Yi, N. Y., & Choi, J. H. (2019). A study of the consumer perception of meal kit using big data analysis. Food Service Industry Journal, 15(4), 211-222.
Yoon, S. H. (2021). A Study on Improvement of Pension Operation and Management using Big Data Analysis Techniques. The journal of Convergence on Culture Technology, 7(4), 815.
Youn, J. Y., Kim, Y. H., & Lee, C. W. (2021 A Study on Development of Creative-based Convergence Education Program Using Metavers. The Korean Society of Science & Art, 39(5), 273-283. http://dx.doi.org/10.17548/ksaf.2021.12.30.273.


ABOUT
BROWSE ARTICLES
EDITORIAL POLICY
FOR CONTRIBUTORS
Editorial Office
69 Gwangju Yeodae-gil, Gwangsan-gu, Gwangju, 62396, Korea
Tel: +82-10-2825-6735   Fex: +82-62-950-3797    E-mail: beauty2007@hanmail.net                

Copyright © 2023 by Korean Society of Cosmetology.

Developed in M2PI

Close layer
prev next