빅데이터 분석을 활용한 미용, 뷰티 관련 인터넷 뉴스 동향 분석: 1994부터 2023년 인터넷 뉴스 본문을 분석 대상으로

Analysis of Internet News Trends Related to Beauty using Big Data Analysis: The Internet News Text was Analyzed from 1994 to 2023

Article information

J Korean Soc Cosmetol. 2025;31(3):516-523
Publication date (electronic) : 2025 June 30
doi : https://doi.org/10.52660/JKSC.2025.31.3.516
1Adjunct Professor, Department of Beauty, Daedeok University
2Professor, Department of Medical Beauty Design, Gumi University
3Professor, Department of Hair Designs(Contract), College of Beauty Arts, Seokyeong University
나지하1, 이영신2, 박은준3,
1대덕대학교 뷰티과, 겸임교수
2구미대학교 의료뷰티디자인학부, 교수
3서경대학교 미용예술대학 헤어디자인(계약)학과, 교수
*Corresponding author: Eun-Jun Park Tel : +82-2-940-7846 E-mail : ayamdream@hanmail.net
Received 2025 April 4; Revised 2025 June 20; Accepted 2025 June 23.

Trans Abstract

In this study, we conducted a big data analysis on data that included keywords such as ‘beauty’ and ‘cosmetics’ in the titles or body texts of Naver News, Korea’s largest Internet search engine. Big data analysis was performed using the TEXTOM program developed by The IMC. After refining, 283,727 cases were utilized to visualize TF․TF-IDF cross-analysis of word frequency, keyword ranking analysis, and CONCOR analysis to identify the flow and trends of popular research by era. The results of the analysis are as follows. The results of the TF·TF-IDF cross-analysis show that keywords related to gender, such as ‘male’ and ‘female’, as well as keywords related to ‘cosmetics’ and ‘treatment’, always received high interest and were mentioned frequently in all periods. The keyword ranking analysis results showed that the core keywords that appear in all periods are ‘beauty salon’, ‘women’, ‘cosmetics’, ‘skin care’, ‘hair’, ‘education’, and ‘hairdresser’, and that there are keywords that have a high number of mentions only during certain periods, showing that the trends and fads of the beauty industry change sensitively with the times. The CONCOR analysis using centrality analysis revealed that clusters of ‘beauty education’ and ‘beauty treatment’ were commonly formed in all periods, indicating a group of consistent keywords that do not change with trends or trends, while clusters of ‘beauty hygiene’, ‘external healing’, and ‘Korean beauty design’ appeared only in certain periods. These results have shown that the perception of the times in the beauty industry has changed positively, and we have been able to see the future direction and trends.

I. 서 론

1. 연구의 필요성 및 목적

빅데이터라는 용어는 데이터의 활용이 경제적 가치로 발전하면서 주목을 받았고, 2012년 세계경제포럼인 다보스 포럼에서 ‘국제 개발의 새로운 가능성을 여는 2012년의 가장 중요한 기술’로 선정되었을 정도로 그 중요성을 인정받았다(Lim, 2014). 이렇게 가장 중요한 핵심 기술인 빅데이터는 일반적인 데이터베이스 소프트웨어가 수행할 수 있는 데이터 수집 방식이나 저장, 관리 및 분석의 정도를 뛰어넘는 대량의 데이터를 의미하며, 기존의 데이터를 해석하여 발전시키고 더욱 견고하게 만드는 잠재력을 갖추었다고 인식되고 있다(Manyika et al., 2011; White & Breckenridge, 2014).

전 세계적으로 서비스업의 고도화와 융합화가 이루어지면서 서비스 경제화가 활발히 진행 중이며, 세계 경제 및 산업 환경 변화에 따라 4차 산업혁명을 통해 급변하는 생산, 소비 트렌드에 맞춰 서비스 산업의 경쟁력 강화를 위해 국가와 산업 시스템의 대대적인 전환을 도모해야 한다(Jeun, 2017; Yook, 2018).

따라서 미용·뷰티 분야는 서비스 산업의 한 분야로서 사회적 흐름과 유행에 민감하고, 헤어, 메이크업, 피부, 네일 등 다양한 분야와 접목되어 우리 생활에 밀접하게 연결되며, 인간의 감성을 다루는 분야이기도 하고, 전문성을 중시하는 기술 분야로 시대적 사회현상 변화의 동향을 분석할 필요가 있다(Hwang, 2021). 또한 2000년대 이후 미용·뷰티학과의 설립과 종사자의 증가로 미용 교육이 중요한 요소로 부각되어 인적 자원의 개발과 전문인 양성에 중점을 두고 있다(Na, 2022). 또한 미용·뷰티 산업에 대형 프랜차이즈가 등장하면서 고급화, 대형화, 보편화되고 있는 추세이며, 소비자 만족을 위한 미용 서비스의 시대적 인식이 높아지고 있다(Kim, 2015).

기존의 빅데이터 분석을 활용한 미용·뷰티 연구 동향에 관련된 선행연구들을 살펴보면, Lee & Choi(2024)은 최근 10년간 메이크업 트렌드에 관하여 인터넷 검색엔진에서 메이크업 키워드와 고객 니즈가 어떻게 변화하였는지 연구하였고, Lee & Park(2024)은 각 년도별 논문을 빅데이터로 추출하여 헤어 스타일 연구 동향을 파악해 헤어스타일 논문 분석의 기본 자료 제공에 관한 연구하였고, Hwang(2021)은 미용, 뷰티 관련 학위논문의 연구 동향을 빅데이터를 활용하여 연구하였다. 한편 미용, 뷰티 관련 인터넷 뉴스 키워드의 동향을 분석하여 미용 산업에서 시대별 트렌드에 맞는 경쟁력 있는 분야를 분석하여 미용·뷰티에 관한 사회적 인식의 변화와 미디어적으로 이슈나 유행을 분석할 수 있는 연구에 대해서는 미비한 실정이다.

따라서 본 연구에서는 빅데이터 분석을 활용하여 AI가 활성화되기 이전의 시대적 흐름을 용이하게 파악하기 위해 뉴스 웹크롤링을 이용해 미용·뷰티 키워드가 들어간 1994년부터 2023년까지의 네이버 뉴스를 데이터로 도출해 시대별 동향을 알아보고자 한다. 이를 통해 미용·뷰티 관련 산업에서 시대별 트렌드를 분석하여 각 분야에 경쟁력 있는 키워드를 통해 우리 사회 안에서 인식의 변화와 미디어에서 유행이나 이슈를 파악하여 앞으로 미용·뷰티 산업이 나아갈 방향을 제시하고자 한다.

II. 이론적 배경

1. 빅데이터 분석

1) 빅데이터의 개념 및 특징

최근까지 빅데이터의 개념은 학자들마다 다양하게 정의되고 있는데, 맥킨지 보고서(Mckinsey Report, 2011)에 따르면 ‘일반적인 데이터베이스 프로그램이 수집·저장·관리·분석하기 어려운 대규모 데이터’로 간단히 정의하는가 하면, 가트너 보고서(Gartner Report, 2012)에서는 ‘더 나은 의사결정, 시사점 발견 및 프로세서의 최적화를 위해 새로운 형태의 정보 처리가 필요한 대용량, 초고속 및 다양성의 특징을 가진 정보 자산’이라 하였고, 국제데이터협회(IDC)에서는 ‘초고속 수집·발굴·분석을 통해 대규모 데이터로부터 저비용으로 가치를 추출할 수 있도록 고안된 새로운 세대의 기술이자 아키텍처’라 정의하며 빅데이터의 가치 창출 측면까지 부각하고 있다(Vesset et al., 2012).

Gartner(2011)는 기존 데이터 처리와 빅데이터 처리에 대한 차이점과 기술적 특징에 대해 크게 상대적 의사결정, 처리 복잡성, 방대한 처리 데이터양, 높은 비정형 데이터 구조, 처리·분석의 유연성, 동시 처리량이라고 설명하고 이에 새로운 접근방법이 요구되고 있다.

2) 빅데이터 분석 방법

(1) 텍스트 마이닝

마이닝 기법 중 본 연구에서 사용한 텍스트 마이닝은 비구조화된 텍스트 기반 데이터로부터 자연어처리(NLP) 기법을 토대로 유익한 지식을 발견하고 추출하는 것이라 정의하고 있다(Yoon, 2021). 텍스트에 나타난 주요 개념을 추출하는 것은 물론, 다른 개념들과의 관계를 파악하고 이를 시각화하는 데 유용하다는 점에서 큰 장점이 있으며, 전통적인 내용 분석의 한계를 극복하게 해준다(Jung, 2016).

텍스트 마이닝의 일반적인 과정은 데이터 수집 단계에서 연구자가 찾으려 하는 정보 유형을 정형/비정형 데이터를 명확히 파악한 후, 수집하려는 텍스트의 범위를 한정하고 수집한 후 데이터 베이스에 저장하고(Kim, 2017), 구조화되지 않은 비정형 텍스트 데이터를 정형화된 형태로 변환하는 과정으로 형태소 분석을 통해 연구에 적합한 형태로 변환하여 분석에 이용한 후(Feldman & Sanger, 2007), 정보 추출, 문서 요약, 군집화 등의 기술로 데이터를 분석하고, 분석 데이터를 시각화하여 다양하게 활용할 수 있게 인사이트로 도출하여 축적되는 과정이다(An, 2017).

(2) 텍스트 네트워크 분석

텍스트 네트워크 분석은 텍스트에서 단어를 추출하고 단어들 간의 연관 관계를 토대로 연결망 안에서 의미를 분석하는 방법으로서, 네트워크 알고리즘 내용 분석방법으로 의미연결망을 정의할 수 있다(Lee, 2014) .

본 연구에서는 텍스트 네트워크 분석방법 중 중심성 분석과 구조적 등위성 분석방법인 CONCOR분석을 사용하였는데, 먼저 중심성 분석은 전체 네트워크에서 개체가 중심에 얼마나 가까이 자리 잡고 있는지를 나타내는 지표로 많은 다른 노드(Node)들과 연결되어있는 특정한 노드일수록 네트워크의 가운데 쪽으로 위치하게 된다(Lim, 2015).

다음으로 구조적 등위성 분석이란 유사한 지위를 점하고 있는 행위자들을 그룹화하고, 그 그룹들 간의 관계를 묘사하는 것으로 CONCOR 분석은 두 행위자 간의 관계 패턴의 상관관계를 사용하는 방법으로 얼마만큼 유사한지 관심이 있는 경우에 사용하고, 동일한 관계 패턴을 가지는 단어 간의 상관관계를 바탕으로 규모가 큰 네트워크를 단순한 형태로 축소하여 쉽게 파악하는 것에 목적이 있다(An, 2017).

2. 웹 크롤링

크롤링(Crawling)은 웹(Web)상에 존재하는 콘텐츠를 수집하는 데이터 수집 작업으로 인터넷상의 데이터를 가져와서 파싱하고 필요한 데이터만 추출하는 기법이며, 이런 작업을 위한 프로그램을 크롤러(Crawler)라고 부르며 웹 페이지를 대량으로 처리한다(Olston et al., 2010).

웹 크롤링을 위해서는 웹 크롤러를 만들 필요가 있고, 웹 크롤러는 웹 검색엔진의 주요 구성요소인 웹 페이지 모음에 대해 색인을 생성하고 검색 요소와 일치하는 웹 페이지를 찾는 역할을 하며, 웹 페이지에 대한 정보와 검색하려는 검색어, 정보를 세거나 분류하는 등의 처리를 할 수 있는 각종 모듈이 요구된다(Kim, 2020).

웹 크롤링 분석기술은 총 3단계로 진행되는데, 1단계로 웹 크롤러가 원하는 정보를 담고 있는 인터넷 웹사이트 Hypertext Makeup Language (HTML) 페이지를 선별한 후, 2단계로 각 HTML, Cascading Style Sheet(CSS) 등에서 필요한 데이터를 추출하는 기술인 Web Scarping Technology를 통해 파싱(Parsing)한 뒤, 3단계로 그 중 필요한 데이터를 추출하여 자동으로 저장한다(Kim, 2021).

III. 내용 및 방법

1. 분석 대상 및 자료 수집

본 연구에서는 빅데이터 분석을 활용하여 시대적 흐름을 용이하게 파악하기 위해 뉴스 웹크롤링을 이용해 ‘미용’·‘뷰티’ 키워드가 제목이나 본문 내용에 언급된 데이터를 분석 대상으로 수집하였다. 데이터 수집 범위는 인터넷 뉴스의 양이 워낙 방대하기 때문에 국내 대표 인터넷 검색엔진인 네이버(Naver) 뉴스를 대상으로 한정하였다.

자료 분석 범위는 1994년부터 2023년으로 설정하였다. 그 배경은 미용·뷰티의 연구가 심층적으로 이루어져 국내 학술지 논문이 발표된 시점인 1994년을 기준으로 설정해 신뢰성 있는 데이터를 수집하였고, AI가 본격적으로 모든 분야에 활성화되기 이전인 2023년까지를 설정하여 데이터를 수집하였다.

아울러 소셜네트워크분석 회사인 ㈜더아이엠씨에 뉴스 데이터 수집을 요청하였고, ㈜더아이엠씨의 텍스톰(TEXTOM) 프로그램을 통해 정제 후 활용된 데이터 건수는 총 283,727건을 수집하였다. 이를 기준점부터 세기별로 나누어 10년 단위로 변화되는 시대적 흐름을 분석할 수 있도록 1시기 1994~2000년, 2시기 2001~2010년, 3시기 2011~2023년으로 시기를 구분하여 설정하였다.

2. 연구 절차

본 연구에서 알아보고자 하는 미용·뷰티 뉴스 데이터의 연구 동향 분석을 위해 빅데이터 분석의 텍스트 마이닝과 네트워크 중심성 분석을 활용하여 도출하는 것으로 자료준비 단계인 첫 번째 데이터 수집은 뉴스 제목과 본문에 ‘미용·뷰티’ 키워드가 들어간 경우를 따로 수집하여 수집된 데이터의 주요 단어 추출을 위해 Mecab 모듈을 이용해 형태소를 분석하여 추출한 후 중복된 데이터를 필터링을 통해 정제하였다.

이처럼 데이터 정제 및 필터링 후 텍스트 마이닝 분석 결과 단어빈도(TF), 단어빈도-역문서 빈도(TF-IDF)의 교차분석과 시기별 키워드 순위분석, 텍스트 네트워크 중심성 분석을 이용한 CONCOR 분석을 통해 이를 시각화한 결과로 TF·TF-IDF 교차분석과 키워드 순위 분석은 엑셀(EXCEL)로 CONCOR분석은 UCINET6.0로 시각화하여 분석 결과에서 시기별 뉴스의 동향을 파악함으로써 미용·뷰티 산업이 나아갈 방향을 분석하였다.

IV. 결과 및 고찰

1. 단어빈도-역문서 빈도(TF-IDF)의 교차분석

텍스트마이닝 분석 시 TF와 TF-IDF 수치를 많이 보게 되는데, 하나의 수치만으로 키워드들을 해석하는 데는 한계가 있고, 신뢰성에 문제가 있기 때문에 TF와 TF-IDF를 동시에 보는 교차분석을 통해 분석하였다.

각 시기별 TF와 TF-IDF 상위 50개 키워드를 선정한 후, TF 상위 20개 키워드와 TF-IDF 상위 20개 키워드를 추출한 뒤 공통으로 해당하는 상위 4개의 키워드를 해당 시기의 핵심 키워드로 정의한 후 키워드를 추출하여 엑셀로 정리하였다.

미용·뷰티 뉴스의 1시기(1994~2000년)의 교차분석 결과는 <Table 1>과 같고, 미용 ·뷰티 뉴스의 2시기(2001~2010년)의 교차분석 결과는 <Table 2>와 같고, 미용 ·뷰티 뉴스의 3시기(2011~2023년)의 교차분석 결과는 <Table 3>과 같다.

TF·TF-IDF Cross-Analysis in the First Period of News

TF·TF-IDF Cross-Analysis in the Second Period of News

TF·TF-IDF Cross-Analysis in the Third Period of News

1시기 미용·뷰티 뉴스에 대한 상위 20개 키워드들에 대한 언급량과 중요도인 TF·TF-IDF 교차분석 결과 언급량이 가장 높은 상위 4개의 키워드는 ‘여성’, ‘화장품’, ‘목욕’, ‘자격증’ 순으로 나타났고, 2시기에는 ‘화장품’, ‘남성’, ‘창업’, ‘한방’ 순으로 나타났고, 3시기에는 ‘시술’, ‘남성’, ‘미용학원’, ‘자격증’ 순으로 나타났고 언급량과 중요도의 키워드 교차분석 결과 각 시기별 유행하는 키워드들의 순위를 알 수 있어 유의미한 상관관계가 나타난 것을 알 수 있다.

2. 키워드 순위 분석

<Table 4>의 키워드 순위 분석은 1시기, 2시기, 3시기 자료를 모두 취합한 후 각 시기별 총 빈도가 상위 50개인 키워드에 대해 순위 변동을 나타내었다. 시기별 미용·뷰티 뉴스의 키워드 순위 변동 분석 결과로 이때 ‘-’ 표기는 해당 시기에 50위 밖으로 나타났음을 의미한다.

Changes in the Ranking of News Keywords

각 시기별 미용·뷰티 뉴스의 상위 10위권 내의 공통 중요 핵심 키워드는 ‘미용실’, ‘여성’, ‘화장품’, ‘피부미용’, ‘헤어’, ‘교육’, ‘미용사’로 나타나 시대가 흘렀음에도 관심도와 언급도가 일정하게 높은 것을 알 수 있다. 이를 통해 앞으로 나아갈 미용·뷰티 산업의 방향성도 공통 중요핵심 키워드를 놓치지 않고 트렌드와 유행이 변화하여도 중요성을 높게 가지고 가야 할 것이다.

반면, 시기별 미용·뷰티 뉴스 키워드 변동 분석결과 최근 들어 점차 순위가 높아진 ‘시술’, ‘헤어’, ‘다이어트’, ‘성형외과’, ‘자격증’, ‘네일’, ‘의료기기’, ‘교정’, ‘보톡스’, ‘주름’, ‘탈모’, ‘헤어스타일’ 키워드는 시대별 유행이나 관심도의 검색 빈도가 높아지는 것을 알 수 있다. 또한 ‘한방’, ‘노화’, ‘천연’, ‘운동’, ‘염색’, ‘마사지’와 같은 키워드는 시대가 흐름에 따라 검색 빈도가 점차 낮아지는 것을 보면 점차 관심도가 하락하는 것을 알 수 있다. 이를 통해 더 집중해야 할 미용·뷰티 산업의 방향성을 인지하고 빠르게 변화해야 하는 미용·뷰티 산업에 맞는 트렌디한 키워드의 진입을 예상하여야 한다.

3. 텍스트 네트워크 분석(CONCOR 분석)

CONCOR(CONvergence of iterated CORrelations)분석은 단어 공출현 매트릭스의 상관관계 분석을 토대로 행렬의 열 사이의 유사도를 측정해 특정 블록들간의 관계를 파악하여 유사성 집단(cluster)을 찾아내는 방법이다. 본 CONCOR 분석에서는 각 시기별 TF 상위 50개 키워드에 대해 분석을 진행하였고, 시기별 미용·뷰티 뉴스의 상위 50위권의 1시기 중심성 분석을 이용한 CONCOR 분석결과를 시각화한 것은 <Fig. 1>과 같다.

Fig. 1.

CONCOR analysis of first Period of News

시기별 미용·뷰티 뉴스의 TF 상위 50위권의 1시기 중심성 분석을 이용한 CONCOR 분석결과 키워드들 간에 상관관계 유사도가 큰 순서로 군집이 형성되어 총 6개의 클러스터가 형성되었다. 이는 ‘여성 뷰티’, ‘미용 위생’, ‘헤어, 패션’, ‘미용 교육’, ‘남성 뷰티’, ‘미용 시술’ 순으로 클러스터가 나타났으며, 여성 뷰티 클러스터에서는 ‘피부미용’, ‘화장품’, ‘메이크업’, ‘디자인’, ‘성인병’, ‘스트레스’ 등의 키워드가 나타났고, 미용 위생 클러스터에서는 ‘목욕’, ‘목욕탕’, ‘헤어’, ‘염색’, ‘위생’, ‘불법’ 등의 키워드가 나타났다. 헤어, 패션 클러스터에서는 ‘미용실’, ‘교육’, ‘미용사’, ‘패션’, ‘취업’ 등의 키워드가 나타났고, 미용 교육 클러스터에서는 ‘여성’, ‘미용학원’, ‘전문학교’ 키워드가 나타났다. 남성 뷰티 클러스터에서는 ‘남성’, ‘헬스’, ‘운동’, ‘쇼핑몰’, ‘컬러’ 등의 키워드가 나타났고, 미용 시술 클러스터에서는 ‘클리닉’, ‘성형외과’, ‘성형수술’, ‘시술’ 키워드가 나타났다.

시기별 미용·뷰티 뉴스의 상위 50위권의 2시기 중심성 분석을 이용한 CONCOR 분석결과를 시각화한 것은 <Fig. 2>와 같다.

Fig. 2.

CONCOR analysis of second Period of News

시기별 미용·뷰티 뉴스의 TF 상위 50위권의 2시기 중심성 분석을 이용한 CONCOR 분석결과 키워드들 간에 상관관계 유사도가 큰 순서로 군집이 형성되어 총 5개의 클러스터가 형성되었다. 이는 ‘미용 시술’, ‘헤어 창업’, ‘외적 뷰티’, ‘미용 교육’, ‘외적 힐링’ 순으로 클러스터가 나타났으며, 미용 시술 클러스터에서는 ‘성형외과’, ‘피부과’, ‘시술’, ‘성형수술’, ‘여드름’ 등의 키워드가 나타났고, 헤어 창업 클러스터에서는 ‘미용실’, ‘디자인’, ‘취업’, ‘운동’, ‘창업’ 등의 키워드가 나타났다. 외적 뷰티 클러스터에서는 ‘남성’, ‘미용사’, ‘연예인’, ‘모발’, ‘화장’, ‘탈모’ 등의 키워드가 나타났고, 미용 교육 클러스터에서는 ‘교육’, ‘피부미용사’, ‘피부미용’, ‘자격증’ 등의 키워드가 나타났고, 외적 힐링 클러스터에서는 ‘스파’, ‘다이어트’, ‘화장품’, ‘노화’, ‘웰빙’ 등의 키워드가 나타났다.

시기별 미용·뷰티 뉴스의 상위 50위권의 3시기 중심성 분석을 이용한 CONCOR 분석결과를 시각화한 것은 <Fig. 3>과 같다.

Fig. 3.

CONCOR analysis of third Period of News

시기별 미용·뷰티 뉴스의 TF 상위 50위권의 3시기 중심성 분석을 이용한 CONCOR 분석결과 키워드들 간에 상관관계 유사도가 큰 순서로 군집이 형성되어 총 6개의 클러스터가 형성되었다. 이는 ‘헤어 미용’, ‘한국 미용’, ‘미용 교육’, ‘남녀 건강’, ‘미용 시술’, ‘미용기기 및 외적 뷰티’ 순으로 클러스터가 나타났다. 헤어 미용 클러스터에서는 ‘미용실’, ‘탈모’, ‘모발’, ‘두피’, ‘헤어’ 등의 키워드가 나타났고, 한국 미용 디자인 클러스터에서는 ‘한류’, ‘디자인’, ‘미용박람회’ 키워드가 나타났다. 미용 교육 클러스터에서는 ‘메이크업’, ‘교육’, ‘미용사’, ‘자격증’, ‘취업’ 등의 키워드가 나타났고, 남녀 건강 클러스터에서는 ‘남성’, ‘여성’, ‘운동’, ‘마사지’, ‘패션’ 등의 키워드가 나타났다. 미용 시술 클러스터에서는 ‘시술’, ‘주름’, ‘피부과’, ‘부작용’, ‘레이저’, ‘교정’ 등의 키워드가 나타났고, 미용기기 및 외적 뷰티 클러스터에서는 ‘피부미용’, ‘화장품’, ‘의료기기’, ‘한방’, ‘다이어트’ 등의 키워드가 나타났다. Choi, Lee & Seo(2022)의 CONCOR 분석결과 K-뷰티산업이 6개의 그룹으로 구분되어 각 그룹별 서로 연결성이 높은 키워드가 도출되어 K-뷰티산업 트렌드의 동향을 예측할 수 있다고 보고하였다. Moon & Lee(2020)의 CONCOR 분석을 통한 시각화 결과 헤어커트 키워드 핵심 단어들의 7개의 의미있는 클러스터가 명명되어 본 연구결과와 유사하게 중심성 지수가 높은 키워드들의 특성을 잘 나타낼 수 있는 단어들의 클러스터를 개념화하였다.

미용·뷰티 뉴스의 중심성 분석을 이용한 CONCOR 분석결과 모든 시기에서 공통으로 형성된 클러스터는 ‘미용 교육’, ‘미용 시술’에 관한 집단으로 ‘미용 교육’ 클러스터에서는 ‘교육’, ‘학생’, ‘자격증’, ‘전문학교’, ‘미용학원’과 같은 키워드가 공통적으로 나타났고, ‘미용 시술’ 클러스터에서는 ‘성형외과’, ‘성형수술’, ‘시술’, ‘레이저’, ‘피부과’, ‘교정’과 같은 키워드가 공통적으로 나타나는 것을 보면 사회적 흐름이나 유행이 쉽게 바뀌는 특징을 가진 미용·뷰티 산업이더라도 빈도수가 항상 높은 키워드에 대해서는 시간이 지나더라도 관심도나 중요도가 높은 것을 알 수 있다.

반면, 시기별로 특정 시기에만 나타나 형성된 클러스터는 1시기에서는 ‘목욕’, ‘목욕탕‘, ‘위생‘ 키워드가 포함된 미용 위생 집단이 있고, 2시기에서는 ‘스파’, ‘다이어트’, ‘웰빙’과 같은 키워드가 포함된 ‘외적 힐링’ 집단이 있으며, 3시기에서는 ‘한류’, ‘디자인’, ‘미용박람회’ 키워드가 포함된 ‘한국 미용 디자인’ 집단이 있다. 이는 각 시기별로 특정하게 나타난 집단으로 시기별로 트렌드나 이슈가 변화하는 것을 알 수 있다.

V. 결 론

본 연구는 미용, 뷰티 관련 인터넷 뉴스 키워드의 동향을 분석하여 미용 산업을 시대별 트렌드에 맞는 경쟁력 있는 분야로 사회적 인식을 긍정적으로 변화시키고 미디어적으로 이슈나 유행을 분석하기 위해 빅데이터 분석을 수행하였다. 국내 인터넷 검색엔진인 네이버(Naver) 뉴스에 ‘미용’, ‘뷰티’ 키워드가 제목이나 본문 내용에 언급된 데이터를 분석 대상으로 ㈜더아이엠씨에서 개발한 빅데이터 분석 솔류선 텍스톰(TEXTOM) 프로그램을 사용하여 정제 후 활용된 데이터 283,727건을 단어빈도(TF), 단어빈도-역문서 빈도(TF-IDF)의 교차분석과 키워드 순위 분석, 텍스트 네트워크 중심성 분석을 이용한 CONCOR 분석을 통해 이를 시각화한 분석을 알아봄으로써 시대별 유행하는 연구의 흐름과 동향을 알아보았다.

첫째, TF·TF-IDF 교차분석 결과 모든 시기에 공통적으로 ‘남성’, ‘여성’과 같은 성별 관련 키워드와 ‘화장품’, ‘시술’과 비슷한 키워드가 높은 언급량으로 검색되었고, 과거에는 여성들이 대부분 미용·뷰티에 관심도가 높았다면, 최근 들어 남성의 미용, 뷰티 관련 언급량이 늘어나는 것을 보면 사회적으로 남성들도 미용·뷰티에 대한 관심이 높아지면서 사회적 인식이 변화된 것을 알 수 있고, 화장품이나 시술과 관련된 언급량이 높은 것을 보면 예뻐지는 것에 항시 관심이 높다는 것을 나타낸다. 또한 ‘자격증’, ‘창업’, ‘미용학원’과 같은 미용 교육 관련 키워드가 매시기 높은 언급량을 나타내는 것을 보면 미용 산업에서 미용 교육에 관심도가 항시 높은 것으로 나타났다.

둘째, 키워드 순위 분석 결과 모든 시기 공통 중요핵심 키워드는 ‘미용실’, ‘여성’, ‘화장품’, ‘피부미용’, ‘헤어’, ‘교육’, ‘미용사’로 시기가 지남에도 변하지 않는 언급량을 보니 미용 산업에서 유행이나 트렌드에 민감하게 반응해야 하더라도 항상 놓치지 않아야 하는 중요한 키워드인 것을 알 수 있다. 반면 최근 들어 점차 순위가 높아진 ‘시술’, ‘헤어’, ‘다이어트’, ‘성형외과’, ‘자격증’, ‘네일’, ‘의료기기’, ‘교정’, ‘보톡스’, ‘주름’, ‘탈모’, ‘헤어스타일’과 같은 키워드는 미디어에 점차 높게 언급되고 있으니 미용 산업에서 더 관심을 가지고 발전시켜야 할 산업이며, ‘한방’, ‘노화’, ‘천연’, ‘운동’, ‘염색’, ‘마사지’와 같은 키워드는 시대가 흐름에 따라 언급 빈도가 점차 낮아지는 것을 보면 트렌드나 유행이 지나고 있는 것으로 알 수 있다.

셋째, 중심성 분석을 이용한 CONCOR 분석 결과, 앞선 분석 결과와 비슷하게 모든 시기에 공통적으로 ‘미용 교육’, ‘미용 시술’ 클러스터가 형성되어 매시기에 빈도수가 높은 키워드들이 같은 클러스터로 형성되어 과거부터 현재까지 꾸준히 언급된 것을 보면 앞으로도 미용 산업에 유행이나 흐름이 바뀌더라도 ‘미용 교육’, ‘미용 시술’ 클러스터 키워드들의 중요성과 관심도는 변함이 없을 것으로 사료된다. 반면 특정 시기에만 언급된 키워드 클러스터를 살펴보면, 1시기에서는 ‘미용 위생’ 클러스터로 미용, 뷰티에 관련해서 집에서 홈케어로 할 수 있는 정도가 흐름으로 볼 수 있었고, 2시기에서는 ‘외적 힐링’ 클러스터로 점차 미용 산업들이 많이 생겨나면서 외적으로 아름다움을 채울 수 있는 키워드들이 유행하였고 많은 사람들이 검색해본 것을 알 수 있다. 3시기에서는 ‘한국 미용 디자인’ 클러스터로 점차 K-뷰티가 전세계적으로 유행이 되면서 국내뿐만이 아니라 외국에서 우리의 미용, 뷰티를 알릴 수 있는 기회가 생겨남으로써 큰 이슈화가 된 것을 알 수 있다. 이렇게 시기별로 민감하고 빠르게 트렌드가 변화하기 때문에 그에 발맞춰 미용, 뷰티 산업도 함께 맞춰 나아가야 한다.

반면, 연구 자료를 많은 검색 엔진들 중 미용, 뷰티 키워드가 본문이나 제목에 들어간 네이버 뉴스를 데이터로 한정지어 수집 및 분석을 수행하였는데, 네이버라는 미디어의 성향이 편향될 가능성이 있고, 기사 작성자의 주관적인 분석이 개입될 가능성이 있는 한계점이 있다. 이에 데이터 출처를 더 다양화하여 네이버 뉴스 외 구글 뉴스, 다음 뉴스, 유투브 등의 다양한 엔진들에 대한 분석이 이루어진다면 더욱 풍부하고 신뢰성 있는 분석결과가 이루어 질 것이라 사료된다. 또한 데이터 수집 시기를 1994~2023년으로 기간을 한정해 놓고 데이터를 수집하였기 때문에 전반적인 미용 산업에 대한 정확한 예측을 하는 것에는 다소 무리가 있어 추후 다양한 검색 엔진이나 보다 많은 정형, 비정형 데이터 분석 연구를 통해서 범위를 확장하여 후속 연구로 발전되기를 기대한다.

References

1. An, H. S. (2017). A Study on the Sentiment Analysis in Fashion Design using Big Data : Focused on Text Mining and Semantic Network Analysis. Master’s thesis, Ewha Womans University, 53-54.
2. Choi E., Lee M. J., Seo S. Y.. 2022;Prediction of K-Beauty Industry Trend Using Big Data. Journal of the Korean Society of Cosmetology 28(6):1373–1382.
3. Feldman R., Sanger J.. 2007. The text mining handbook: Advanced approaches in analyzing unstructured data Cambridge university press. p. 21–29.
4. Gartner. 2011. Big Data Analytics Gartner Group. p. 3–6.
5. Hwang, Y. J. (2021). A study on research trends in beauty theses using big data analysis. Master’s thesis, Daegu Catholic University, 1-2.
6. Jeun, H. O. (2017). A study on determinants of innovation performance in service industry. Doctoral dissertation, Daejeon University, 1-2.
7. Jung, Y. K. (2016). An Exploratory Study of Consumer Counseling Data Using Text Mining-Focusing on Cancer Insurance. Master’s thesis, Sookmyung Women’s University, 13-19.
8. Kim, D. H. (2020). The changing role of pharmacists in Korea through systematic review and web crawling. Master’s thesis, Kyungpook University, 7.
9. Kim, D. K. (2017). Analysis of Hotel Selection Attributes in Online Reviews using Text Mining. Master’s thesis, Busan University, 20-22.
10. Kim J. S., Youn C. S.. 2014;Bibliometric Analysis on the Research Trends according to the List of Journal of the Korean Society of Beauty and Arts. Journal of the Korean Society of Beauty and Art 17(3):175–188.
11. Kim S. H., Choi E.. 2015;The Study on the Role and Needs of the Beauty Managers as a Result of Perception Changes in the Beauty Industry. Journal of the Korean Society of Cosmetology 21(4):710–720.
12. Kim, S. U. (2021). Deep learning-based web implementation and data visualization using architectural data. Master’s thesis, Hanyang University, 16.
13. Lee G. E., Park E. J.. 2024;Research Trends Related on Hair Style in the Text Mining of Big Data Analysis. Journal of the Korean Society of Cosmetology 30(3):492–498.
14. Lee M. J., Choi E.. 2024;A study on the Make-up Trends using Unstructured Big Data: Focusing on Make-up Keyword Changes in the Last 10 Years. Journal of the Korean Society of Cosmetology 30(1):86–96.
15. Lee S. S.. 2014;A Content Analysis of Journal Articles Using the Language Network Analysis Methods. Journal of the Korean Society for Information Management 31(4):49–68.
16. Lim C. S.. 2014;Technology Trends on Big Data Analysis Tools. The Journal of Korean Institute of Next Generation Computing 10(5):77–78.
17. Lim D. H.. 2015. Big Data Analysis with R Paju: Free Academy. p. 52–55.
18. Manyika J., Chui M., Brown B., Bughin J., Dobbs R., Roxburgh C., Byers A. H.. 2011. Big data : The next frontier for innovation, competition. and productivity McKinsey Global Institute. p. 3–4.
19. Moon S. H., Lee J. S.. 2020;Paradigm Changes in Hair Cut Industry Using Big Data. Journal of the Korean Society of Cosmetology 26(6):1426–1438.
20. Na, J. H. (2022). Analysis of Research Trends in Beauty Theses Journal and News Using Big Data Analysis. Doctoral dissertation, The Graduate School Seokyeong University, 1-5.
21. Olston C., Marc N.. 2010. Web crawling Now Publishers Inc. p. 6.
22. Vesset, D., Woo, B., Morris, H. D., Villars, R. L., Little, G., Bozman, J. S., & Yezhkova, N. (2012). Worldwide big data technology and services 2012-2015 forecast, IDC Report, 233485, 3.
23. White P., Breckenridge R. S.. 2014;Trade Offs, Limitations, and Promises of Big Data in Social Science Research. Review of Policy Research 31(4):331–338.
24. Yuk, H. J. (2018). A study on the analysis and prediction of K-beauty service industry in the era of the fourth industrial revolution. Master’s thesis, Konyang University, 1-2.
25. Yun, H. M. (2021). A Study on Sentiment Analysis of Restaurant Customers Using Text-Mining methods: Focused on the Big Data of On-line Reviews of Tourists. Doctoral dissertation, Kyung Hee University, 35-36.

Article information Continued

Fig. 1.

CONCOR analysis of first Period of News

Fig. 2.

CONCOR analysis of second Period of News

Fig. 3.

CONCOR analysis of third Period of News

Table 1.

TF·TF-IDF Cross-Analysis in the First Period of News

Keyword TF TF-IDF
1 Woman 482 0.040
2 Cosmetic 206 0.047
3 Bath 74 0.042
4 Certificate 44 0.039

Table 2.

TF·TF-IDF Cross-Analysis in the Second Period of News

Keyword TF TF-IDF
1 Cosmetic 3,837 0.042
2 Man 3,128 0.048
3 Startups 2,126 0.042
4 Oriental Medicine 1,516 0.042

Table 3.

TF·TF-IDF Cross-Analysis in the Third Period of News

Keyword TF TF-IDF
1 Surgical Procedure 19,780 0.042
2 Man 13,559 0.048
3 Beauty Academy 6,976 0.056
4 Certificate 6,896 0.042

Table 4.

Changes in the Ranking of News Keywords

Keyword Frequency 1 Period 2 Period 3 Period
1 Hair Salon 94,492 1 1 1
2 Skincare 57,421 3 2 2
3 Woman 33,732 2 3 3
4 Cosmetics 25,530 5 4 4
5 Surgical Procedure 21,853 50 8 5
6 Hair 20,130 14 10 6
7 Education 18,914 6 7 7
8 Hairdresser 16,713 4 6 8
9 Man 16,538 8 5 9
10 Diet 11,244 12 11 10
11 Fashion 10,574 7 13 11
12 Plastic Surgery 10,192 16 12 12
13 Makeup 9,154 13 19 13
14 Certificate 8,206 19 15 15
15 Nail 8,168 - 41 14
16 Startups 7,197 33 9 24
17 Beauty Academy 7,181 28 - 16
18 Medical Devices 6,961 - - 17
19 Dermatology 6,445 - 18 21
20 Employment 6,334 11 21 20
21 Tooth Braces 6,321 - 22 19
22 Botox 6,288 - 31 18
23 Design 6,038 15 25 22
24 Oriental Medicine 5,825 26 14 30
25 Wrinkle 5,757 - 26 25
26 Hair Loss 5,752 - 39 23
27 Aging 5,752 - 23 26
28 Plastic Surgery 5,424 27 17 31
29 Laser 5,254 24 30 28
30 Hair Style 5,225 - 36 27
31 Injection 4,829 - - 29
32 Side Effects 4,741 - 44 32
33 Exercise 4,565 18 37 34
34 Dyeing 4,274 30 - 33
35 Natural 4,272 - 29 39
36 Model 4,181 - 40 38
37 Shampoo 4,171 - - 35
38 Hair 4,068 - 50 37
39 Lens 4,063 - 42 44
40 Beauty Fair 3,982 - - 36
41 Scar 3,968 - 43 46
42 Vitamin C 3,985 48 48 43
43 Massage 3,948 25 24 50
44 Color 3,966 44 - 40
45 Dentist 3,918 35 34 48
46 Chest 3,892 - - 45
47 Scalp 3,838 - - 41
48 Clinic 3,813 22 20 -
49 Korean Wave 3,772 - - 42
50 Collagen 3,708 - 47 49