비정형 빅데이터를 활용한 디지털 헬스케어에 대한 소비자 인식 연구: 코로나19 기간과 코로나19 이후 키워드 변화를 중심으로
A Study on the Consumer Perception of Digital Healthcare using Unstructured Big Data: Focusing on Keyword Changes During and After COVID-19
Article information
Trans Abstract
This study collected various keywords by using TextStorm, a solution program that can effectively perform big data analysis using unstructured data to confirm consumer perception of digital healthcare during and after COVID-19, by utilizing cafes and blogs, news media within portal sites such as Naver, Daum, and Google. Based on these analysis results, the academic implications proposed are as follows. First, it is the application of medical innovation and artificial intelligence in the medical field. Second, it is the i ssue o f data security, social issues, and ethics. On the other hand, the practical implications for deepening social science research related to digital healthcare are as follows. First, education for medical institutions and experts should be strengthened and accessibility should be improved. Second, attention should be paid to ethical use and cost-effectiveness improvement of artificial intelligence technology. Based on these implications, we aim to contribute to the development of the digital healthcare field.
I. 서 론
코로나19 팬데믹은 전 세계적으로 의료 시스템에 큰 변화를 안겨주었다. 코로나19 팬데믹은 많은 사람의 건강과 삶 그리고 특히 경제활동에 심각한 악영향을 미쳤으며, 어린이, 노인 및 취약한 인구군에 대한 돌봄 부담으로 특히 여성들은 추가적인 스트레스와 정신건강 수준의 악화(Park, 2022)를 경험하고 있는 것으로 나타났다(Ju et al., 2023). 한편, 의료 인력의 부족, 병상의 한계, 감염 위험 등으로 인해 비대면 의료 서비스의 수요가 급증해짐에 따라 디지털 헬스케어 산업은 빠르게 성장하고 있으며, 다양한 형태의 디지털 헬스케어 제품과 서비스가 출시되고 있다. 디지털 헬스케어는 의료 영역에 정보통신기술(ICT)을 융합해 개인 건강과 질병에 맞춰 필요한 의료 서비스나 건강관리 서비스를 제공하는 산업 또는 기술을 말한다. 디지털 헬스케어는 원격의료, 모바일 헬스, 보건의료 분석학, 디지털화 된 보건의료 시스템 등의 서비스 유형으로 구분할 수 있으며, 바이오 빅데이터 플랫폼, 생체데이터 수집 시스템 및 어플리케이션, 스마트 건강관리 서비스, AI 기반 혁신의료 시스템 등의 기술(Kim et al., 2021)로 구성된다(Kim & Han, 2020; Wikipedia, 2023; Park et al., 2022).
한국보건산업진흥원(2020)의 디지털 헬스산업 전망에 의하면 전 세계 디지털 헬스산업은 2020년 1520억 달러로 전 세계 반도체 시장의 35%에 달한다. 국내의 디지털 헬스산업은 높은 스마트기기의 사용률과 5G통신망 보급으로 인해 매우 빠른 속도로 성장하고 있다. 특히 디지털 헬스케어가 제일 많이 필요한 국내 60대 이상 스마트폰 사용률은 83%로 매우 높다(Seo et al., 2022). 때문에 코로나19로 인해 디지털을 활용한 원격 의료 서비스는 큰 효과를 보였다(Campion, 2016). 디지털 헬스케어 산업의 중요성에도 불구하고 국내에서는 아직 윤리 이슈나 정부의 규제에 대한 문제점이 있다. 원격 진료는 전문적이고 윤리적인 규범과 표준을 지킬 필요가 있다(Kapoor, 2020). 또한, 규제 문제에 있어서 소비자의 의료 데이터는 매우 민감한 문제이기 때문에 의료 기관의 데이터 관리가 중요시될 수밖에 없다. 디지털 헬스케어는 의료 서비스의 효율성과 접근성을 높이고, 개인화된 맞춤형 서비스를 제공함으로써 환자의 건강과 삶의 질을 개선할 수 있는 장점이 있다. 하지만 디지털 헬스케어에 대한 소비자의 인식과 수용도는 다양한 요인에 영향을 받으며, 시간과 상황에 따라 변화할 수 있다. 따라서 디지털 헬스케어 산업의 성장과 발전을 위해서는 국내 소비자의 인식과 행동을 정확하게 파악하고, 그에 맞는 전략을 수립해야 한다.
비정형 빅데이터 분석을 통해 코로나19와 그 이후의 변화를 분석한 논문들(Jang & Lee, 2023; Noh & Kim, 2022) 코로나19 환경에서의 우리 사회의 다양한 변화를 다룬 분석(Lee, 2021; Chung, 2023; Jang, 2023; Lee, 2022; Noh et al., 2022; Kim & Kwon, 2021; Yoo, 2021), 뇌파분석(Choi & Lee, 2023)과 같은 새로운 분석이 시도되고 있다. 본 연구는 비정형 빅데이터를 활용하여 코로나19 기간과 코로나19 이후에 디지털 헬스케어에 대한 소비자 인식의 변화를 분석하고자 한다. 이를 통해 코로나19 팬데믹 이후의 변화된 의료 환경과 소비자 행동에 대응하고, 디지털 헬스케어 산업의 장기적인 성장 가능성과 방향성을 제시하는 데 도움이 될 것이라고 사료된다.
II. 이론적 배경
1. 디지털 헬스케어
유비쿼터스시대에 의료분야는 최근 들어 건강에 대한 관심 증대와 노인 인구 급증 등 여러 가지 이유로 새로운 환경으로 발전하였다. 기존의 대면으로 하는 헬스케어에서 비대면으로 하는 디지털 헬스케어 분야가 급속도로 발전하고 있다. 디지털 헬스케어는 2000년대 WHO에서 ICT를 사용하는 eHealth라는 용어를 기반으로 인공지능, 빅데이터, 유전체학 등 첨단컴퓨터 과학 분야를 통틀어서 말하는 용어이다. 국내의 경우 보건복지위에서 보건의료데이터와 지능정보기술을 활용하여 질병을 예방하고 진단, 치료, 건강관리, 연구개발, 및 사후관리 등 국민의 건강증진에 영향을 주는 활동으로 정의되고 있다.
디지털 헬스케어는 최근 들어 국내에서 문제 시 되는 비만, 노인 인구 증가 등 건강문제를 해결 하는데 유용하게 활용된다. 비만에 관련 하여 비대면으로 하는 디지털 헬스케어는 전통적인 대면으로 하는 비만관리 프로그램보다 더 큰 효과가 있다(Sullivan et al., 2013). 또한 디지털 헬스케어는 익명성, 24시간 접근성 등 장점으로 대면 헬스케어보다 체중감소가 더 크다(Beleigoli et al., 2019). 디지털기술인 VR(Virual Realuty)은 노인들이 게임을 하는 방식으로 신체활동을 충족시켜서 노인의 신체기능에 도움이 된다(Kang, 2022). 또한 VR은 노인들의 우울과 삶의 질을 개선하는데 긍정적인 영향을 미친다(Kim & Park, 2018). 전체적으로 디지털헬스케어는 각 방면에서 헬스케어가 필요한 소비자에게 치료나 건강증진효과를 가져다 준다.
2. 빅데이터 분석을 활용한 디지털 헬스케어 연구 동향
디지털 헬스케어산업은 최근 들어 급속도로 발전함에 따라 소비자의 동향을 분석하여 디지털 헬스케어의 발전방향에 대해 연구할 필요가 있다. 이제 디지털 헬스케어 분야는 규모를 확대하는 것에서 가치 창출로 전략을 바꿀 필요가 있다. 국민들의 건강에 대한 관심이 급증하면서 국내 디지털 헬스케어에 대한 빅데이터를 실시한 선행연구도 활발하게 진행되고 있다. Park et al.(2022)은 빅데이터 분석을 통해 헬스케어 산업의 발전방향을 제시하면서 헬스케어 산업이 디지털화가 되고 있어 디지털 헬스케어에 대한 미래를 밝게 보았다. Kim & Hong(2022)은 강원도지역의 디지털 헬스케어 산업을 빅데이터 분석하여 정부규제나 정부지원시설이 필요하다고 지적하였다. 이외에도 Agrawal(2020), Moon(2022), Kim & Kim(2022) 등 많은 연구에서도 헬스케어 산업에 대한 빅데이터 분석을 통해 발전 방향성에 대한 시사점을 도출하였다. 따라서 본 연구는 코로나가 시작된 2020년부터 현재까지의 SNS데이터들을 통해 헬스케어 산업의 소비자 인식에 대해 알아보고자 한다.
III. 내용 및 방법
1. 연구과제
본 연구는 코로나가 본격 확산된 2020년부터 2023년까지 국내 디지털 헬스케어에 대한 소비자 인식 및 트렌드를 를 확인하기 위해 구글, 네이버 및 다음과 포털사이트 활용이 대중화되고 있는 상황에서 카페 및 블로그, 뉴스매체를 활용하여 비정형 빅데이터 분석을 수행하였다. 뉴스, 블로그 및 카페 데이터를 활용한 빅데이터 분석을 수행하였다. 이를 통해 향후 전 세계적으로 주목을 박고 있지만 상대적으로 국내에서는 성 이 더딘 디지털 헬스케어에 대한 인식을 확인함으로써 개개인을 위한 맞춤형 솔루션 제공 및 의료 데이터 수집을 통한 건강 관리 최적화를 수행하고자 다음의 연구과제를 수립하였다.
연구과제 1: 디지털 헬스케어와 관련하여 코로나19 기간과 이후의 키워드의 빈도 및 네트워크의 변화를 확인하고자 한다.
연구과제 2: 시멘틱 네트워크 분석분석을 통해 키워드 간 연결중심성 및 위세중심성 지수를 확인하고 순위를 비교하고자 한다. 또한 QAP 상관분석을 수행하고자 한다.
연구과제 3: 포털 사이트 상의 디지털 헬스케어에 대한 소비자 인식을 확인할 수 있는 키워드 간 관계성을 확인하고자 동시출현 키워드분석을 수행하고 이를 통해 유의미한 시사점을 제안하고자 한다.
2. 데이터 수집
본 연구의 데이터 수집 기간은 2020년 1월부터 2023년 6월까지, 18개월씩 총 36개월로 설정하였고, 키워드 변화의 추이를 파악하기 위해 코로나19 기간과, 코로나 앤데믹이 본격 시작된 2022년으로 구분하여 연구를 진행하였다. 그리고 디지털 헬스케어를 확인하기 위한 공간적 범위는 포털 사이트인 구글, 네이버 및 다음의 블로그 및 카페, 뉴스로 설정하였다. 디지털 헬스케어의 카페 혹은 블로그의 접근성이 용이하기 때문에 기존의 뉴스에 카페 및 블로그를 공간적 범위로 설정하는 것은 의미가 있다고 할 수 있다.
한편, 디지털 헬스케어의 유의미 한 단어를 도출하기 위한 핵심 키워드로 ‘디지털 +헬스케어’를 설정하였고, 빅데이터 분석 솔루션 시스템인 텍스톰을 활용하여 데이터 수집 및 동시출현 키워드를 파악하였다. 텍스톰은 포털 사이트 및 뉴스로부터 다양한 키워드 수집 및 분석을 수행하는 텍스트마이닝 기법을 활용함으로써 빈도 및 중심성 분석수행에 매우 효과적인 솔루션 시스템이라 할 수 있다(Park & Ldydesdorff, 2004).
3. 분석방법
코로나19 기간과 코로나19 이후의 디지털 헬스케어에 대한 소비자 인식을 확인하기 위해 다음과 같이 비정형 데이터를 활용한 빅데이터 분석을 수행하고자 한다. 먼저, 네이버 트렌드를 활용하여 최근 4년 간 디지털 헬스케어에 대한 트렌드 및 주요 키워드 등을 확인하였다. 그리고 비정형 데이터 수집을 위해 텍스톰(Textom)을 사용하였는데, 키워드 수집을 위해 ‘디지털 +헬스케어’를 설정하였고, 수집채널은 주요 포털사이트인 네이버, 구글 및 다음의 카페 및 블로그, 뉴스로 한정하였다. 둘째, 디지털 헬스케어의 키워드 변화를 확인하기 위해 정제 및 형태소 분석 수행과정을 거쳤고, 유사 키워드 간 중복 방지를 최소화하기 위해 URL 기반 제거를 실시하였다. 또한 한국어 키워드 산출을 위한 형태소 모듈로 MeCab을 생성하여 일관성 있는 결과를 도출하고자 하였다. 셋째, 키워드의 매트릭스 및 빈도 파일을 UciNet 3.2에 넣어 시멘틱 네크워크 분석 및 이에 따른 연결 및 위세중심성 지표결과를 도출하였다(Soo et al., 2014). 중심성 분석의 경우, 일반적으로 연결, 근접 및 매개 중심성 분석을 수행하지만, 본 연구는 키워드 간 방향성을 제시하지 않고 있기 때문에 위세중심성 지표에 주안을 주고 연구를 수행하였다(Kwon et al., 2018). 연결중심성은 노드 간 연결 횟수를 뜻하는 것으로, 횟수가 많을수록 타노드 간 영향력이 증가된다(Bogartti & Halgin, 2011). 위세중심성은 노드 간의 연결성에 가중치를 투입하여 결과를 도출한다(Jeong & Kim, 2013). 또한 코로나19 긴간과 이후의 연결성 확인을 위해 QAP 상관 분석을 수행하였다. 마지막으로, 디지털 헬스케어의 키워드 간 관계성을 파악하고자 동시출현 네트워크 분석을 수행하였다.
IV. 결과 및 고찰
1. 텍스트마이닝 빈도분석 결과
디지털 헬스케어에 대한 키워드 수집을 위한 텍스트마이닝 수행결과, 상위 키워드 40개를 코로나19 기간과 이후의 각 시기별로 다음 <Table 1>과 같이 나타냈다. 코로나19 기간은 헬스케어, 디지털전환, 의료기기, 서비스개발, 기업육성, 헬스케어기술, 인공지능, 헬스케어산업, 파트너, 협약체결 순, 코로나 19 이후는 헬스케어, 디지털, 의료서비스, 바이오기업, 서비스 혁신, 의료산업, 디지털기술, 건강증진, 바이오헬스, 제품개발 등의 순으로 제시되고 있다.
2. 디지털 헬스케어 의미연결망 간 구조적 특징 비교
다음 <Table 2>는 코로나19 기간과 이후의 시멘틱 네트워크의 구조적 특징을 보여주고 있다. 먼저, 키워드를 의미하는 각 시기별 의미 연결망은 40개의 노드로 구성되었고, 연결관계를 제시하는 링크 수는 코로나19 기간 1,562개, 코로나19 이후 1,516개로 확인되었다. 또한 연결관계의 정도를 확인할 수 있는 밀도지수는 코로나19 기간 .995, 코로나19 이후 .972로 제시되었다. 즉, 각 시기별로 다양한 키워드들이 유기적인 연결관계를 지니고 있음을 확인할 수 있다.
3. 중심성 분석
네트워크 내 핵심 단어 간 연결관계를 확인함으로써 영향력이 높은 단어들을 제시하고, 단어 간 순위에 있어 코로나19 기간과 이후에 차이가 있는지를 확인하기 위해 상위 20개 키워드의 연결중심성 및 위세중심성 수치에 대한 결과를 다음 <Table 3>과 같이 같이 제시하였다. 연결중심성은 각 노드 간 연결선 수를 의미하는 것으로, 활동성의 영향력에 주안을 둔다. 위세중심성은 노드 간 연결성의 중요도를 고려하여 가중치를 부여함으로써 지표를 확인하는 것을 말한다. 한다. 연결중심성 및 위세중심성 지표를 분석한 결과, 코로나19 기간은 헬스케어, 디지털전환, 의료기기, 기업육성, 헬스케어기술 및 파트너 순, 코로나19 이후는 헬스케어, 디지털, 의료서비스, 바이오기업, 의료산업 서비스혁신 순으로 제시되었다. 즉, 코로나19 기간에는 디지털 전환에 따른 헬스케어 활성화 방안, 코로나19 이후에는 의료산업과 결합된 디지털 헬스케어를 중요시 하고 있음을 확인할 수 있다.
4. 디지털 헬스케어의 의미연결망 간 QAP 상관분석
코로나19 기간과 이후의 디지털 헬스케어에 대한 네트워크를 확인하고자 QAP 상관분석을 수행하였는데, 이는 각 시기별 키워드들의 의미 패턴을 확인할 수 있다. QAP 상관분석 수행 결과, 다음 <Table 4>와 같이 제시되었다. 먼저, 코로나19 기간 및 이후의 18개월씩 총 2회의 네트워크 상관관계를 확인하고자 0 혹은 1로 구성된 이진자료(Binary Data)인 자카드 상관계수(Jaccard Coefficient)를 적용하였다. 분석결과, .975로 유의수준 1% 이내에서 통계적으로 유의한 것으로 제시되었다. 즉, 디지털 헬스케어에 대한 소비자 인식의 의미 패턴은 유사성이 없는 것으로 해석할 수 있다.
5. 동시출현 네트워크 분석
디지털 헬스케어와 관련한 핵심 키워드들은 연관성을 가지고 있기 때문에 해당 키워드들이 동시에 출현하는 빈도 수를 확인할 수 있다. 즉, 키워드의 출현이 동시에 이루어질 경우, 구축되는 연관성을 토대로 키워드들의 규칙적인 형태를 확인할 수 있다는 것이다. 다음 <Table 5>와 같이 코로나19 기간과 코로나19 이후의 동시 출현에 대한 키워드 분석을 수행하였다. 먼저, 코로나19 기간의 동시출현 키워드 유형은 총 3,303개, 빈도는 70,019개, 코로나19 이후의 동시출현 키워드 유형은 총 3,182개, 빈도는 66,368개로 나타났다. 둘째, 코로나19 기간의 디지털 헬스케어에 대한 소비자 트렌드는 헬스케어와 산업과 관련한 키워드, 코로나19 이후의 트렌드는 헬스케어와 전문기업과 관련한 키워드의 출현빈도가 많다는 것을 확인하였다.
V. 결 론
본 연구는 코로나19 기간과 이후의 디지털 헬스케어에 대한 소비자 인식을 확인하기 위해 비정형 데이터 활용을 통한 빅데이터 분석을 효과적으로 수행할 수 있는 솔루션 프로그램인 텍스톰을 이용하여 네이버, 다음 및 구글과 같은 포털사이트 내 카페 및 블로그, 뉴스 매체를 활용하여 다양한 키워드를 수집하였다. 이에 대한 분석결과는 다음과 같다. 빈도분석 수행결과, 코로나19 기간은 헬스케어, 디지털전환, 의료기기, 서비스 개발, 기업육성, 헬스케어기술, 인공지능 순, 코로나19 이후는 헬스케어, 디지털, 의료서비스, 바이오기업, 서비스혁신, 의료산업 등의 순으로 제시되었다. 중심성 분석 결과, 연결 및 위세중심성 지표 결과, 코로나19 기간은 헬스케어, 디지털전환, 의료기기, 기업육성, 헬스케어기술 및 파트너 순, 코로나19 이후는 헬스케어, 디지털, 의료서비스, 바이오기업, 의료산업 서비스혁신 순으로 제시되었다. 또한 코로나19 기간과 이후의 상관의미패턴을 확인하기 위해 QAP 상관분석을 수행한 결과, 상관계수는 .975로 유의수준 1% 이내에서 통계적으로 유의한 것으로 나타났다. 마지막으로, 동시출현 네트워크 분석 결과, 코로나19 기간은 헬스케어와 산업과 관련한 키워드, 코로나19 이후 는 헬스케어와 전문기업과 관련한 키워드의 출현빈도가 많다는 것을 알 수 있었다. 따라서 디지털 헬스케어는 의료진들의 원격 진료와 적절한 치료제 처방으로 개개인을 위한 맞춤형 솔루션을 제공할 수 있고, 의료 데이터 수집을 통해 건강관리를 효과적으로 할 수 있게 도와준다.
이러한 분석결과를 토대로 제안되는 학문적 시사점은 다음과 같다. 첫째, 의료혁신 및 인공지능을 이용한 의료분야 적용이다. 디지털 헬스케어 연구는 의료 혁신과 환자 경험에 대한 심도 있는 이해를 제공한다. 신규기술이 의료 서비스에 도입됨에 따라 환자들의 의료 접근성, 편의성, 및 만족도에 어떠한 영향을 미치는지에 대한 연구는 의료 시스템의 개선을 위한 중요한 인사이트를 제공할 수 있다. 또한 인공지능과 머신러닝 기술이 의료분야에 적용됨으로써 의료 결정과 치료의 효율성을 개선하는 사례와 도구를 제안할 수 있을 것으로 사료 된다. 둘째, 데이터 보안, 사회적 이슈 및 윤리의 이슈이다. 디지털 헬스케어가 더욱 발전함에 따라 빈번해지는 데이터 해킹과 개인 정보 유출에 대응하는 방안을 탐구하는 연구는 의료 기관과 개인들의 데이터 보안을 강화하기 위한 정책과 절차를 개선하는 데 도움을 제공하고 의료 기관과 개인들의 데이터 보안을 강화하기 위한 정책과 절차를 개선시킬 수 있다. 또한 디지털 헬스케어의 빠른 발전으로 인해 윤리적 문제와 규제적 쟁점이 발생하고 있다. 이러한 문제들을 다루는 연구는 디지털 헬스케어의 적절하고 윤리적인 발전을 촉진하기 위한 지침과 방안을 제시할 수 있을 것으로 판단된다. 마지막으로, 디지털 헬스케어에 참여하는 환자들이 자신의 의료 데이터를 어떻게 관리하고 활용하는지에 대한 연구는 개인 건강관리를 개선하고 자기 의료 결정에 더 많은 권한을 부여할 수 있을 것이다.
한편, 디지털 헬스케어와 관련된 사회과학 연구를 심화시키기 위한 실무적 시사점은 다음과 같다. 첫째, 의료 기관과 전문가들의 교육을 강화하고 접근성을 향상시켜야 할 것이다. 디지털 헬스케어 기술과 도구를 최대한 활용하기 위해서는 의료 기관과 전문가들의 이해와 수용이 필수적이다. 따라서 연구 결과를 기반으로 디지털 헬스케어에 대한 교육 및 교육 프로그램을 개발하여 의료 전문가들의 역량을 강화하는 것이 필요하다. 또한 디지털 헬스케어의 잠재력을 최대한 발휘하기 위해서는 지역사회에서도 적극적으로 활용되어야 할 것이다. 농촌 지역이나 저소득층에 해당하는 환자들을 위한 디지털 헬스케어 서비스에 대한 접근성을 높이는 방안을 모색하는 것이 필요할 것으로 판단된다. 둘째, 인공지능 기술의 윤리적 사용 및 비용 효율성 개선에 주안을 두어야 할 것이다. 인공지능 기술은 뛰어난 성능을 보여주고 있지만, 그 사용에는 윤리적인 측면도 고려되어야 한다. 디지털 헬스케어에서 인공지능 기술의 윤리적 사용과 환자의 동의 등에 대한 가이드라인을 개발하고 실천해야 할 것이다. 또한 디지털 헬스케어가 의료 비용에 미치는 영향을 평가하고 효율적인 비용 관리 방안을 연구하여 의료 시스템의 지속 가능성을 향상시켜야 할것으로 판단된다. 이러한 실무적 시사점은 연구 결과를 보다 실질적으로 활용하는 방안을 제시하고 사회에 긍정적인 영향을 미치는 데에 중요한 역할을 할 것입니다.
분석결과를 토대로 다양한 시사점을 제시하였음에도 불구하고 몇 가지 한계점이 존재한다. 첫째, 한국의 디지털 헬스 산업은 글로벌 시장에 비해 규모가 매우 작은 편이며, 엄격한 의료 규제로 발전 속도가 느리다 할 수 있다. 따라서 향후 연구에서는 이를 체계적으로 증명할 수 있는 정형데이터를 활용하여 연구를 수행하는 것이 좀 더 유의미한 시사점을 제안할 수 있을 것으로 사료 된다. 둘째, 디지털 헬스케어에 대한 소비자 인식에 대한 연구를 수행하였는데, 그렇다면, 디지털 헬스케어에 대한 소비자 감성은 어떠한지 향후 연구에서는 감성분석을 통한 연구가 수행되어야 할 것으로 판단된다.