텍스트 마이닝 기법을 활용한 국내 디지털 및 에너지 전환 정책 동향 분석
Analysis of Domestic Digital and Energy Policy Trends Using Text Mining method
Article information
Abstract
목적
텍스트 마이닝 기법을 활용하여 디지털과 에너지 전환 키워드를 포함하는 정부부처, 주요 언론을 분석함으로써 국내정책의 현재 동향을 파악하고 미래의 방향성 고찰을 목적으로 한다.
방법
2015-2021년 동안 발행된 디지털과 에너지 전환 관련 정부부처의 보고서와 정책브리핑 기사, 주요언론에 게재된 기사를 대상으로 수집하고 텍스트 마이닝 기법을 사용해서 분석하였다. 분석 방법은 전체 데이터를 기반으로 한 빈도분석과 연관어 분석을 진행하였다. 시계열 분석은 2015년부터 2021년을 연도별로 구분한 주요언론 데이터를 토대로 분석을 진행하였다.
결과 및 토의
2015-2019년 동안 발행 및 게재된 보고서와 기사를 기반으로 한 빈도분석을 통해 핵심 키워드를 확인한 결과 디지털 전환에서는 교육과 금융이 높은 비중으로 확인되었고, 에너지전환 분야에선 수소와 태양광이 높은 빈도로 검측되었다. 이 결과는 4차 산업혁명 핵심기술들이 다양한 분야에 적용되고 있고, 탄소중립을 위한 신재생에너지에 초점이 맞춰져 있음을 보여주는 결과이다. 시계열 분석 결과 현정부에 들어서서 정책의 방향성이 변화됨을 확인하였고, 코로나 발생과 한국판 뉴딜 정책 전후로 디지털 및 에너지 전환이 가속화되고 있는 것으로 나타났다. 연관어 분석을 통해서는 인공지능, 가상현실, ICT와 스마트 키워드를 중심으로 4차 산업혁명 기술이 다양한 분야에 적용되고 있음을 확인하였고, 수소, 연료전지, 태양광을 중심으로 신재생에너지 사업이 활발이 진행되고 있음을 확인하였다.
결론
본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 디지털 및 에너지 전환 정책의 방향성을 분석하였다. 분석 결과, 코로나와 뉴딜정책 전후로 4차 산업혁명 및 탄소중립 관련 키워드의 비중과 연관성이 높은 것을 확인할 수 있었다. 텍스트 마이닝 기법을 통해 보다 효과적으로 국내 정책 트렌드의 변화를 파악할 수 있었으며, 향후 이를 실질적으로 활용할 수 있는 분야가 매우 다양할 것으로 예상된다. 따라서, 텍스트 마이닝 기법을 활용할 수 있는 기반과 환경을 조성하는 것이 필요할 것으로 판단된다.
Trans Abstract
Objectives
The objective of this study is to understand digitalization and energy conversion trends and suggest future directions using text-mining-based analysis.
Methods
From 2015 to 2021, published domestic research reports and policy briefings related to digitalization and energy from government departments and major media outlets were analyzed using text-mining techniques. Frequency, time-series, and association analyses were conducted to understand current trends and patterns.
Results and Discussion
Frequency analysis of reports and articles published for the 2015-2021 period found that the most common keywords were, in descending order, ‘education’, ‘finance’, ‘hydrogen’, and ‘solar power’. This indicates that the core technologies of the fourth industrial revolution have been employed in various fields, with a specific focus on renewable energy for carbon neutrality. Time-series analysis confirmed that the direction of government policy has changed, and it was found that digital and energy conversion was accelerating before and after the outbreak of COVID-19 and the Korean version of the New Deal policies. Association analysis revealed that government policies associated with fourth industrial revolution technologies have been established in various fields and the commercialization of renewable energy has been active.
Conclusion
Analyzing domestic policy directions using text mining revealed an association between the fourth industrial revolution and carbon neutrality. Text mining techniques can be used to more effectively understanding of domestic policy trends, and it is expected that they will apply a wide variety of fields that can utilize them in the future.
1. 서 론
최근 기후변화와 코로나로 인해 디지털 경제가 가속화되고 저탄소・친환경 기술발전에 전 세계가 집중하고 있다. 기후변화는 현대화와 도시화로 인해 점점 가속화되고 있으며, 인류의 미래에 매우 심각한 위협이 될 수 있어 온실가스와 같은 화석연료를 친환경 에너지로 전환하기 위한 신재생에너지에 관심과 수요는 점점 늘어나고 있는 상황이다[1-3]. 이와 함께 세계 각국에서는 에너지・기후변화 대응정책을 수립하고 탄력적으로 운영하기 위한 방안을 마련하는데 집중하고 있다[4-5]. 코로나는 4차산업혁명의 발전과 함께 디지털기술에 기반한 온택트(Ontact) 를 가속화하고 사회적 거리두기로 인한 온라인 비대면을 확산시켜, 초연결(Hyperconnecitivity) 기반의 핵심기술 융합이 앞으로 본격화될 것으로 예상된다. 디지털 기술은 가상현실(VR: Virtual Reality), 인공지능(AI: Altificial Intelligence), 사물인터넷 (IoT: Internet of Things), 로봇(Robot), 클라우드 컴퓨팅(Cloud computing) 등의 분야에서 다양하게 활용되고 있다. 또한, 디지털 기술이 급격하게 성장함에 따라 모든 산업 전반에 걸쳐 프로그래밍, 창의적 사고, 시스템 설계에서 더 많은 기술력이 요구되고 있다. 이러한 디지털 기술은 산업발전의 격차를 유발하기도 하지만 디지털화 격차를 해소할 수 있는 방안으로 떠오르면서 증강현실(AR: Augmented Reality), VR, IoT 지원 및 공유, 데이터 분석 도구 지원 등을 통해 교육, 비즈니스 모델의 활성화 및 전환을 촉진시키고 있다. 이로 인해 기업의 수익과 경제적인 제품 및 서비스, 소비자의 가치를 향상시키는 등의 수많은 이점을 제공할 수 있다[6-7]. 이러한 트렌드에 맞춰 미국과 중국에서는 ‘AI 표준 개발 계획 수립’, ‘차세대 AI 발전계획 수립’ 등을 통해 4차 산업혁명 관련 기술의 상용화 확대를 위한 정책지원을 강화하고 있다[8-9]. 2016년 ‘파리기후변화협정’ 에 따라 전 세계적으로 화석에너지의 과도한 사용으로 인한 온실 가스 배출 저감에 대한 인식이 확대되었고, 이를 해결하기 위해 녹색산업기반 구축과 탄소중립을 실현하기 위한 탈탄소화 정책 강화, 재생에너지 역할 확대, 경제구조의 저탄소화, 수송부문의 청정화(전력화 및 수소화 등)와 산업・건물 부문에서 에너지효율 고도화 등 에너지 전환을 빠르게 촉구하고 있다. 에너지가 현대 국가 및 경제 시스템의 근간을 이루고 있는 만큼 시민들의 주거, 생활, 교통, 물류 및 경제활동에 수반되는 모든 활동에 관여하고 있기 때문에 에너지에 대한 관심이 높고 기후변화에 대응하기 위한 에너지 전환도 국가 발전의 필수적인 요소로 인식하고 있다. 주요 에너지 전환 선도 국가인 독일은 통합에너지법을 제정하였고, 영국과 프랑스는 에너지법 도입 및 에너지 전환법 입법화와 중장기에너지 계획을 수립하여 시행하고 있다[10].
해외 선진국인 미국과 유럽연합에선 기후변화에 효과적으로 대응하고 사회・경제적 불균형 문제를 해결하여 침체된 경제를 회복하기 위해 그린뉴딜 결의안 및 그린딜을 추진하고 있다. 이에 우리나라도 세계적인 흐름에 맞춰 ‘한국판 뉴딜 종합계획’ 을 발표하였다[11]. 한국판 뉴딜 종합계획은 현재 직면하고 있는 경제위기를 극복하고 향후 본격화할 것으로 예측 되는 디지털 전환을 효율적으로 대응하기 위한 국가 발전전략 중 하나이다[12]. 한국판 뉴딜의 주목적은 세계적인 온실가스 저감 목표의 달성과 포스트 코로나 시대를 대비하여 글로벌 경쟁력을 확보하여 국가 위상 제고를 도모하는 것이다. 특히, 코로나 팬데믹 이후의 경제적 침체와 위기를 극복하기 위한 정책 마련과 관련 연구가 활발하게 진행되고 있으나 큰 성과를 도출하기 어려웠고, 뉴딜 정책이 중심축이 되어 이러한 문제를 해결할 필요성이 강조되었다[13]. 한국판 뉴딜은 디지털 뉴딜과 그린 뉴딜 양대 축에 안전망을 강화하는 구조로 정부는 그린 뉴딜을 통해 ‘탄소배출 제로’를 목표로 하고 이를 실현하기 위해 재생에너지산업을 성장시킬 계획을 가지고 있는 것으로 여겨진다. 고부가가치를 창출할 수 있는 신산업분야와 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위한 것이다[14].
급격한 사회적・경제적 변화에 맞춰 미래 핵심 이슈를 발견하고 신성장 관련 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 한국판 뉴딜정책이 실질적인 성과를 창출하기 위해서는 국제적 변화에 대한 정보를 선제적으로 파악하고 중점 분야를 선정하는 것이 필요하다. 특히, 최근에는 대량의 정보를 빅데이터화 하여 핵심정보와 결과를 도출할 수 있는 기술이 4차 산업혁명과 함께 보급되고 있다. 텍스트 마이닝은 대용량의 정보를 분석하는 기술 중 하나로 일반적으로 비정형 텍스트에 기반하여 정보를 자동으로 추출하고, 핵심 정보를 함께 파악하여 알려지지 않은 정보를 발견하는 것이다[15]. 비정형 데이터는 일반적으로 word, 한글, pdf와 같은 텍스트 데이터로 대부분의 데이터가 텍스트 형태로 저장되기 때문에 여러 분야에서의 활용도가 높다[16]. 실제로 넓은 활용성을 바탕으로 국내외 교육, 기술, 과학, 공학, 사회분야 등에서 텍스트 마이닝이 광범위하게 사용되고 있는 만큼 현재까지의 자료를 기반하여 미래의 동향을 파악하기에 적절한 방법이다[15-20].
현재 국내의 디지털 분야는 경제, 산업, 사회, 글로벌 등 다양한 분야의 이슈가 있고 디지털 뉴딜 성과 창출, 분야별 디지털 전환, 탄소중립 등의 핵심이슈들이 존재한다. 디지털 기술 들은 탈탄소와 더불어 에너지산업에서 가장 각광을 받는 주제로 디지털 기술과 에너지 시스템이 융합하여 다양한 데이터 수집 및 분석을 가능하게 한다. 또한 4차산업혁명 기반 기술이 점차 상용화 되면서 에너지의 생산과 소비, 유통, 저장 등 산업 현장에서의 에너지 시장의 고도화 및 스마트화를 빠르게 진행시키며 디지털과 에너지가 현대 사회에서 밀접한 관련이 있는 것으로 파악된다. 따라서, 본 연구에서는 텍스트 마이닝을 사용하여 2015-2021년간 정부부처, 주요언론을 대상으로 디지털 및 에너지전환 관련 키워드를 추출하여 국내정책의 동향을 파악하고자 한다. 또한, 시계열 분석을 통해 연도별 정책변화를 확인하고 연관어 분석을 통해 핵심 키워드를 추출하여 국내에서 추진하고 있는 정책과 디지털 및 에너지전환 간의 상호관계를 파악하고자 한다. 최종적으로 텍스트 마이닝을 통해 분석된 데이터를 종합하여 디지털과 에너지 전환정책의 미래 방향성을 고찰하였다.
2. 실험방법
2.1. 분석 도구
본 연구에서는 텍스트 마이닝 기법을 활용하기 위해 오플소스 프로그램인 Python 3.7.6 버전을 사용하였다. 한글 기반의 텍스트 자료만을 수집하여 분석하였기에 한글 자연어 분석 패키지 KoNLPy (Korean Natural Language Processing)의 customized version을 사용하였다. Customized KoNLPy는 주어진 어절을 기존에 사전에 등록된 단어들로 토큰화 시키고 품사를 판별할 수 있다. 품사를 판별할 땐 명사, 동사, 형용사 구분이 가능하고 대용량의 한국어 텍스트를 빠르게 분석 가능한 Customize KoNLPy의 twitter 클래스를 사용하였다. 또한 Customized version을 사용하여 기존의 사전에 새로운 단어를 추가하였고, 한국어 불용어 리스트 100개와 리스트에 없는 불용어를 추가시켜 분석에 활용하였다. 또한 결과는 wordloud 1.8.1 Gephi v.9.2와 networkX를 사용하여 시각화 하였다.
2.2. 분석과정
텍스트 마이닝의 분석과정은 Fig. 1과 같다. Fig. 1의 첫 단계인 Data Collection에선 2015년 1월 1일부터 2021년 4월 20일까지 6년 4개월 사이의 정부부처(환경부, 국토교통부, 행정안전부, 중소기업청, 산업통상자원부, 한국환경공단, 해양수산부, 한국에너지공단, KISTEP, STEPI, KMI, BISTEP, KEI) 에서 발행한 ‘에너지’와 ‘디지털’관련 보고서와 정책 브리핑 자료를 각각 413개, 346개씩 수집하였다. 또한, 한국언론진흥재단이 운영하는 뉴스 빅데이터 분석 서비스인 빅카인즈(BIG KINDS)를 활용하여 ‘에너지’와 ‘디지털’ 각각의 키워드가 1 개이상 포함되어 있는 주요 언론 기사(조선일보, 중앙일보, 동아일보, KBS, MBC, SBS, YTN)를 각각 41,470개, 45,550개씩 수집하였다. 분석을 위해 수집된 정부부처 자료는 정부의 정책 추진 방향과 현황을 상세하게 파악하는데 필요한 정보를 제공해 줄 수 있고, 주요언론의 보도자료는 정부뿐만 아니라 기업과 해외 동향을 신속하고 효율적으로 파악하는데 활용될 수 있다. 따라서, 정부부처와 주요언론을 상호 비교하는 것이 텍스트 마이닝 분석의 정확성과 신뢰도를 높일 수 있다.
Fig. 1의 두번째 단계인 Data Preprocessing은 세 단계로 구분하였다. 첫 번째 단계는 수집된 데이터를 전처리 하기위해 오픈소스 프로그램인 python 3.7.6 버전을 활용하여 pdf, hwp, xlsx 등의 파일들을 모두 csv파일로 전환하는 과정이다. 본 연구에서는 pdf파일의 경우 txt로 변환하는 과정을 추가적으로 거친 후 csv파일로 전환하였다. 모든 자료를 csv파일로 전환한 후 csv 파일에서 AR, VR, IoT, COVID등의 단어는 모두 증강현실, 가상현실, 사물인터넷, 코로나로 영문을 한글로 수정하는 작업을 거쳤다. 또한, 문장부호와 특수문자를 제거하는 과정을 수행하였다. 마침표, 콤마, 물음표, 느낌표 등의 문장부호는 전체 말뭉치의 관점에선 특정한 의미를 부여하기어렵고, 하이픈, 괄호, 각종 기호 등의 특수문자도 동일한 이유로 제거하였다. 두번째 단계는 불용어를 제거하는 단계이다. 불용어 제거는 불용어 사전에 새로운 불용어 단어들을 추가시킨 라이브러리 리스트를 만들어 분석하고자 하는 파일의 단어와 맵핑시켜 제거하는 방법을 사용하였다. 기존의 한국어 불용어 목록에 없는 ‘통해, 위해, 대한, 제공, 구축, 조성, 기관, 센터’와 같이 텍스트 마이닝 분석 시 특별한 의미를 도출하지 않는 단어와 오탈자 등을 제거하였다. 세번째로 pandas 패키지를 사용하여 python에서 변환된 csv파일의 텍스트 데이터를 인식하는 과정을 거쳤다. Customized KoNLPy의 twitter를 사용하여, 명사 키워드(Noun)를 추출하였고, 빈도수가 높은 순서대로 리스트를 작성하였다. twitter로 명사를 추출할 때 기존 사전에 없는 신조어인 ‘코로나, 핀테크, 디지털트윈, 가상현실, 스마트팜, 인공지능, 비대면, 사물인터넷, 디지털뉴딜’ 등을 인식하지 못하였다. 이에 KoNLPy Customized version의 add dictionary를 사용하여 신조어를 모두 명사로 추가하였다. 또한, 신 재생에너지, 재생 에너지, 친 환경과 같이 띄어쓰기로 인해 서로 다른 단어로 판단되는 것을 방지하기 위해 띄어 쓰기 단어들은 모두 ‘신재생에너지’, ‘재생에너지’, ‘친환경’ 등의 대표어로 지정하여 새로운 명사단어로 추가하였다. Data Preprocessing 과정에서 두번째와 세번째 과정을 반복적으로 수행하여 데이터 정제 수준을 높였다.
전처리 과정이 끝난 데이터를 사용하여 상위 40-70개의 명사 키워드를 추출하여 Frequency analysis(빈도분석)를 실시 하였다. 빈도분석은 정부부처와 주요언론에서 검측된 ‘디지털’과 ‘에너지’ 키워드를 대상으로 실시하였다. 빈도 분석 결과를 시각화 하기위해 워드 클라우드(WordCloud)를 사용하였다. 워드 클라우드는 현재 다양한 분야에서 널리 사용되고, 계산된 빈도수에 비례하여 단어의 크기와 굵기를 결정하여 핵심 빈도에 초점을 맞춘 시각화 방법이다[15, 21-22]. ‘디지털’ 키워드의 경우 각 연도별로 6,300개, 3,100개, 4,500개, 7,300개, 15,000개, 3,050개의 데이터를 대상으로 분석하였고, ‘에너지’ 키워드는 3,830개, 5,500개, 5,340개, 7,320개, 7,800개, 8,920개, 2,760개의 수집된 데이터에 기반하여 출현단어의 상대적 중요도를 비교하였다. 최다 빈도로 검측된 상위 10개의 키워드를 추출되었고 excel을 이용하여 그래프 형태로 나타냈으며, 두 키워드간 공통된 단어는 같은 색으로 표현하였다. 또한 Association analysis(연관어 분석)를 통해 키워드별로 두 개의 단어가 동시에 출현한 횟수를 분석하였다. 동시 출현 빈도수가 높은 단어를 상위 15~20%로 추출한 뒤 Networkx와 Gephi v.9.2를 사용하여 시각화 하였다[15,22]. 연관어 분석은 빈번하게 검측되는 고빈도 단어를 선택하였고, 두 단어간의 페어를 수치로 나타내었다. 단어간 페어 수치가 클수록 높은 연결성을 보이는 것으로 판단하여, 고빈도의 단어일 수록 글씨와 노드의 크기를 크게 표시하였고 중심에 있는 단어의 색상을 서로 다르게 하여 시각화 하였다.
3. 결과 및 고찰
3.1. 빈도 분석 결과
‘디지털’ 키워드를 정부부처와 주요언론 보도자료로 구분하여 빈도 분석한 결과는 Table 1로 요약된다. 각각 346개와 45,550개의 자료를 사용하였고, 추출된 키워드 중 상위 20개를 내림차순으로 나타냈다. Table 1과 Fig. 2에 나타난 것과 같이 ‘디지털’과 관련된 정부부처의 보도자료에서는 ‘인공지능’ 키워드가 높은 빈도로 검측되었으나, 주요언론에서는 ‘인공지능’ 키워드 비중이 상대적으로 낮게 검측되었다. 또한, 디지털과 관련된 모든 키워드를 분석한 결과 가장 높은 비중으로 검측된 키워드는 ‘교육’과 ‘금융’으로 나타났다. ‘교육’ 키워드의 경우 전세계적으로 인공지능 기술을 교육과 학습 보조 도구로 활용하고 있는 현실이 반영된 것으로 여겨진다[23]. ‘코로나’, ‘온라인’, ‘콘텐츠’와 ‘플랫폼’등의 키워드는 코로나의 확산으로 인해 디지털화가 가속화되고 기존의 대면수업에서 원격 교육과 온라인 교육으로 빠르게 전환되고 있는 상황이 반영한 결과인 것으로 판단된다. 교육부에서도 코로나 이후 미래교육 방향 전환을 위한 10대 정책과제로 디지털 전환 교육 기반을 마련하고자 하기 때문에, 유・초・중・고에서 온라인 콘텐츠 정보를 통합 플랫폼을 구축하고 있는 현실이 반영된 것으로 판단된다[24]. ‘금융’ 의 경우 기업간 금융플랫폼의 활성화, 인공지능을 활용한 금융서비스, 오픈 뱅킹 등이 주요한 금융이슈로 떠올랐고, 최근엔 블록체인 기술을 활용한 비트코인과 주식시장의 확대에 따라 관련 보도가 증가된 결과가 반영된 것으로 해석할 수 있다[25]. 2013년 이후로 비트코인은 주요한 화폐 중 하나로 사용되었고, 디지털 전환과 맞물려 금융 시장의 관련 기술과 산업발전이 빠르게 일어남에 따라 금융관련 주요 쟁점사항이 자주 언급되었다[26]. 그리고 코로나 발생 이후 국내 증시의 급락과 회복해가는 과정에서 개인투자자의 주식시장의 참여가 급등한 결과를 반영한 것으로 보인다[27]. 그 외 공통적으로 검측 빈도수가 높은 키워드는 ‘플랫폼’, ‘콘텐츠’, ‘환경’등으로 나타났다.
‘에너지’ 키워드는 정부부처 413개와 주요언론 41,470개로 구분하여 빈도분석을 수행하였고 빈도가 높은 순서대로 20개를 추출한 결과는 Table 1과 Fig. 3에 나타내었다.‘에너지’ 키워드에서는 각각 19%, 27.8%로 공통적으로 ‘수소’가 가장 높은 빈도로 나타났다. 또한 ‘태양광’이 주요 키워드로 분석되었는데 이는 그린뉴딜의 탄소중립 정책목표를 달성하기 위해 태양광 발전사업의 확대와 수소에너지 전환을 진행하고 있는 결과이다[29-30]. 정부부처에서는 ‘신재생에너지’ 키워드와 관련된 ‘바이오’, ‘풍력’, ‘폐기물’등의 키워드가 높은 비율로 나타났는데 재생에너지 중심으로 전력 공급 추진, 폐기물 고부가 가치 재활용 촉진과 폐기물 발생을 근본적으로 감축하고자 하는 국가 전략이 반영된 것으로 보인다[31]. 벙부부처의 자료와 주요언론에서의 차이는 ‘반도체’, ‘수소차’와 같은 키워드가 주요언론에서 상대적으로 높은 비중을 차지한다는 점이다. 반도체 기술은 미래 친환경 에너지로 평가받는 전기 에너지의 생산, 전송, 저장, 소비의 모든 과정에서 전력 효율을 높이고 손실을 줄이는 핵심적인 역할을 한다. ‘반도체’ 키워드는 2019년 7월에 발발한 한일 무역 분쟁으로 반도체 산업의 핵심소재인 불화수소, 포토레지스트, 폴리이미드의 수출통제가 이어졌고, 글로벌 시장의 약 73.4%를 차지하는 국내 기업에 악영향을 줄 수 있다는 기사가 해당 연도에 급증한 원인이 반영된 것으로 볼 수 있다[32]. 또한, 정부의 수소차 보급 활성화를 통해 현대기아차, 현대모비스, 한온시스템, 코오롱 등의 기업에서 수소차 사업확장 및 사업성과와 관련된 언론 보도 및 관련 기사가 증가한 것이 반영된 결과로 여겨진다[33].
3.2. 시계열 분석 결과
시계열분석은 정부부처와 주요언론사의 보도자료를 대상으로 연도별 7개의 구간 (2015년, 2016년, 2017년, 2018년, 2019년, 2020년 2021년)으로 구분하여 실시하였다. 분석 시 가장 빈도가 높은 10개의 단어를 선정하였고, 연도별로 동일 키워드는 같은 색상으로 표시하였다. 디지털 키워드는 정부부처와 주요언론사 모두 ‘교육’과 ‘금융’이 높은 비중을 차지하였고, ‘온라인’, ‘모바일’, ‘플랫폼’, ‘콘텐츠’가 그 뒤를 이어 꾸준히 높은 비중을 차지하였다(Fig. 4). 디지털 분야에서는 온라인과 콘텐츠, 모바일 플랫폼이 서로 연관성이 높은 키워드로 나타났다. 2017년도와 2021년도에 높은 빈도로 검측 된 키워드는 ‘비트코인’이었으며, 2017년부터 가상화폐에 대한 투자가 급증하다가 잠시 투자가 주춤한 이후 2020년부터 다시 투자 붐이 일어난 영향이 반영된 결과인 것으로 판단된다. 가상화폐의 거래량이 증가함에 따라 국내에서도 2020년 12월 소득세법 개정을 통해 소득세 부과를 발표하면서 가상화폐의 대표적인 역할을 하는‘비트코인’ 키워드가 높은 비중으로 나타난 것으로 보인다[34]. 2020년도 1월에 국내에서 코로나 확진 환자가 발생하였고, 점차 코로나가 전국적으로 확산됨에 따라 정부는 강도 높은 봉쇄조치를 진행하였다. 이로 인해 경기 침체가 발생하였고, 정부의 뉴딜 정책의 주요 사항으로 코로나 위기 극복을 언급하면서 ‘코로나’와 ‘뉴딜’ 키워드가 많이 검측된 것으로 판단된다[12]. 코로나로 인해 디지털화는 더욱 가속화되고, 의료와 교육 등에서 급격한 스마트화가 진행됨에 따라 비대면 인프라 구축과 클라우드・사물인터넷 등 디지털 기반기술개발의 수요가 증가하였다. 이러한 영향으로 ‘온라인’, ‘모바일’과 ‘플랫폼’ 등의 키워드가 지속적으로 높은 비중을 차지하고 있는 것으로 여겨진다[12].
에너지 키워드에선 정부부처와 주요언론 모두 ‘환경’키워드가 높은 빈도로 검측 되었다(Fig. 5). 정부부처와 주요언론의 2015-2017년 사이의 가장 뚜렷한 차이는 ‘원전’ 키워드인 것으로 나타났다. 정부부처의 경우 탈원전으로 인한 신재생에너지 사업의 확장으로 원전의 언급이 상대적으로 많은 것으로 보이며, 그 외 ‘유가’, ‘원유’의 키워드는 주요언론에서 비중이높았는데 언론기사의 특성상 실질적으로 국민들에게 영향을 높게 줄 수 있는 단어들이 많이 언급된 결과로 해석된다. 2015년도부터 2017년까지는 ‘수소’키워드가 낮은 빈도로 검측 되었으나, 2018년도부터 2021년까지는 높은 빈도로 검측 되었다(Fig. 5). 또한 ‘풍력’ 키워드는 전반적으로 높은 비중으로 나타나진 않지만 신재생에너지 중 하나로 꾸준히 언급이 되고 있어서 시계열 분석에서는 빈도수가 높게 나타나지 않은 것으로 판단된다. ‘태양광’의 경우 2018년도에 급증하다 다시 감소하는 추세로 분석되었는데 2018년도 신규 태양광 설치량이 사상 최고치를 기록한 이후로 태양광발전의 가장 큰 단점인 8~15%의 발전효율과 넓은 부지가 요구되는 점이 부각되어 점차 언론의 관심도가 떨어진 것으로 여겨진다. 이는 현 정부가 들어서면서 전기/수소차 등 친환경 엔진개발, 수소차 보급등 수소 관련 주요공약과 국정과제를 제시했고, 수소경제를 3대 투자전략으로 발표함에 따라 수소에너지 연구개발 촉진, 인프라 구축 지원 등의 R&D 지원사업이 추진된 결과이다[35-36]. 2020년부터 ‘탄소’와 ‘뉴딜’ 키워드가 높은 비중을 차지하는데 이를 분석하기 위해 국외의 상황을 검토하였다. 현재 진행중인 지구 온난화로 인해 최근 30년 사이에 평균온도가 1.4℃ 상승하였고, 국제사회는 파리기후협정에 따라 기후변화 대응정책의 장기적 관점에서 저탄소 발전전략을 2020년까지 수립하고 있다. 또한 ICPP의 1.5℃ 목표를 달성하기 위해 전 지구적으로 2030년까지 2010년대비 이산화탄소 배출량을 최소 45% 이상 감축을 명시하였다. 이에 우리나라는 탄소중립을 이행하기 위해 2050 탄소중립의 기본방향을 마련하였다[33]. 이와 같은 대외적 요인에 의해 탄소감축에 대한 주요언론 보도 및 기사가 증가하여 해당 키워드가 높은 빈도로 검측된 것으로 여겨진다. 현 정부는 2020년부터 그린뉴딜 정책을 적극적으로 시행하여 탄소중립을 반영하였고, 그린뉴딜 사업을 확대 및 보강하여 저탄소 경제구조로 전환을 가속화하기 위해 녹색산업 혁신 생태계, 저탄소・분산형 에너지 확산등을 추진하고 있다. 특히, 2021년 그린뉴딜에 탄소중립 추진기반 구축을 신설하였고, 탈원전으로 인한 친환경에너지 정책을 강화하고 있는 상황이 반영된 것으로 판단된다. 저탄소를 위해 화석 연료 의존도를 낮추고 배출량 관리를 시행하였으며, 친환경 에너지로 전환하기 위해 파력, 해상풍력 등 다양한 재생에너지를 사용해서 그린수소를 생산하려는 기술개발 요구도 영향을 미쳤을 것으로 판단된다[12]. 또한, 그린뉴딜의 도시・공간・생활 인프라 녹색전환 목표를 달성하기 위해 스마트 그린도시를 조성하고자 하였고, 태양열, 풍력, 바이오매스 등의 활용을 적극적으로 권장하고 있다. 바이오 연료 혼합의무제도를 도입하면서 바이오 연료의 사용이 확대되고 있으며, 도시공간에서의 건물 일체형 태양광 발전 시장의 성장과 태양광・풍력 발전용량을 3배까지 확대하여 기후 변화에 적극적으로 대응하고자 노력하고 있다. 그리고, 신재생에너지 공급 의무화제도 비율을 점점 상향 조정함에 따라 공급과 수요를 증가시키고, 기업공동의 연구센터 구축과 풍력 공동설비 구축 등 R&D 및 실증사업을 진행하고 있다. 이러한 영향으로 인해 해당 키워드인 ‘태양광’, ‘풍력’과 ‘바이오’등이 꾸준히 상위 키워드로 분류된 것으로 여겨진다[37-38].
3.3. 연관어 분석 결과
동시에 출현하는 단어를 분석해 주요 키워드들 간의 연관성을 파악하였다. 전체 키워드의 동시출현 빈도를 상위 15~20%로 정하였고, 동시출현 빈도가 높은 것은 키워드간 강한 상관 관계를 가지고 있다. ‘디지털’과 ‘에너지’ 키워드 모두 정부부처와 주요언론에 대해서 연관어 분석을 실시하였고 결과는 Fig. 6과 같다. ‘디지털’ 키워드의 연관어 분석결과 정부부처와 주요언론 보도자료에선 ICT, 빅데이터, 인공지능, 가상현실, 블록체인, 핀테크 등 4차 산업과 관련된 키워드가 높은 연관성을 가지고 있음을 파악할 수 있었다. 특히, 정부부처에선 인공지능, 가상현실, 스마트, 블록체인을 중심으로 연관어 네트워크가 형성되었고 광범위하게 자리잡고 있음을 알 수 있다. 이는 현 정부의 출범이후 “지능정보사회 중장기 종합대책”에 기반하여 4차 산업혁명을 포함한 ICT 패러다임 방향성을 보여주는 것으로 Data・Network・AI 등을 기반으로 디지털 전환을 촉구하는 결과가 반영된 것으로 판단된다[12,39]. 또한, 다양한 분야에서 디지털화를 촉진하면서 스마트 기기, 온라인 플랫폼, 가상현실과 증강현실 시장의 성장을 촉구하는 결과로 보인다[40]. 현 정부는 디지털 뉴딜의 방향성으로 5G와 인공지능의 융합을 확산하기 위해 스마트 건설, 스마트 공장의 확대와 블록체인 기술 사업 확산 및 효율성 향상을 위해 기업의 지원강화, K-에듀 통합플랫폼 구축으로 가상현실과 증강현실의 교육지원, 스마트 의료 인프라 구축을 위한 스마트병원 선도 모델 구축 및 검증, 어른 친화형 인공지능 및 사물인터넷 기반의 모바일 건강지킴이 등의 사업을 진행중이다[41]. 이러한 디지털 전환 정책의 지속적인 업데이트, 사업시행 공고와 정책브리핑들로 인해 사회경제부문의 주요언론의 기사가 많이 보도되어 연관어 분석결과가 정부부처의 연관어 분석결과와 유사한 것으로 해석된다. 주요언론에서는 ‘온라인-코로나’, ‘ICT-가상현실’등의 연관 키워드가 높은 빈도로 나타났으며, 정부부처에 비해 코로나 키워드의 동시 출현 빈도가 높아진것을 확인할 수 있다. 이는 현재 전세계적으로 코로나 상황이 지속되면서 디지털화 확산의 영향이 반영된 것으로 보인다. 또한, 기존의 미디어 활용, 디지털 리터러시 교육과정의 부재, 온라인 교육과정 플랫폼 구축 미비 등의 문제점을 해결하기 위해 K-에듀 통합플랫폼 구축을 통한 원격수업 환경구축으로 인해 ‘온라인-코로나’와 ‘ICT-가상현실’의 동시 출현 빈도가 높아진 것으로 판단된다[42]. 또한, 주요언론에서는 ICT, IoT라는 정보통신기술과 사물인터넷이 높은 연관성을 이루고 있는 것으로 나타났다. 특히, ‘ICT-코로나’의 동시 출현 빈도가 높은 이유는 ICT를 활용한 코로나 대응체계 마련과 역학조사 등이 전 세계적으로 활성화되었기 때문인 것으로 여겨진다. 또한, 금융과 관련된‘블록체인-암호화폐’, ‘블록체인-비트코인’이 높은 연관성을 가지고 있는 것은 가상화폐가 급격하게 유행화되고 이슈가 되었기 때문인 것으로 해석할 수 있다.
‘에너지’키워드의 경우 정부부처와 주요언론은 태양광, 배터리, 저탄소, 바이오매스, 연료전지 등 신재생에너지의 주류 산업들이 높은 연관성을 가지고 있는 것으로 나타났다. 정부부처에서 ‘연료전지-인프라’, ‘바이오-연료전지’, ‘글로벌-천연가스’ 등이 높은 연관성을 가지고 있었으며, 친환경 바이오와 관련된 바이오디젤, 친환경, 에너지원, 바이오매스 등이 높은 연관관계를 가지고 있었다. 현재 정부에서는 재생에너지 발전 비중을 2030년까지 20%, 제3차 에너지기본계획을 통해 2040년까지 최대 35%까지 비중을 높이고자 한다. 특히, 현 정부에서는 수소에너지를 기반으로 하는 수소경제의 핵심기술로 현재 연료전지의 규모를 확대하려고 하고 있다[44]. 이러한 정부의 정책 추진방향으로 인해 연료전지가 높은 연관성을 가지고 있는 것으로 판단된다. 주요언론의 경우 ‘ESS-태양광’, ‘LNG-태양광’, ‘ESS-전기차’ 등의 키워드가 높은 연관성을 가지고 있는 것으로 나타났다. 그리고 수소차, 전기차와 탈원전에 대한 키워드 간의 연관성도 높은 비중을 차지하는 것으로 나타났다. ESS는 에너지 저장 장치로 전세계 수소 에너지, 태양 에너지 저장시장 등의 에너지 저장 시장의 규모가 커졌고, 삼성과 LG등의 국내 대기업에서도 ESS 사업에 참여한 결과가 반영된 것으로 판단된다[45-46]. 또한, 전기차, 수소 등 에너지 저장이 가능한 모든 시스템과의 연계를 수행하려는정부의 방향성에 영향을 많이 받아 이와 같은 결과가 나타난 것으로 판단된다. 특히, 주요언론의 경우는 정부의 그린뉴딜 정책방향을 따르지만 기업들이 추진하는 에너지저장 기술사업에 주요언론이 영향을 많이 받아 ESS 중심의 연관어 분석 결과가 나온 것으로 판단된다.
4. 결론
2015년부터 2021년까지 정부부처의 자료들과 주요언론 보도자료를 텍스트 마이닝 기법을 활용하여 빈도분석, 시계열 분석, 연관어 분석을 수행하였다. 분석결과 ‘디지털’ 키워드에 서는 ‘교육’, ‘금융’, ‘플랫폼’의 주요 키워드가 모든 자료에서 높게 검측되었다. 이를 통해 4차 산업혁명의 핵심 기술인 IoT, 빅데이터, 블록체인, 인공지능 등이 여러 사업과 연관성이 높고 교육, 금융, 의료 등의 다양한 분야와 융복합하여 디지털 전환을 가속시키고 있음을 알 수 있었다. ‘에너지’ 키워드는 신재생에너지 중심의 ‘수소’, ‘태양광’, ‘풍력’ 등의 키워드가 높은 빈도로 검측되었다. 이는 전세계적인 탄소중립 정책에 대응하기 위해 국가적 차원에서도 신재생에너지 개발을 강력하게 추진하고 있는 결과로 해석된다. 이외에도 ‘디지털’과 ‘에너지’ 키워드에서 서로 교차적으로 ‘건설’, ‘폐기물’, ‘조선’, ‘바이오’, ‘전기차’ 등의 키워드가 상위 비중을 차지하는 것으로 나타났는데, 디지털 기술과 에너지 산업의 융합을 통해 산업분야 간에 유기적 연관관계가 촉진되고 있음을 간접적으로 파악할 수 있었다. 이러한 결과를 통해 현재 디지털 주력 분야인 ‘교육’과 ‘금융’, 에너지 주력 분야인 ‘수소’, ‘태양광’, ‘풍력’을 제외하더라도 한국판 뉴딜의 영향으로 다방면에서 사업시행과 기술개발이 이뤄지고 있음을 알 수 있었다.
텍스트 마이닝 기법을 사용해 정부의 정책동향을 파악한 결과 IoT, 빅데이터, 인공지능과 같은 스마트 기술을 다양한 분야에 활용하고자 노력하고 있으며, 탄소중립을 목표로 신재생 에너지 보급을 확대하는 것으로 나타났다. 디지털과 에너지 기술산업의 전세계시장 규모는 지속적으로 확대될 것으로 보이며, 현재 우리나라 시장의 규모도 빠르게 확대되고 있다. 하지만, 세계 수준의 선진기술에 비해 경쟁력이 떨어지기 때문에 정부는 국내 환경에 적합한 분야를 선정하고 중점 기술 개발을 위한 세부적인 추진전략과 정책방향을 설정하는 것이 필요하다. 신재생에너지의 경우 에너지기본계획과 전력수급 계획에 따른 보급목표를 상향하였지만 현실적인 전력공급 문제를 해결할 수 없기 때문에 이를 해결하기 위한 정책과 기술 개발을 적극적으로 추진해야 한다. 그리고 ‘수소’, ‘태양광’, ‘풍력’, ‘금융’ 분야를 활성화시키는 것도 좋은 방향성이나, ‘폐기물’, ‘바이오’, ‘조선’ 등의 분야에서의 에너지 사업과 디지털 전환 정책의 기반을 보다 강화할 필요가 있다. 마지막으로 코로나로 인한 경기침체를 극복하고 포스트 코로나 시대에 대응하기 위해 정부는 중·장기적인 디지털, 에너지 기술산업 육성에 초첨을 맞춰 주력산업의 고부가가치를 창출하는 방안을 마련해야할 것으로 보인다.
Acknowledgements
본 연구는 미래창조과학부의 재원으로 한국연구재단의 연구비 지원을 받아 수행되었습니다(과제번호: 2020R1C1C1008951). 이에 감사드립니다
Notes
Declaration of Competing Interest
The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.