본문 바로가기

카테고리 없음

[ANALYSIS] 코로나 전후의 여행 트랜드 분석 - 4

STEP 07. 다양한 방법으로 데이터 분석하기

 

이전까지 여러 방법으로 데이터를 가져와 분석하는 방법을 사용했었는데요, 이번에는 조금 다른 방법으로 데이터 분석을 하고자 합니다.

 

첫 번째는 바로 표본을 선정해서 분석하는 방법입니다.

이번 프로젝트의 궁극적인 목적인 [포스트 코로나 이후 국내 관광 산업의 활성화 방안]이라는 점을 고려해, 국내관광과 관련해 데이터를 수집할 수 있는 모집단을 임의로 선정해보았습니다. 

 

네이버 카페에 가보시면 주제별로, 그리고 그 주제 안에서 맴버 별 랭킹을 기준으로 정렬시킬 수 있습니다. 이렇게 정렬한 카페들 중에서 상위 카페들을 대상으로 하나의 키워드로 같은 기간 크롤링을 실시하였습니다.

 

표본으로 선정한 카페들 안에서 여행지추천으로 검색한 게시물 수

위에서 언급한 주제별 상위 카페 중에서 특정 지역 커뮤니티와 해외 여행 관련 카페를 제외하고 게시물 수를 긁어온 결과물입니다. 2017년이 제일 많고, 그 외엔 비슷한 수준을 유지하다가 2020년에 들어 절반 이하로 감소했음을 확인할 수 있습니다.

 

코로나 여파로 인해 여행 자체에 대한 관심이 줄어든 결과로 보입니다.

 

네이버 카페 전체를 대상으로 크롤링한 연도별 게시물 수

 

위의 그래프들은 전체적인 트랜드를 파악하기 위해 각기 '국내여행'과 '여행지추천'으로 네이버 카페 게시물 검색에서 검색한 결과입니다.

 

여행지를 추천하는 게시물 자체는 대폭 줄어든 반면, 국내여행에 대한 게시물 자체의 수는 크게 늘어났습니다. 이는 샘플 카페에서 추출한 내용과는 다소 상반되는 내용인데요, 세부 데이터를 분석한 결과 전국적인 카페에서의 게시물이 아닌 지역구 단위로 집중된 커뮤니티를 중심으로 게시물의 증가가 눈에 띄게 발생했다는 점을 확인할 수 있었습니다.

 

즉, 과거보다 더 좁은 거리, 더 작은 커뮤니티를 지향하게 되는 경향이 관측되었습니다.

 

STEP 08. 데이터 마이닝

지금까지 데이터를 수집하고 시각화하는 것을 반복하며 보다 정확한 키워드와 표본 등을 선출하는 작업을 마쳤습니다.

 

이를 통해 알게 된 것은 코로나 이후 사람들은 여행에 대해 기피하는 경향이 발생함과 동시에 해외여행으로 억눌린 여행 욕구를 국내여행을 통해 해결하려는 노력이 보인다는 것. 그리고 그 결과로 발생하는 여행의 권역이 과거보다 더 좁아졌다는 것을 어느정도 알 수 있었는데요.

 

지금부터는 '국내여행'이라는 키워드로 2018, 2019, 2020 세 개 연도의 2월에서 9월 동안 수집한 데이터를 통해 국내여행에 대한 인식과 트랜드 변화를 살펴보고, 같은 기간 '여행 후기'라는 키워드로 검색한 결과를 통해 실제 사람들은 어느 곳을 방문해서 후기를 남기는지를 통해 GIS를 통해 지도에 시각화를 해보는 작업을 해보겠습니다. 

 

그리고 마지막으로는 이러한 데이터를 통해 관측되지 않았거나, 기존 데이터에 함몰되어 아직은 나타나지 않았으나 미래에 등장할 경향에 대해서도 짚고 마쳐보도록 하겠습니다.

 

위에서 말한 크롤링 데이터입니다.

 

 

domestic은 국내여행을, review는 여행후기를 연도별로 2월부터 9월까지를 크롤링한 값입니다. 해당 작업에서는 월당 최대 천 개까지의 크롤링을 수행하였고, 이후 엑셀 내부의 중복성 검사를 통해 중복으로 올라온 게시물들을 제거해주었습니다.

 

먼저 '국내여행' 키워드 크롤링 결과를 분석해보겠습니다.

 

2018년 2월부터 9월까지 '국내여행'으로 크롤링한 결과입니다.

 

상단에는 월별 게시물 수와 그 우측에는 가장 많이 반복된 단어,

하단에는 좌측에 지역 관련 키워드와 여행 테마 키워드를 워드 클라우드를 통해 시각화하였습니다.

 

 

 

2019년 데이터입니다.

 

여전히 7월이 제일 많지만 오히려 6월보다 8월이 게시물 수가 더 많은 점이 눈에 뜨이는데,  이는 역대급 더위를 자랑했던 2018년의 경우 빠른 휴가와 더 많은 이들이 피서 일정을 알아본 결과로 생각됩니다. 반면 2019년의 경우 여름이 그리 덥지 않았고, 9월 초에 추석 연휴가 있어 6월보다는 8월에 좀 더 집중된 모습입니다.

 

이를 시각화하면 다음과 같습니다.

 

 

지역 키워드 검색애서는 선호도의 순위 변동은 미미했지만, 새로이 등장하는 지역명이 생기기 시작했습니다. 또한 여행  테마 키워드에서는 캠핑과 주말이라는 키워드가 대두되었고 동시에 유튜브와 관련된 키워드가 생겨나기 시작하는 걸 관측할 수 있었습니다.

 

 

2020년 데이터입니다.

 

부산, 해외, 제주에 집중되어 있던 지역 키워드가 강릉, 강원도, 여수, 경주, 지역 카페로 분산된 것을 확인할 수 있습니다. 또한 테마 관련된 키워드에서는 아기, 가족과 같은 키워드가 대폭 줄어들며 가족 단위의 여행이 기피되고 있으나, 직장인들의 스트레스 등으로 인한 '휴가' 키워드는 늘어나는 것으로 볼 수 있습니다.

 

2019년 데이터와 비교하면 위와 같습니다.

 

아무래도 여행 자체에 대한 기피 현상이 존재하는만큼 대부분의 여행 테마 키워드 출현 빈도가 대폭 줄어든 모습입니다. 또한 휴가와 함게 'ㅜㅜ'나 'ㅠㅠ'와 같은 테마가 함께 비교적 높은 빈도수로 등장하고, 장소 키워드의 경우 '해외'가 처음으로 1위가 아닌 2위로 낮아졌습니다. 1위 자리를 차지한 것은 '여름'입니다.

 

이러한 데이터와 연관지어 생각해볼 수 있는 것은 좌측의 자료입니다.

 

한국공항공사에서 발표한 자료에 의하면 2020년 1월부터 9월까지의 국제 여객 운송인원은 다른 해의 10%  수준에 그치고 있습니다. 

 

비록 2020년 통계가 9월까지밖에 포함되지 않았다는 것을 감안해도 무척이나 낮은 수치입니다.

 

즉, 이러한 점을 종합적으로 고려해보았을 때 다음과 같은 추론이 가능하게 됩니다.

 

 

 

추론 1. 사람들은 코로나로 인해 스트레스 받고 있다.

추론 2. 피치못하게 해외여행을 하지 못하게 되어 근거리 여행 및 국내여행에 대한 관심이 높아지고 있으나, 장거리 여행 및 해외여행에 대한 욕구가 해소된 것은 아니다.

근거 2-1. 비록 해외여행이라는 여행 장소 키워드가 1위 자리를 내주긴 했지만, 대부분의 글이 기존처럼 해외여행에 대한 후기가 아닌 관심과 욕구를 표현하는 글이라는 점을 고려한다면 실제 여행 대비 관심도는 여전히 꽤나 높은 수준으로 유지되고 있음을 확인 가능하다.

 

소결론 1.

현재의 근거리 여행 및 국내여행만으로는 충족되지 않는 무언가가 있다.

 

이러한 소결론을 보조하기 위해 한국문화관광연구원이 2019년 11월에 발행한 '국민의 해외여행 동향 분석' 보고서를 참조하면 다음과 같습니다.

 

매년도 해외여행은 평균 10% 대의 높은 상승율을 보이고 있었으며, 전체인구 중 해외여행 경험 인구는 1/4 수준에 20대와 30대가 절반을 넘는 비중을 차지하는 경향을 보이고 있습니다.

 

심지어 해외여행을 처음으로 경험하는 나이대도 점점 낮아져 10대와 20대의 비중이 점차 늘어나는 현상이 관측되고 있습니다.

 

 

 

 

 

 

또한 좌측의 연령별 여행 경험 분석을 참고했을 때,  이색적인 음식과 광경, 문화 생활이  해외여행을 가는 주이유가 되는 것을 관측할 수 있습니다.

 

이러한 것들은 해외여행이 극히 제한되는 현재 상황에서 기존의 국내여행만으로는 해결되지 않는 부분이기에  현실적으로 코로나가 완전히 해결되기 전에는 이러한 부분을 지역적으로 받아들여 개선하는 방식으로 해결방향이 잡혀야 할 것으로 보입니다.

 

또한 추가적으로 코로나가 해소된 이후 잠재되어 있던 해외여행에 대한 욕구가 폭발하듯 현실화되었을 때의 상황도 대비해야 할 것으로 보입니다.

 

 

 

도출해낸 해결방향 : 1. 코로나가 해결되기 전에는 국내여행 경험을 보다 이색적인 방향으로 개선해야 한다. 적어도 동 단위에서 읍면리 단위의 관광지 고유의 특색 문화를 개선함으로써 이색적인 경험이 가능하도록 해야 한다.2. 코로나가 해결된 이후에는 기존에 잠재됐던 수요가 폭증할 것으로 예상되며, 이에 따른 대비가 필요하다.