개요

카운티 단위에서 물류흐름을 분석한 연구를 수행하면서, 흐름 데이터를 비교하기가 매우 어려웠다. 일치여부를 계측하는 평가 방식으로는 패턴의 유사성이 있음에도 높은 유사성을 표현하기가 어려웠다. 그래서 거리나 인접성을 반영한 평가지표를 생각하게 되었고, 카운티 간의 인접행렬을 찾게 되었다.

예를 들어, 두 모델이 보여준 흐름의 차이가 동일한 출발점을 기준으로 도착점이 n개 이내의 인접한 카운티로 귀결된다면 유사한 결과로 판단할 수 있을 것이다. 이와 같은 작업을 하기 위해서 각 카운티에서 모든 카운티까지의 인접성을 계량하였다.

기본데이터는 US CensusCounty Adjacency File를 이용하였다. 해당 파일은 각 카운티별로 인접한 카운티 리스트를 작성해두었는데, 이 관계를 이용하여 인접트리를 확장하여 인접매트릭스를 만들었다.

생성한 매트릭스는 위 백그라운드 이미지와 같이 대략 3000x3000 사이즈의 행렬이 되며, 이를 지도로 만들어서 손쉽게 확인할 수 있도록 하였다. 미국 인접 카운티 지도d3.js를 이용하여 작성하였으며, FoodS3에서 사용하던 코드를 활용하여 만들었다. FoodS3는 팀 내부적으로만 이용하고 있어서 일반에 공개하기 어려운 부분이 있어서, 공개 데이터를 활용한 이러한 예시를 통해서 공유하고자 한다.

히스토리

  • 2019.09.29. 퇴고
  • 2019.09.20. 최초버전 배포
  • 2019.09.17. 최초버전 작성

관련링크