데이터 인사이트 스터디 내용을 관리하는 블로그 입니다.

Data Insight Study Blog

  • Join Us on Facebook!
  • Follow Us on Twitter!
  • LinkedIn
  • Subcribe to Our RSS Feed

3. Examining and Visualizing Data > Visualizing the Data > Neighborhood Trends

지역 추이

주행 거리가 고정되어 있지만, 운행에 소요되는 시간은 대부분 교통량이 얼마인지에 대한 함수값이기 때문에, 우리는 다음과 같은 plot 챠트를 그릴 수 있습니다. 그리고 minutes_per_mile 열은, 우리에게 대부분의 트래픽이 어떤 지역 사이에서 발생하는 지에 대한 정보를 알려줍니다.  .

ggplot(res, aes(pickup_nb, dropoff_nb)) + 
  geom_tile(aes(fill = minutes_per_mile), colour = "white") + 
  theme(axis.text.x = element_text(angle = 60, hjust = 1)) + 
  scale_fill_gradient(low = "white", high = "steelblue") + 
  coord_fixed(ratio = .9)

Neighborhoods traffic tile plot

우리가 고려해야 할 또 다른 흥미로운 질문은, 운행 지역에 따라 승객이 지불하는 요금과 팁 금액 사이에 어떠한 관계가 있는지 입니다. 우리는 위와 유사한 또 다른 plot 챠트를 작성하여, 요금을 금액에 따라 짙은 색깔로 표시하고, 운행당 평균 지불된 팁의 금액을 표시합니다. 팁 지불에 대한 패턴을 시각적으로 쉽게 볼 수 있도록, 12 % 이상, 12 % 미만, 10 % 미만, 8 % 미만 및 5 % 미만을 기준으로 평균 팁 금액을 각각 다른색으로 표시합니다.

res %>%
  mutate(tip_color = cut(tip_percent, c(0, 5, 8, 10, 12, 100))) %>%
  ggplot(aes(pickup_nb, dropoff_nb)) + 
  geom_tile(aes(fill = tip_color)) + 
  theme(axis.text.x = element_text(angle = 60, hjust = 1)) + 
  coord_fixed(ratio = .9)

Tipping behavior by neighborhood

몇 가지 흥미로운 결과가 눈에 보입니다.

  • 배터리 파크 (Battery Park) 또는 금융 지역(Financial District)에서 미드 타운(midtown) 또는 업타운 지역(uptown)으로 이동하는 운행은 통상보다 약간 더 많은 비용이 드는 것으로 보이며, 그리니치 빌리지(Greenwich Village)에서 차이나 타운(Chinatown)으로의 운행도 유사해 보입니다.
  • 차이나 타운(Chinatown)을 오가는 운행은 항상 팁이 적으며(10 % 이하), 특히 미드 타운(midtown)과 업타운(uptown) 지역에서 탑승할 경우 특히 낮습니다.
  • 가장 팁이 관대한 사람들은(약 12 %)는 도심(downtown)과 그 주변 지역(차이나 타운 제외)을 이동하는 사람들입니다. 그 다음으로 가장 관대한 자람들은(약 11 %)는 미드 타운(midtown) 지역과 도심(downtown) 지역 사이를 방향과 관계 없이 이동하는 사람들입니다. 팁을 가장 주지 않은 사람들은 업타운(uptown) 지역을 이동하는 사람들 입니다.
답글 기능이 비활성화되어 있습니다