西雅图AirBnB数据分析的开源案例


深入分析美国华盛顿州西雅图的 AirBnB 活动:AirBnB 是旅游业和酒店业的一场革命。人们将自己的财产或备用房间出租给游客的概念促进了可持续旅行。鉴于 AirBnB 是一家数据驱动型公司,这为我们提供了一个独特的机会来利用数据并探索世界各地的旅游趋势。作为 Inside AirBnB 计划的一部分,AirBnB 发布了捕捉美国西雅图的 AirBnB 活动的数据。
在这篇文章中,我试图深入探讨同样的问题,并抢先了解西雅图的 AirBnB 趋势。
 
数据概览
AirBnB 发布的数据收集了 2016 年的数据,描述了美国华盛顿州西雅图的寄宿家庭的挂牌活动。西雅图数据集中包含以下 Airbnb 活动:

  • — 房源,包括房源的完整描述和平均评论分数
  • — 评论,包括每个评论者的唯一 ID 和每个房源的详细评论
  • — 日历,包括房源 ID 以及价格和哪天可用

 
数据分析
在分析开始时,我定义了三个业务问题来帮助我理解西雅图数据集:
  • Q1:一年中访问西雅图最繁忙的时间是什么时候?价格飙升了多少?
  • Q2:哪些街区最受欢迎?可以使用可用数据来描述这些社区吗?
  • Q3:我们可以使用listing details来预测listing价格吗?如果是,哪些信息是最重要的预测指标?

 
该项目需要安装 Python 3.x 和以下 Python 库:
详细代码点击标题:
  • NumPy
  • Pandas
  • matplotlib
  • scikit-learn
  • RegEx
  • NLTK
  • Seaborn
  • Statsmodels