type
status
date
slug
summary
tags
category
icon
password
URL
爱彼迎 (AirBnB) 是颠覆初创企业领域发展最快的公司之一。在 Glassdoor 发布的“2016 年最佳工作场所”报告中,AirBnB 名列前茅,并且随着 组织从产品到 财务到运营的各个方面对数据科学技能的需求不断增加 ,AirBnB 绝对是一个值得考虑的名字数据科学技术领域。 AirBnB 业务增长的秘诀是培养信任。数据科学技术是识别信任驱动因素以吸引更多用户并找出减轻信任的新方法的核心。数据科学技术是 AirBnB 快速增长的关键优势,也是它如何通过匹配合适的人来提供更好的推荐的关键。 AirBnB 数据科学家一直处于开发独特数据产品和修改现有开源技术以完美满足其需求的最前沿。
爱彼迎 (AirBnB) 将在特定城市寻找住宿的人(房客)与愿意出租其房源的人进行匹配。房客可以根据他们喜欢入住的房源与房东联系。只有房东愿意接待房客,爱彼迎上的匹配才会成功。 AirBnB 的预订量已超过 1000 万晚,来自 192 个国家和 34,000 个城市的超过 2500 万人使用了其服务,AirBnB 的收入正在飞速增长,截至 2015 年 6 月估值达到 255 亿美元。
目录
- 数据——爱彼迎业务的命脉
- AirBnB 的数据科学
- 1)A/B测试
- 2)图像识别与分析
- 3)自然语言处理
- 4)预测建模
- 5)回归分析
- 6)协同过滤
- AirBnB 的 Hadoop 工作流系统 – Airflow
- AirBnB 如何利用大数据推动其增长?
数据——爱彼迎业务的命脉
每天创建 20 TB 的数据和 1.4 PB 的存档数据,它已成为 AirBnB 业务的命脉。 AirBnB 每天处理大约 1000 万个请求并处理 100 万个搜索查询。数据是爱彼迎客户的声音,用于通过在房客和房东之间建立完美匹配来提供个性化服务,从而实现卓越的客户体验。爱彼迎 (AirBnB) 利用房客互动、时事和当地市场历史来提供实时推荐,旅客可以接受或拒绝。
数据是客户的声音。数据实际上是社区中某人执行的操作的记录,代表他们对您的产品做什么(或不做什么)的决定。数据科学家可以将这些决策转化为其他人可以理解的故事。 - AirBnB 数据科学团队负责人 Riley Newman 说道
对于像爱彼迎这样完全在线的组织来说,数据分析在为客户提供一流的定制服务方面发挥着至关重要的作用。 AirBnB 使用正确的、可扩展的、灵活的 大数据工具 和数据科学技术来持续发展。 AirBnB 的数据科学团队相信使用数据驱动的见解来影响决策,并确保决策对客户产生预期的影响。
AirBnB 的数据科学
AirBnB 的数据科学有助于确定产品决策的优先顺序,也是这家初创公司实现巨大增长的秘诀。 AirBnB 数据科学家是放大客户声音的扩音器,他们通过客户交互日志预测客户的需求,并对其进行解释,以纳入产品、客户支持和营销团队的可行决策。 AirBnB 使用多种数据科学技术来了解有关其用户的更多信息 -
1)A/B测试
这是一种常见的数据科学方法,用于找出最佳的产品适合度或市场适合度。使用 A/B 测试方法,数据科学团队测试网站或产品的各种设计或配置,以了解用户对其的反应。 AirBnB 的数据科学团队通过向网站用户展示各种推荐和排名算法来使用 A/B 测试。然后,用户的行为与他们留下的实际评分或评论相关联,这有助于他们测试算法的有效性。 AirBnB A/B 测试的主要目标是通过将合适的人员匹配在一起来了解他们是否做得更好。
2)图像识别与分析
照片是爱彼迎与其用户之间的初步联系。客人可能会根据吸引他们眼球的内容来决定是否应该选择特定的房源。 AirBnB 对照片进行分析,以找出哪些照片最适合用户、照片中的哪些功能使他们最受欢迎以及网站上什么样的照片获得更多点击量。 AirBnB 仍处于使用照片分析机器学习技术的初级阶段。在爱彼迎实施这一举措的目的是创建一个反馈循环,帮助网站上的房东为其房源获取一流的照片。该算法预计会自动推荐 AirBnB 免费专业摄影服务,将 AirBnB 上的房东与附近的其他专业摄影师联系起来。
3)自然语言处理
在爱彼迎,房东和房客体验真实生活中的互动,这有时会迫使他们留下更好的评价,即使体验只是令人满意。这些评论错误地描绘了主人和客人的正面形象,并且星级评级通常被夸大。为了解读用户的真实感受,AirBnB 使用自然语言处理技术,通过情感分析来分析评论板或留言板。这有助于爱彼迎了解评论背后的真实感受。
4)预测建模
预测建模技术是 AirBnB 数据科学的一个有趣的方面,用于分析不同市场的表现,从而确定资源的优先级。使用预测模型,AirBnB 可以使用多个变量创建特定于市场的预测。 AirBnB 拥有一支专门的预测和报告团队,以优化现有的预测模型。 AirBnB 的数据挖掘可帮助房东预测最优惠的租金价格。
5)回归分析
爱彼迎使用回归分析技术来找出特定房源的哪些功能对预订有重大影响。回归分析帮助爱彼迎发现,视觉效果的质量在预订中起着至关重要的作用。为了提高视觉质量,他们开始为房东提供免费的专业摄影,结果令人惊叹。这导致 AirBnB 的收入明显增加。
6)协同过滤
AirBnB 数据科学团队使用协作过滤技术来模拟房东的偏好。使用协同过滤,用户(主机)和项目(行程)数据可用于通过相关主机的统计学习结合历史评级来了解对项目的偏好。然而,协同过滤框架本身并不能完全融入主机偏好模型。数据科学家在同一次旅行中使用客主交互的多重响应来减少来自潜在因素的噪音。
AirBnB 的 Hadoop 工作流系统 – Airflow
AirBnB 是Hadoop 技术的大用户 ,因为所有有关房间、房间所有者、房间位置的非结构化信息都是使用开源框架 Hadoop 进行排序和分析的。 Apache Hive 数据仓库使用在 Hadoop 之上,拥有 1.5 PB 的数据。为了定期在 AirBnB 处理更多数量的Hadoop 作业,营销团队和所有其他员工也使用分析工具。
AirBnB 每天大约处理 6000 个Hadoop 任务。仅使用 Hadoop 在维护任务顺序和协调结果方面造成了一些困难,这导致了其自己的 Hadoop 工作流系统(称为 Airflow)的开发。 Airflow 是开源的,已在五家公司使用。 Airflow是数据工程师为数据人员构建的工具,主要专注于编写和监控新的数据管道。
Airflow易于安装并使用Python语言界面,可帮助用户定义新的数据类、命令如何管理这些类以及编写“for循环”或任何其他需要重复的Python语句。
- 作者:AI新闻和思维
- 链接:https://ainio.fun/article/998976b0-db4c-48ed-bfc9-6fe0f11e9ef1
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。