求偶——这次何不尝试一下大数据分析呢?
00 分钟
2024-2-18
2024-2-18
type
status
date
slug
summary
tags
category
icon
password
URL
如今,每 18 名美国人中就有 1 人使用大数据分析来寻找伴侣。情侣们在网上寻找爱情,如今在线约会已成为一项大生意。在线约会网站结合“数据”和“分析”来帮助人们找到完美的灵魂伴侣。在线爱情成功故事背后的真正英雄是大数据分析技术和基础设施,帮助人们根据自己的偏好和行为匹配找到完美的生活伴侣。大数据约会是 21世纪持久浪漫关系的成功秘诀。本文详细阐述了公司如何利用在线约会数据,通过数据分析技术帮助客户找到长久爱情的秘诀。
notion image
据 Juniper Research 称,通过移动应用程序进行约会的市场预计将从 2011 年的 10 亿美元增长到 2016 年的 23 亿美元。如果您感到困惑并想知道潜在约会是否是一种关系材料,请不要担心,大数据分析将为您提供帮助。当今的关系由数据和技术推动。约会公司正在利用大数据分析以调查问卷的形式从用户收集的信息宝库,为客户提供兼容且更好的匹配。
几个月前,wired.com 上流传着一篇文章,内容是 35 岁的加州大学洛杉矶分校 (UCLA) 博士克里斯·麦金莱 (Chris McKinlay) 如何通过 毕业生设计了一种算法,通过优化使用已有的数据来破解 OkCupid。麦金莱对约会网站使用的兼容匹配算法并不满意,因为这无法帮助他找到品味相似的完美太太,成为他的灵魂伴侣。他设计了一种匹配算法,可以推荐 20,000 名与他的品味和喜好兼容的女性。在与几位符合他匹配度的女性约会后,他终于在第 88约会中找到了他的灵魂伴侣 Tien Wang。大数据技术创新为线上完美匹配奠定了基础。
notion image

网上约会统计

在线约会统计数据表明,在美国 5400 万单身人士中,有近 4000 万用户注册了 Match.com、OkCupid、eHarmony、Hinge 或 Tinder 等热门约会网站之一。在线约会网站的用户每次访问在线约会网站平均花费22分钟,每周用于在线约会活动的时间接近12小时。66% 的人通过这些在线约会网站与网上认识的人约会过。
对在线约会统计数据的分析显示,十分之一的美国人使用约会网站,其中 25% 的人通过这些网站找到了自己的灵魂伴侣。2015 年的凯尔顿研究发现,1/3美国人(接近 8000 万)曾使用在线约会应用程序或网站来寻找灵魂伴侣。大数据分析从未如此有趣,数百万美国单身人士倾尽心力(和手机电池)寻找真爱。
根据IBIS world 2014年的市场研究,美国在线约会行业价值20亿美元,自2008年以来以3.5%的速度增长,加拿大在线约会行业价值1.53亿美元。Juniper Research估计,由于手机应用程序的过度使用,在线约会市场将从2011年的10亿美元增长到2016年的23亿美元。随着在线约会行业的激烈竞争,各公司正在尽一切努力维持通过在完美的时间将完美的伴侣与完美的人相匹配来建立信誉。
notion image

在线约会中的大数据分析

Match.com 现已成立 20 周年,已帮助建立了 517,000 段关系、92,000 段婚姻和 100 万个婴儿。Match.com 声称其拥有超过 70 TB 的客户数据,可帮助他们解开内心的谜团。据 eHarmony 统计,美国每天有 542 名 eHarmony 用户结婚。
notion image
OkCupid(2011 年被 Match.com 以 5000 万美元收购)、Match.com 和 eHarmony 完美匹配背后的秘密在于幕后的大数据分析技术。

在线约会算法如何运作?

Match.com、eHarmony 和 OkCupid 等在线约会巨头从 Facebook 个人资料、在线购物页面收集在线约会数据进行大数据分析,以确定一个人的好恶,因为来自这些网站的数据更有助于预测人类行为行动而不是用户在调查问卷中填写的内容。
麦肯锡的一份报告指出,“公司必须能够对他们掌握的大量结构化和非结构化数据应用高级分析,以获得 360 度的客户视图。他们的参与策略应该基于对客户近期行为和过去与公司的经历以及客户移动或社交媒体数据中嵌入的信号的实证分析。”
Match.com 向用户提供包含 15 到 100 个问题的调查问卷,然后根据系统中预定义的参数(例如宗教、收入、教育程度、头发颜色、年龄等)为用户分配积分。然后匹配具有相似观点的人。Match.com 使用先进的大数据分析来找出人们在网站上的实际行为和他们实际承认的内容之间的任何差异。如果发现任何差异,匹配算法会根据此行为调整兼容的匹配结果。
Match.com 总裁 Amarnath Thombre 表示:“人们都有自己想要的清单,但如果你看看他们正在与谁交谈,就会发现他们违反了自己的规则。他们可能将“金钱”列为合作伙伴的重要品质,但随后我们看到他们向所有艺术家和吉他手发送消息。”
Match.com 不会冒任何风险来确定在线约会数据的准确性以进行大数据分析。Match.com 已开始使用面部识别技术,帮助他们找出用户喜欢的匹配“类别”并突出显示特征更能吸引用户。
Match.com 的大数据专业人士表示,即使人们对身高、体重、发色或种族不是那么具体,他们也肯定有自己想要的伴侣的某种面部形状。Match.com 的目标是找到一个合适的伴侣。通过面部特征分析来确定人的类型,以便将其与适合其类型的人进行配对。这些专属服务的费用为 5000 美元,为期 6 个月;然而,Match.com 愿意付出代价,因为这让他们在竞争激烈的世界中获得了更大的优势。
超过 565,000 对夫妇因 eHarmony 成功结婚,每天有 438 人在美国说“我愿意”,这要归功于 IBM 大数据和分析产品 IBM Pure Data System for  Hadoop ,它准确、快速地呈现个性化匹配。在线约会网站 eHarmony 表示,该网站每天为其 5400 万用户群生成约 1300 万个匹配项,总共有超过 125 TB 的数据可供分析,并且该数据每天都在增加。
eHarmony 要求用户在注册时填写一份包含 400 个问题的调查问卷,这有助于他们根据身体特征、基于位置的偏好、爱好、热情等收集在线约会数据。eHarmony 的数据集大于 4 TB 数据(不包括照片)。最棒的是,eHarmony 的匹配算法使用其收集的所有在线约会数据来为其用户找到完美匹配。“400个问题”调查问卷还没有结束。它收集用户在网站上的行为数据,例如他们上传到数据库的图片数量、登录次数、经常访问的个人资料类型等。收集的数据通过专门的分析算法进行排序,以帮助用户找到一个完美的匹配。
eHarmony 副总裁 Jason Chunk 表示:“从数据中,你可以看出谁更内向,谁可能是发起者,我们还可以看到,如果我们在一天中的某些时间给人们进行匹配,他们会更有可能与他们的对手进行沟通。从那里开始就像滚雪球一样。除此之外,我们还使用了许多工具。”
eHarmony 使用 MongoDB 来简化情侣的配对过程。eHarmony 的大数据和机器学习流程使用流算法,每天处理十亿个潜在匹配。eHarmony的兼容性匹配系统最初是基于RDBMS构建的,但匹配算法的执行时间超过2周。eHarmony成功地将兼容性匹配系统算法的执行时间减少了95%(不到12小时)通过切换到 MongoDB。
显然,大数据在在线约会革命中发挥着至关重要的作用。约会公司正在利用大数据应用的力量   成为完美主义者,帮助人们在网上找到真爱。随着约会网站继续通过不同来源收集大量在线约会数据,并完善其配对算法以利用大数据的力量,我们很快就会见证约会网站比我们更了解我们的灵魂伴侣是谁的那一天。

评论