近日,一篇名为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章在社交网络引发刷屏。该篇文章将矛头指向在线旅行服务平台马蜂窝,称其平台上“2100万"真实点评"里面有1800万条,是通过机器人,从点评和携程等竞争对手那里抄袭过来的”,该文表示,“发现了7454个抄袭账号,合计抄袭572万条餐饮点评,1221万条酒店点评,占到他们官网声称总点评数的85%。”
对此,马蜂窝方面回应称,经过对全站游记、攻略、嗡嗡(旅行故事)、问答、点评等数据和涉嫌虚假的信息进行核查,在平台UGC内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%,而点评的内容仅占2.91%,“涉嫌虚假点评的账号数量在整体用户中的占比更微乎其微,马蜂窝已对这部分账号进行清理。自媒体文章所述的马蜂窝用户数量,与事实和第三方机构数据都严重不符。”马蜂窝方面表示,将正视运营过程中存在的审查漏洞并采取积极改进措施,针对该文中歪曲事实的言论,和已被查证的有组织攻击行为,马蜂窝将采取法律手段维护自身权益。
多位分析人士指出,对于UGC(用户生产内容)平台而言,为了在短期内拓宽内容丰富度吸引用户留存、获得资本关注,内容数据造假早已屡见不鲜,反映出行业竞争激烈和资本浮躁的现状,但对于在线旅游平台而言,内容越真实可信,才越有利于用户留存。
餐饮、酒店点评被爆抄袭,占比85%
公开信息显示,自2006年上线运营的马蜂窝旅游网是中国领先的自由行服务平台,积累了大量游记、攻略、问答及点评,大部分用户来自北京、上海、广州、深圳、香港等一线大城市,也不乏海外旅居人士;平台旅游消费指南覆盖全球200多个国家和地区、1亿位旅行者、92万家国际酒店、2100万条真实点评,曾于2017年12月获得启明创投、高瓴资本等投资方1.33亿美元D轮融资。今年夏天,马蜂窝曾在世界杯期间进行过一轮“洗脑式”的品牌营销,受到广泛关注。
10月20日,一自媒体账号发布《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》提到,偶然中发现马蜂窝的数据异常,其“点评增长趋势非常诡异,点评的数量,在特定时间节点指数级上升,随后断崖式回落”。
该文章进一步说明称,依据乎睿数据团队的报告和抓取大众点评、艺龙、携程等竞品网站内容,以“一字不差的抄袭才算抄袭”的抄袭标准和以“抄袭150个不同的大众点评账户”为抄袭账号标准进行对比,“发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到他们官网声称总点评数的85%。”
一些账号发布的评论内容自相矛盾
餐饮点评热力对比图存在异常
南都记者梳理发现,该数据团队对于马蜂窝平台内容造假的论断,主要集中在几方面:
一是一些账号发布的评论内容自相矛盾、“忽男忽女,忽南忽北”;
二是“账号很多都有官方背书”;
三是“官方账号抄袭Yelp点评(美国最大点评网站)时疑似调用了谷歌翻译接口,并将翻译错误一并抄了下来”,或是“不慎把不该抓取的内容抓了进来”;
四是所谓的“抄袭账号”“活跃在各种官方的抽奖之中,并且屡次成为各种自由航行特等奖等大奖的"幸运得主",且抽奖名额疑似“内定”;
五是马蜂窝的游记,部分频繁使用机器语录、或带有营销/洗稿痕迹;
六是对比大众点评、携程等平台制作的点评热力图,反映出马蜂窝餐饮、酒店点评用户活跃度,与用户用餐高峰期时间不一致,存在活跃异常问题,等等。
而南都记者10月21日以上述截图中部分酒店名入口搜索评论时,发现上述评论已难觅踪迹,以“全季酒店(上海松江体育中心店)”点评为例,其评论区最晚一条点评发布时间为2016年12月12日,而自媒体文章截图(如图所示)中引用的是同年12月14日的评论,目前已不存在;此外,截图中点评者的主页,目前则显示点评数为0。按照乎睿数据团队后来的说法,此前文中所提及的账号,是被相关人员从搜索栏屏蔽了。
社交网络中也有声音对乎睿数据提供的材料产生质疑,如7000多个有抄袭嫌疑的账号,搬运的却是餐饮类内容点评,其在制作的爆文中并未提出合理解释。马蜂窝对南都记者回应表示,“餐饮点评不是马蜂窝的内容核心,且部分点评来自于游记、问答等内容的提取,自媒体将马蜂窝用户内容生产活跃周期,与餐饮等本地生活服务类APP相对比,并解读为马蜂窝员工有组织地抄袭,存在明显的误导倾向。”
“内容+交易”获客模式暴露审核与风控漏洞
作为一家以旅游攻略和内容社区差异化切入OTA(在线旅游)市场的旅游网站,UGC(用户生产内容)是其核心的运营模式。对于马蜂窝的“核心玩法”,马蜂窝旅游网联合创始人、CEO陈罡曾公开表示,马蜂窝作为一个旅游社区,汇聚了各种照片、游记、点评、问答,平台根据每个人的一套用户画像系统,对用户展示千人千面的攻略和信息流,从而让商户找到更精准的订单和更精准的客户。
艾瑞咨询在此前发布的《2018年中国在线旅游度假行业研究报告》中具体介绍称,在自由行模式爆炸式发展背景下,用户对于信息的需求随着旅游产品碎片化而愈加复杂,“UGC+大数据+自由行服务平台”是马蜂窝三大核心优势,最大的特征即“内容+交易”,与传统在线旅游平台(OTA)不同,马蜂窝更擅长从出行前后全流程和交通、住宿、当地体验等维度辅助用户做决策,从用户角度按需匹配个性化产品(即“内容获客”模式),高效匹配供需,为合作商家带来精准的订单,提高转化率和利润率,解决旅行信息不对称的痛点。用陈罡的话说,“当拥有了千百万旅行者的分享,就有了数据挖掘的基础,有了帮助更多旅行者的能力。”
然而,由于需处理涌入的大量信息流,这种借用UGC模式运营平台的方式也存在一定的局限。南都记者从部分业内人士处了解到,为了保证用户上传的游记、攻略等内容的质量,需要审核团队的严格把关,但审核人员对于信息判别的及时和有效性一旦跟不上,审核的内容极容易出现偏差,以致用户浏览时会遇到实际地点与导览信息不匹配等等问题,造成用户流失。此外,平台也存在过度依赖内容创造者引流等问题。
“马蜂窝主打的就是UGC内容,用户主要用它看游记攻略、点评,这也是其主打的卖点和亮点,如今成为了槽点,所以容易受到重大关注。”DCCI互联网研究院院长刘兴亮告诉南都记者,不仅是旅游在线平台,“凡是点评类都存在类似问题”。
今年7月份,小红书和大众点评同样产生过类似的纠纷。南都记者了解到,彼时,小红书在官方微博发声:“大众点评疑冒用小红书用户名称账号,批量建立虚假账号,抄袭及搬运用户在小红书发布的原创笔记”,大众点评回应称,原因在于平台新上线试运营的推荐栏目在未经授权的情况下对进行了违规转载,属于对新业务的合规管理疏漏。
内容数据造假多为做大规模迎合资本
"水军"和"爬虫"一直都存在于互联网行业,因为需要流量和各种点评数据信息。如果连这些基本的数据都达不到,投资人和上下游商家就不愿谈合作。从某种意义而言,"水军"和"爬虫"或许是互联网行业的"原罪"。”华美首席知识专家赵焕焱分析。
但互联网观察家、科技先生创始人柳华芳认为,内容数据造假自互联网诞生之日起就已存在,容易导致三方面问题:一是对被抓取方不公平,二是误导消费者,三是以虚假繁荣替代真实繁荣,说明了行业竞争激烈和资本浮躁。
南都记者梳理发现,马蜂窝在2016年前就曾被指出游记抄袭的问题,此外,近几年,部分包括OTA在内的各类互联网平台,为了获得预订和流量优势,雇佣“水军”“刷好评”、制造“虚假评论”、搬运评论内容等事件曾屡屡遭到曝光。一位曾经的UGC平台作者坦言,“UGC平台的生态基本大同小异,多产用户对平台绝对重要”,“平台能够拿出多少用户、多少内容篇数、多少热度,将直接关系到平台的融资估值。”
另据一位几年前曾经在马蜂窝实习的知情人士透露,“那个时候,主管会给我们一些从其他平台抓取来的评论,让我们重新组织改成自己的语言发在马蜂窝上。”值得注意的是,马蜂窝在此次声明中也对类似问题予以了回应,“涉嫌虚假点评的账号数量在整体用户中的占比更微乎其微,马蜂窝已对这部分账号进行清理。”
“UGC平台以在早期发展阶段,完全靠自己的用户生成真实评论,发展的速度和效率会很低,所以一些平台通过技术手段抓取、进行信息优化,以增加自己内容的丰富度、提高用户体验,或多或少都难以避免。”劲旅咨询CEO 魏长仁在接受南都记者采访时强调,马蜂窝在发展的早期阶段盈利模式是广告,但广告模式发展到一定阶段会产生瓶颈:如影响用户体验、广告主数量、投放额度增速放缓等,所以尝试切入在线预订等电商模式,才能形成交易闭环,拓宽平台的规模空间更大、引发资本关注,最终实现产品销售。
刘兴亮进一步指出,马蜂窝从一个旅游社区,近年来转变为一家集数据处理及交易服务于一体的在线旅游公司,尝试“内容+交易”的商业闭环,依靠这种商业模式成功完成了多轮融资,“如果乎睿数据团队的指控被坐实,马蜂窝一直以来强调的用户PGC神话将被打破,用简单粗暴缩水计算法,这只旅游独角兽估值将降到二三十亿。”值得一提的是,8月份曾有外媒曝出马蜂窝有望获得新一轮3亿美元融资的消息,对此,马蜂窝方面则对南都记者回应称“不知情”。
不过,在魏长仁看来,对于在线旅游平台而言,资本更看重的是电商转换能力和销售收入,就目前而言,马蜂窝已经不处在初创阶段,不需要通过点评数据来吸引融资。他告诉南都记者,在现阶段的国内旅游市场,尽管跟团游市场存量不小,但自由行增速更大,而马蜂窝的受众便是以自由行用户为主,相对其他OTA平台而言,用户群更为年轻、分享的积极性更高、平台内容积淀更为丰富,这都是马蜂窝作为一个信息聚合平台的优势所在;但依靠内容获客的周期也相对较长,因此更关键在于以内容(游记、攻略等)为入口提高用户留存和转化率,“内容越真实可信、可预订产品丰富度更高,越有利于用户留存。”
采写:南都记者 傅晓羚
作者:回应称“不知情”。