作者:Moloco高级内容营销经理Matthew Kaplan
所有的机器学习(ML)都需要数据来学习,数据越多越好。但是,为了让机器学习模型运行良好,单单数据量充足是不够的,数据质量也要尽可能的高。
训练和持续提供训练机器学习模型的相关一手数据,一直是关键。但是获取用户数据的条件的演变——从监管要求到平台政策再到公众信任,以及用例的改变——从提高品牌知名度到提供可衡量的、可变现的绩效成果,专注于一手数据的移动应用用户获取策略已经从重要变成绝对必要。
数据在移动广告中的作用
长期以来,营销人员一直依赖各种各样的信息,通过不同的渠道更好地了解、触达和吸引他们的受众。一个关键的信息来源是一手数据,关注广告领域的科技媒体 AdExchanger 将其定义为 "由单一实体通过其与终端用户的直接关系收集的数据"。对于应用程序中的任何用户行为——从登录和点击等行为到广告浏览等参与行为,再到订阅和支付等转化行为——用户的每一次互动都会成为该应用程序的一手数据。
在过去,这些一手用户信息通常以第三方数据作为补充,国际营销服务公司 Epsilon 将第三方数据定义为 "从开发者以外的来源所获取的数据"。在移动生态系统中,历来最普遍(和最强大)的第三方数据来源之一,就是移动操作系统在设备层面的广告 ID,即 Android ID(ADID)和 iOS 广告主标识符(IDFA)。
第一方和第三方并不是唯一的数据来源,还有第二方数据。第二方数据,即经用户明确许可后,从合作伙伴那里获得的数据。还有越来越多的人开始讨论零方数据,即用户自愿分享的、独立于用户行为的信息,例如:通过用户调查和问卷、用户设置和表格提交等收集到的信息。通过上述不同的数据来源,广告主可以获得对其受众细致入微的了解,并建立强大的目标市场策略来获取新用户。
数据在机器学习中的作用
在我们深入探讨一手数据的重要性前,让我们先来强调下数据对任何 机器学习模型的整体重要性。无论一个 机器学习算法的用途是什么,高质量的数据都是其运行效果的基础。
正如业界的一句名言所说:"垃圾进,垃圾出。"这点在机器学习中尤其正确。没有高质量的数据输入,任何机器学习模型都不能按预期产出高质量的输出。输入超出范围或被错误标记的数据(“垃圾进”)会导致输出不正确的结果(“垃圾出”)。
数据质量并不是唯一的决定因素,机器学习模型还需要足够多的、无偏差的、多样的且与上下文相关联的数据,但数据质量始终是关键。
例如,如果我们要建立一个识别猫的模型,那么其他常见动物(如:狗和蜥蜴等)图像的数据集对于机器去学习“非猫”的标识符是很有必要的。但是包含史前猫的艺术家渲染图或是 CAT 扫描数据的数据集可能会误导模型,因为它缺乏上下文相关性。
一手数据的重要性与日俱增
过去,移动效果广告主有各种各样的优质数据来源可供选择,包括一手数据和第三方数据。但如今,来自第三方的数据数量和质量都在降低。
随着政策变化(如:欧洲的《通用数据保护条例(GDPR)》和美国的《加州消费者隐私法案(CCPA)》)以及平台级的变化(如:Apple 的“应用程序跟踪透明度 ATT”功能和 Google 的“隐私沙盒”计划),可用于移动端效果营销的优质第三方数据正处于短缺状态。由于许多需求方平台(DSP)严重依赖这些第三方信息来确定他们的受众群体以及定向方法,上述变化对用户获取造成了重大影响。
依靠来自第三方数据运行移动广告还有重要缺点:找到的用户常常是错误或不相关的,特别是在没有任何一手数据支持的情况下,而且还存在法律和信誉风险。
2022 年 8 月,美妆品牌丝芙兰(Sephora)因其电商应用涉嫌违反《加州消费者隐私法案》数据隐私要求,支付120 万美元的罚款,与加州总检察长办公室达成和解。次月,Instagram 因涉嫌违反 GDPR 而被处以4.05 亿欧元的罚款。
即便广告主设法找到了优质的第三方数据并避免了巨额罚款,但他们仍然会发现,将这些数据用于广告用途会激怒其终端用户,破坏与终端用户的关系。在咨询公司毕马威(KPMG)的一项调查中显示,86% 的受访者越来越重视数据隐私,而 40% 的受访者不相信收集数据的公司会在使用他们的数据时遵守道德准则。
Moloco 使用一手数据的方法
Moloco 一直以保障隐私安全为前提,优先使用一手数据来训练我们的机器学习模型。通过使用广告主应用程序独有的一手数据,我们可以缩短训练模型的时间,在 Campaign 启动之前就可以采用一种零成本的方法进行学习,使营销人员在几天或几周内就能看到 ROAS。所有从原本漫长而昂贵的训练期中节省下来的预算,都可以用于扩大 Campaign 规模,并帮助产生更多的变现。
使用应用程序的一手数据对效果营销人员来说有很多好处,例如:它使得 Campaign 随着一次次竞价变得越来越具有相关性,定向也越来越精确。
虽然我们强调一手数据的优势,但一手数据量级往往不大,尤其是在 Campaign 初期。而且,在利用大量上下文相关的数据进行训练且数据来源稳定的情况下,虽然可以避免“垃圾进”的问题,但当新的外部因素(如:新的法规条例或新的数据结构)出现时,还是很容易产生偏差。
与最大的广告平台一样,Moloco 的机器学习引擎由深度神经网络驱动,可以立即、反复、实时地进行优化。我们使用深度学习技术,将营销人员的原始一手数据翻译成系统内类似人工的语言。这使我们能够将有限的一手数据扩充到一个可观的训练数据集(即泛化),从而训练模型以提供强大的性能,实现许多同行由于受数据限制而无法企及的回报率。
此外,我们在 Campaign 启动之前就开始使用您的原始一手数据训练我们的模型。这意味着我们的模型在为您购买任何广告展示之前,就已经获得了能带来预期产出的输入值。这与传统的 DSP 平台形成鲜明对比,他们要等收到足够多的正样本后才能训练他们的模型,可能需要几个月或几个季度才能实现目标 ROAS。
而且,营销人员为了扩大其用户群、鼓励用户行为、再吸引休眠用户而依赖的广告技术正在被隐私法规条例一一推翻。Moloco 提供了一个更好的第三方数据替代方案,且该方案对终端用户来说更容易接受。我们的推理模型对竞价请求进行评估,以确定用户是否有可能达成广告主的营销目标,并计算出在预算范围内的竞价价格。我们并不需要 IDFA 数据来进行这个评估。考虑到 iOS 政策的持续变化,Moloco 已经为 SKAdNetwork(SKAN)流量提供了专门的选项。
如您想了解 Moloco 的机器学习模型为何在行业内是独一无二的,它们如何帮助营销人员获得成功,以及其他相关的更多信息,您可以免费下载我们的《机器学习赋能移动营销白皮书》,了解如何利用建立在深度神经网络上的机器学习 DSP 来提高您的营销效果。
关于作者
Matthew Kaplan拥有十余年的数字营销经验,致力于支持世界上最大的B2B和B2C品牌的内容目标和跨设备的多样化营销活动。同时他有丰富的内容营销写作经验,文章主题涉及IT、技术、能源、医疗保健、交通、B2B企业、食品和烹饪以及政治。
关于Moloco
Moloco致力于为企业提供先进的机器学习算法,助力数字经济更加公平和高效。开发者和线上零售商可通过Moloco机器学习平台盘活一手数据,以了解公司业务表现,促进业绩增长。Moloco Cloud DSP(云营销平台)助力市场营销人员快速扩大获客规模,并通过实践检验的预测模型实现更大的用户生命周期价值。Moloco由前谷歌机器学习工程师团队于2013年创立,总部位于美国硅谷,目前在美国、英国、韩国、中国、日本和新加坡等国家地区设有9个办事处。